生物信息中级
测序数据质控与结果汇总流程
面向 FASTQ 测序数据,完成原始数据整理、质量检查、过滤、比对前准备和 MultiQC 报告汇总。
预计耗时:2-6 小时 5 个步骤
操作步骤
1
整理测序文件
文件管理按样本编号整理 FASTQ 文件、样本信息表和测序批次信息。
样本名必须和 metadata 保持一致。
2
运行质量检查
FastQC检查碱基质量、接头污染、GC 含量、重复序列和 reads 长度分布。
不要只看是否通过,要理解每个警告的含义。
3
过滤低质量序列
Cutadapt / fastp去除接头、低质量 reads 和过短序列,生成清理后的数据。
过滤参数要记录在方法部分。
4
汇总质控报告
MultiQC将多个样本的 FastQC 和过滤结果汇总为统一报告。
MultiQC 报告适合快速发现异常样本。
5
准备后续分析
生物信息流程根据研究目标进入比对、定量、变异检测或微生物组分析。
质控结果不合格时不要急着进入下游分析。
流程完成
