本篇文章给大家谈谈质控软件编程教程下载,以及质控技术对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。
本文目录一览:
基因组Survey(二代测序数据质控)
Illumina 测序碱基质量值的范围是[0,40],即ASCII值表示为[B,h] 戒 [#,I]。Illumina 测序错误率不测序质量值简明对应关系。
Survey一般测序量为预估基因组大小的30-50X(二代测序)。
contig是基因组组装过程中得到的一系列相邻的 DNA 片段。 kmer是基因组序列中的长度为 k 的不重复 “单词”,用于基因组组装的信息单元。
质量控制的测序质量检测是通过FastQC软件实现。fastqc可以不设置任何参数运行,这样会直接在当前目录下生成一个质量报告的压缩文件和文件夹,报告是网页格式。也可以设置输出目录和是否解压缩(--noextract),默认设置会解压缩。
二代测序作为一种检测手段,主要应用于基因的生殖变异(遗传性)与体细胞变异(获得性)的检测。
质控规则
质控规则是解释质控数据和作出质控状态判断的决策标准。
最初的Westgard多规则通常有六个质控规则,即R、10质控规则,其中1规则只是在手工作业时作为警告规则,启动其它质控规则以助于数据的快速判断。
室内质控通常有六个质控规则,即12s,13s,22s,R4s,41s,10X质控规则,启动信号:12s规则作为警告规则,启动其他质控规则以助于数据的快速判断。在控:只有当所有质控规则均判断分析批在控时。
使用fastp进行数据质控
fastp是一款数据质控过滤软件,作者是陈实富,来自深圳海普洛斯公司。该软件可以实现fastqc-Trimmomatic-fastqc一条龙,操作简单,快速。不仅适用于illumina测序平台,还支持Pacbio和Ion torrent的测序数据。
常规的质控和过滤数据是 fastqc+trimmomatic ,据说fastp更快,而且一次完成质控过滤和出图。fastp的github fastp的出版地址 本地路径 /home/chaim/disk/soft/fastp/fastp 添加环境变量 之后即可全局调用fastp。
fastp是一款非常棒的数据质控的软件,可以过滤低质量的reads,去除adapter ,数据截取,生成质控报告等等,由于其是C语言撰写的,速度非常快。
可以,ffastp要一次输入多个双端组,不必用第一个输入的数来做控制。
质控软件编程教程下载的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于质控技术、质控软件编程教程下载的信息别忘了在本站进行查找喔。