仪器社区

高通量测序基因组拼接技术指标中的Contig N50和Scaffold N50是什么意思?

秀波男神hi 2013-09-27
评论
全部评论
敏姐是个好人0
Contig N50:Reads拼接后会获得一些不同长度的Contigs。将所有的Contig长度相加,能获得一个Contig总长度。然后将所有的Contigs按照从长到短进行排序,如获得Contig 1,Contig 2,contig 3...………Contig 25。将Contig按照这个顺序依次相加,当相加的长度达到Contig总长度的一半时,Z后一个加上的Contig长度即为Contig N50。举例:Contig 1+Contig 2+ Contig 3 +Contig 4=Contig总长度*1/2时,Contig 4的长度即为Contig N50。ContigN50可以作为基因组拼接的结果好坏的一个判断标准。
Scaffold N50:Scaffold N50与Contig N50的定义类似。Contigs拼接组装获得一些不同长度的Scaffolds。将所有的Scaffold长度相加,能获得一个Scaffold总长度。然后将所有的Scaffolds
按照从长到短进行排序,如获得Scaffold 1,Scaffold 2,Scaffold 3...………Scaffold 25。将Scaffold按照这个顺序依次相加,当相加的长度达到Scaffold总长度的一半时,Z后一个加上
的Scaffold长度即为Scaffold N50。举例:Scaffold 1+Scaffold 2+ Scaffold3 +Scaffold 4 +Scaffold 5=Scaffold总长度*1/2时,Scaffold 5的长度即为Scaffold N50。Scaffold N50可以作为基因组拼接
的结果好坏的一个判断标准。
参考:http://wenku.baidu.com/view/e40659fe9e3143323968937a.html
8 0 2013-10-09 0条评论 回复
晧瀚
对一条染色体进行测序,将测序得到的reads进行拼接,能够完全拼接起来,中间没有gap的序列称为contig。 如果中间有gap,但是gap的 长度我们知道,这样的序列就叫做scaffold。

将测序得到的所有contig和scaffold从大到小进行排列,当其长度达到染色体长度的一半时,这一条contig和scaffold的长度就叫做Contig N50和Scaffold N50。这两个数值主要用来评估序列组装的质量的,值越大,组装效果越好,测序效率也就越好了。
14 0 2013-09-28 0条评论 回复
您可能感兴趣的社区主题
加载中...
发布 评论