在基因测序文献中出现的reads单词是指什么?经常会说这个序列有几个reads,那个序列有多少reads,就是不知道啥意思,无论他的中文翻译是什么,麻烦给出详细的定义,谢谢~!
read 是测序仪完成一次反应时产生的数据形式,能反映片段的序列信息和序列长度。
diyi代核酸测序采用的是Sanger测序方法,其原理是就不用说了吧。记得08年时一次反应可产生的序列长度Z大为750bp,现在好像已经在1kb以上了。
第二代核酸测序基本上都是采用边合成边测序的方式,也可称之为高通量测序(next generation sequencing,NGS)。一般都会先把基因组打断,跑胶后选取不同长度的条带进行后续的建库、PCR扩增、测序。
第二代高通量测序仪主要代表有Illumina公司的HiSeq 2000、AB公司的SOLiD和Roche公司的454,其中以Illumina公司的HiSeq 2000为占领市场的主要机型,完成一次测序可产生数以百万计数目的reads,依据建库方式不同,每条read的长度可从36bp到200bp不等。
第二代高通量测序仪一次反应产生的每条read长度并不能达到Sanger那样长,但结合高性能计算机和生物信息学,测序仪产生的read之后会被去除接头,然后用于序列组装,形成Contig、Scaffold,Z后形成基因图谱,其成本已远远低于Sanger测序,时间也较之大大缩短。