在农业生产中,性状相关的基因定位对于科学育种十分重要,传统的遗传重组定位具有指导意义和实用价值,但传统方法周期长、耗费大。随着二代测序的发展,DNA测序速度大大加快、成本大大降低,使得通过测序法进行的基因定位(mapping-by-sequencing)成为越来越多动植物研究的主要手段。对合适的样本群体,在完整的基因组参考序列的条件下,结合传统集群分离分析(BSA)和二代测序方法,可以快速定位性状相关基因。在短短几天内,可通过数据运算界定出基因所在区域,进一步锁定基因。这一方法已经在拟南芥、水稻、玉米、小鼠、斑马鱼等等的基因定位中得到了应用。
通常这一应用的前提需要一个高质量、较完整的参考基因组序列,包括所有基因及其他基因组序列信息。然而,在农业中的许多重要作物,如大麦、小麦等等的基因组图谱并不完整。Z近德国科学家在Genome Biology上发表文章1,介绍了通过外显子组二代测序方法定位一个影响大麦出叶速率(leaf initiation rate)的基因,表明即使在基因组并不完整的情况下也可以进行测序法的基因定位。
此次研究针对大麦多节矮秆突变体(mnd),这一突变体的Z显著特点是叶间期缩短,出叶速度加快,叶子数量平均为野生型的2倍,节间茎秆长度缩短,并伴有叶子形状的改变等等。利用X光诱发的多节矮秆突变体与野生型cv. Barke杂交获得F2代,在100个F2中有19%为突变型、81%为野生型,该性状为单基因隐性遗传。取18个突变体的DNA混合成一个突变样本群的DNA混合物,再随机选取30个野生型混合成野生型样本群的DNA混合物,对这两个DNA混合物分别用NimbleGen大麦外显子组探针富集大麦基因组的编码序列后,进行二代测序。
图:基因定位:通过突变样本群和野生样本群等位基因频率的差异定位候选基因。摘自 Mascher M, Jost M, Kuon JE, Himmelbach A, A?falg A, Beier S, Scholz U, Graner A, Stein N. Mapping-by-sequencing accelerates forward genetics in barley. Genome Biol. 2014. Jun 10;15(6):R78
突变样本群和野生型样本群分别获得8.2 Gb和7Gb测序数据,比对cv. Barke的全基因组鸟枪法测序拼接结果后,分析SNP位点及其等位基因频率。比较2个样本群的SNP位点等位基因频率,在染色体5H长臂发现一个30cM区域,该区域内突变型的SNP等位基因频率达95%,而野生型的SNP频率仅为30%。同时,由于X光所引发的突变多为缺失突变,在测序数据中通过测序深度寻找>150bp的缺失突变,发现有18个缺失位于上述区域。在缺失片段对应的contig中,contig 49382位于5H 96 cM,有2个缺失区域,是一个被注释为“Cytochrome P450”的MLOC_64838.2基因的2个外显子。Blastn的结果显示这个基因编码的蛋白与水稻PLASTOCHRON1 (pla1)基因编码的蛋白序列相似,pla1基因的突变会使得水稻有类似大麦多节矮秆突变体的表型,作者认为MLOC_64838.2基因很可能是控制这个形状的基因。文章还在其他大麦多节矮秆突变体中进行了这个基因的验证,并在大麦的物理图谱中定位了这个基因。作者认为,利用大量现有的大麦突变体资源,结合外显子组测序、合理数据分析方法以及现有的基因组资源,可以经济有效地对大麦进行测序法的基因定位(mapping by sequencing),同样的方法也可以用于其他基因组庞大的物种的类似研究。
此文中所用的NimbleGen大麦外显子组探针设计基于现有大麦基因组拼接的注释,并参考全长RNA序列以及RNASeq测序序列设计,总共约88.6Mb目标序列,对应目前大麦基因组中~60Mb左右的编码区域。大麦外显子组捕获产品在一个捕获反应溶液中有约420万种不同的DNA探针,体现了NimbleGen高密度探针的生产和设计能力,可以有效覆盖和捕获目标区域。2013年11月在The Plant Journal发表的一篇文献2,也运用该大麦外显子组捕获产品,对不同品系的种植大麦及野生大麦进行了实验,随后进行SNP发现、多样性分析和进化分析,文章指出这个工具可以应用于多种品系的大麦、甚至小麦,帮助mRNA编码区的变异研究,通过混合捕获和减少测序量大大降低研究成本,从而推进大麦遗传多样性及基因性状研究。
1. Mascher M, Jost M, Kuon JE, Himmelbach A, A?falg A, Beier S, Scholz U, Graner A, Stein N. Mapping-by-sequencing accelerates forward genetics in barley. Genome Biol. 2014. Jun 10;15(6):R78.
2. Mascher M, Richmond TA, Gerhardt DJ, Himmelbach A, Clissold L, Sampath D, Ayling S, Steuernagel B, Pfeifer M, D'Ascenzo M, Akhunov ED, Hedley PE, Gonzales AM, Morrell PL, Kilian B, Blattner FR, Scholz U, Mayer KF, Flavell AJ, Muehlbauer GJ, Waugh R, Jeddeloh JA, Stein N. Barley whole exome capture: a tool for genomic research in the genus Hordeum and beyond. Plant J. 2013 Nov;76(3):494-505. doi: 10.1111/tpj.12294. Epub 2013 Aug 24.
仅用于科研,不用于临床诊断