基因组注释分析主要包括哪些内容基因组注释包括以下方面的内容:(1)重复序列的预测。通过比对已知的重复序列数据库,找出序列中包含的重复序列,识别类型并转化为N或者X,统计各种类型重复序列的分布。(2)编码基因的预测。通过将转录组或EST数据比对到拼接后的基因组序列上,找出编码基因位置,预测编码基因结构。或者通过专业的外显子预测软件,预测编码基因的外显子结构。(3)小RNA基因的预测。通过比对已知的小RNA的数据库,或者通过生物信息(bioinformation)学软件预测,找出这些小RNA基因,并进行分类。(4)调控序列和假基因的预测。基因功能的注释,使用的数据库包括NT/NR,SwissProt/TrEMbl,InterPro,KEGG,COG,Geneontology等,使用比对的方法,如blast,找出同源相近的基因,并注释功能。