
中国农业科学院深圳农业基因组研究所供图
12月3日,中国农业科学院深圳农业基因组研究所(岭南现代农业科学与技术广东省实验室深圳分中心)王桂荣课题组联合崔鹏课题组在《自然·通讯(Nature Communications)》上发表研究论文,题为《基于单只个体的双翅目橘小实蝇端粒到端 粒基因组组装》(Telomere-to-telomere genome assembly of the Dipteran Bactrocera dorsalis from a single individual)。该研究以“果蔬杀手”橘小实蝇为研究对象,成功构建了在小个体高杂合害虫中最完整的基因组图谱,并在Y染色体区域和气味受体基因家族进行了潜在绿色农药分子靶标挖掘与验证。
中国农业科学院深圳农业基因组研究所研究员王桂荣表示,研究证明了小昆虫能够迈入T2T基因组时代,为基于害虫功能基因组学手段的防控分子靶标发现以及实蝇类害虫的绿色防控技术研发,提供了新思路。
“果蔬杀手”橘小实蝇
据介绍,橘小实蝇,因其食性杂、寄主广、繁殖力强,被称为果蔬界的头号“杀手”,想要“看清”它们,并不是一件容易的事。与大多数农业害虫一样,橘小实蝇的体长仅8毫米,是典型的小个体农业害虫,小体型决定了其能够提供的DNA起始量有限,单个橘小实蝇能提取的DNA含量仅有1微克,无法达到传统测序建库至少需要5微克DNA的要求。另一方面,橘小实蝇的基因组高度杂合,这意味着“地图”上存在多个高度相似的地点,如何辨别并正确标识它们是决定“地图”优劣的关键。
近年来,研究人员陆续发布了多个橘小实蝇基因组版本,然而,这些基因组大多基于混合个体组装,尤其是在中心粒、性染色体这些富含重复的基因序列区域有较多的“盲区”,最后得出的“地图”并不算完美。中国农业科学院深圳农业基因组研究所副研究员刘伟表示,理想情况下,从染色体一端的端粒到另一端的端粒应该连续完整,但此前发布的基因组序列由于重复DNA序列或未知基因组区域产生了多处空白,这就像一幅关键区域缺失或模糊不清的地图,虽然我们能看清大致的轮廓分布,但关键的地标信息却丢失了。
“这些空白严重限制了我们对橘小实蝇生物学特性的深入理解。”刘伟表示,例如,其强大的环境适应性和抗药性可能就隐藏在这些重复序列构成的“盲区”之中,而开发高效的绿色防控技术也迫切需要一份能清晰标注关键位置信息的完整“地图”。
重建基因“地图”
为了构建更完整、准确的基因“地图”,研究团队提出了一种新的组装策略。他们以单个体雄虫的测序数据作为基本骨架,整合群体测序数据,利用不同的测序技术相互补充。
这是一个不同寻常的选择。在以往的研究中,由于技术限制,科研人员常常需要将不同昆虫混合在一起,以达到传统测序所需的DNA量。有时,为了降低分析难度,会特意选择遗传背景更简单的雌虫(因为雌虫没有Y染色体)。但这就像把许多张相似但不完全一样的地图碎片混在一起拼图,最终拼出的地图会充满重叠的“重影”,模糊不清。更重要的是,这种方法会完全丢失只有雄虫才拥有的 Y染色体“地图” ,而这部分信息对于理解雄性发育和开发针对雄虫的防控技术至关重要。
最终研究团队在单体雄虫的基础上,成功组装出了接近600 Mb、中心粒和端粒区域较为完整并包含性染色体的T2T级别基因组。研究人员进一步将通过T2T组装流程获得的基因组与使用常规基因组组装流程获得的组装结果进行了比较,证实新组装流程在基因组图谱构建质量上有显著提升。
刘伟表示,与其他橘小实蝇基因组参考版本相比,新的基因组“地图”首次实现了从端粒到端粒的无缺口完整覆盖,填补了以往基因组中高度重复的复杂区域留下的空白。比如染色体末端的端粒结构和在细胞分裂中起关键作用的着丝粒区域,还包含大量重复序列的Y染色体全序列。新序列识别出多个以往未发现的串联重复基因簇,尤其是气味受体基因家族,这些结构在橘小实蝇的寄主识别和环境适应中可能发挥重要作用。
填补现代基因组“盲区”
这张高清基因“地图”给研究团队带来了惊喜发现。
刘伟表示,研究深入解析基因组“盲区”——中心粒和性染色体区域,发现橘小实蝇的中心粒区域由3种不同类型的卫星DNA组成,呈现出从中心区向两端异质性逐渐递减的分布规律。这些重复单元的总长度超过40 Mb,其中包含两种存在于所有常染色体上的泛着丝粒DNA,以及一种特异性定位于X染色体上的着丝粒DNA。研究人员进一步获得了两种性染色体,其中X染色体超过60Mb,包含约578个基因。Y染色体约7Mb多,包含约52个基因。对于X染色体,其表达基因能够观察到明显的剂量补偿效应,同时有线粒体基因组插入现象。
同时,首次在Y染色体上鉴定到一个在雄虫全组织表达的ATP合成酶β亚基基因,推测与雄虫生命活动的高能需求相关。
此外,“发现了新的气味受体基因。”刘伟表示,研究人员通过全基因组鉴定,在橘小实蝇中发现了110个候选气味受体基因,其中超过半数的气味受体基因表现出2-10个成员的串联复制。通过基因编辑实验证实,BdorOR88a对昆虫食诱剂甲基丁香酚引诱雄虫具有一定的调控作用,但并不是其主要的嗅觉受体。这一结果与团队研究鉴定的主要受体BdorOR94b1的结果一致。
中国农业科学院深圳农业基因组研究所研究员崔鹏表示,该研究综合运用多种三代测序技术,提出了一种适用于小个体高杂合昆虫的单个体基因组组装策略,成功完成了橘小实蝇端粒到端粒基因组,填补了现有基因组的“盲区”,解析了中心粒,性染色体等高重复结构区域,挖掘出了Y染色体特异性基因和气味受体等潜在的绿色防控技术靶标,为害虫绿色防控技术的研发与优化提供了高质量参考基因组资源。
据了解,该项研究得到深圳市科技计划资助与深圳市大鹏新区科技创新和产业发展专项资金资助项目、国家重点研发项目、中国农业科学院科技创新工程、国际原子能机构协调研究等项目支持。
