2月11日,中国农业科学院深圳农业基因组研究所联合中国植物学会、北京大学等国内外49家单位共同发起“植物星球计划”,旨在通过解码陆地植物主要谱系的遗传密码,绘制完整的“植物生命之树”,以应对粮食安全、生物多样性保护、新药发现和可持续发展等全球性挑战。
在亿万年的进化历程中,植物演化出了多样的形态,追溯植物进化史上的关键“节点”,有助于揭示植物进化中共有和特有性状的遗传基础。然而,由于基因组数据的零散与缺口,许多关键进化关系悬而未决。“植物星球计划”主要负责人、中国农业科学院深圳农业基因组研究所研究员王丽介绍道,“植物星球计划”希望通过对缺乏参考基因组的目、科进行采样,借助系统发育基因组学方法,构建一个高分辨率、时间校准的完整陆地植物系统发育树,从根本上厘清所有主要植物类群之间的亲缘关系与分化时间,从而绘制完整的植物“生命之树”。
然而,有了关键的基因组数据,如何处理、利用数万个基因组产生的海量数据成了“植物星球计划”面临的另一大难题。“面对如此繁杂的数据,人工很难处理。”王丽说。为了进一步加速项目进度,减轻人工负担,“植物星球计划”引入了人工智能算法和模型,让AI学习并破译植物的“共同语言”。
王丽介绍,与自然语言处理模型通过学习海量文本掌握语法和语义类似,基因组语言基础模型将通过分析数以万计的不同植物基因组,学习识别DNA序列中保守的“语法”规则、调控元件的组织逻辑以及功能模块的编码模式。
庞大的植物基因组数据库的作用还远不止此。随着气候和生态环境的变化,不少植物正在加速消失。传统的保护措施常受限于表型数据的匮乏和采集难度,“植物星球计划”通过分析基因组中的遗传多样性等指标,可以比传统野外监测更高效率地识别出那些遗传基础脆弱、濒临灭绝的物种,从而精准评估植物的濒危状况,为生物多样性评估、稳健保护决策的制定等提供理论依据。此外,通过挖掘植物中抗病、抗旱、耐盐的基因,有助于培育出具有气候韧性的“未来作物”,保障粮食安全。
“植物星球计划”具有重大的科学意义和战略意义。在科学上,植物星球计划将揭示植物基因组进化和功能的“共同语言”,建立人工智能赋能基因组学研究的理论体系。在战略上,植物星球计划将整体提升全球生物多样性保护和实现碳中和的生态能力,构建植物科学领域全球大科学命题国际合作的新格局,进一步凸显中国在植物科学研究和生态文明建设的话语权。(经济日报记者 常理)
(责任编辑:冯虎)