|
|
种子是农业的芯片。“十五五”规划纲要指出,要深入实施种业振兴行动,加强种质资源保护利用,健全商业化育种体系,强化育种联合攻关,培育高产优质、抗逆广适新品种,提升种源安全保障水平。育出高产稳产的品种对保障我国粮食安全至关重要,而智能育种则是我国实现育种技术弯道超车的重要途径。 智能育种是一个前沿交叉领域,它通过结合生物技术与人工智能、大数据技术,旨在提高育种科研效率与品种质量。2025年8月发布的《国务院关于深入实施“人工智能+”行动的意见》明确指出要“加快人工智能驱动的育种体系创新”。当前我国生物育种的目标是在资源环境约束趋紧的背景下,以尽可能少的时间和成本培育出高产、优质、多抗(如耐盐碱、耐旱、抗病虫)的突破性品种,背后的科学问题则是对“基因—环境—性状”三者关联的精准建模。“橘生淮南则为橘,生于淮北则为枳。”我国劳动人民早在春秋时期就注意到种子受环境影响,但背后的生物学机理至今仍存在不少未解之谜。以水稻为例,当前约90%的基因功能未知,玉米和大豆等作物的比例更高。人工智能的推广与普及为系统理解“基因—环境—性状”之间的关系提供了数据驱动的新思路。当前人工智能已经开始为基因型、环境型和表型的研究赋能,如在生物信息学和表型组学的数据分析中,以深度学习为代表的人工智能模型,正逐步替代传统统计学工具,成为研究的核心支撑。 尽管我国已经开始关注智能育种技术,但在技术路径和产业转化上仍处于“摸着石头过河”的探索阶段,核心原因在于国内外的研发主体存在差异。国内育种研发目前依靠科研院所和高校居多,而国外以种业公司为主。相较于国内科研更看重的论文和专利,国际种业巨头以种子销售为主,对核心育种技术实行严格保密。 除了机制上的差异,我国的智能育种落地还面临着数据、算法和算力的挑战。首先,数据是最大的卡点。德国拜耳集团在全球有超过10亿亩标准化农田,可以源源不断提供多位点、多年份、多维度的育种数据,而我国任一育种科研机构很难收集到这个量级的高质量数据。正是有了数据基础,国际种业公司才能面向实际需求研发适配性强的智能育种算法。其次,国际种业巨头对新技术的布局前瞻性和敏感性值得借鉴。早在2013年,孟山都就收购了硅谷初创公司Climate Corporation成为其数字农业子公司,并推出了人工智能驱动的数字农业平台Climate FieldView。而大模型时代,拜耳集团的E.L.Y.系统和先正达集团的CropwiseAI系统整合了积累多年的农艺、天气、土壤数据,能够提供精准的种子推荐布局与作物生长、产量预测,大模型技术在种子产业的巨大作用已经初露端倪。再次,算法研发面临人才缺口。人工智能算法研发高度依赖专业人才,当前我国人工智能领域尤其是大模型方向的专业人才本就供不应求,愿意投身育种领域的更是寥寥无几。最后,算力支撑存在短板。人工智能算法的运行高度依赖智算芯片,而我国当前高性能智算芯片仍依赖进口,加之高性能算力购置成本高昂,成为众多农业科研机构推进智能育种研发的重要阻碍。 随着以ChatGPT为标志性节点的大模型时代的开始,科研范式也迎来了新的变革。全球范围内,人工智能技术创新的浪潮持续奔涌,国产大模型加速迭代突破,在技术实力与应用场景上不断提升,逐步跻身国际前沿行列。国内外大模型技术虽有细节差异,但整体处于同一水平,这为我国将大模型技术与智能育种深度融合奠定了坚实基础。大模型技术在科研领域的应用突破,为其赋能智能育种提供了可借鉴的技术路线。2025年,美国斯坦福大学等机构在《自然》发表论文,证实大模型智能体在无需人类科学家干预的情况下可以自主设计92款新冠病毒纳米抗体。同年,英国帝国理工学院基于谷歌开发的AICo-Scientist系统,仅用48小时便验证了微生物学家耗时十年完成的细菌基因传播机制研究,并提出多个创新性假说,相关成果发表于《细胞》。这些突破充分证明,大模型能大幅提升科研效率、推动原创性科学发现,为大模型育种的研发与应用指明了方向。 具体来看,大模型技术对智能育种的赋能主要体现在两大方面。一方面,大模型技术作为“工具的革命”,对于基因型、环境型和表型的研究有巨大的潜力。在基因研究层面,当前国内育种采用的全基因组选择技术依赖于全基因组范围内的单核苷酸多态性标记,无法利用原始基因数据发现生命规律,传统深度学习算法很难直接对海量基因数据建模。比如,栽培水稻基因组约含4亿个碱基对,从中找到关键的基因位点,好比在荒芜的沙漠寻找那一抹绿洲。而基因大模型的出现成为破局关键,如果将DNA看作生命的语言,基因大模型则是利用大语言模型技术在基因数据上训练得到的大模型。由美国Arc研究所和斯坦福大学联合研发的Evo和谷歌DeepMind公司研发的AlphaGenome等基因大模型,已先后登上《科学》和《自然》杂志封面,并在人类疾病的研究中展现出一定的潜力,未来对植物学研究也有借鉴意义。在环境建模层面,农业环境涵盖气象、土壤、种植方式等多个复杂维度,易陷入“维度灾难”,而华为盘古气象大模型在温度、风速等气象要素预测精度上首次超越传统数值方法,推理效率提升上万倍,验证了大模型对气象数据建模的可行性,土壤、种植方式等多维度时序数据的建模,可借鉴这一技术路径。在表型研究层面,随着无人机、田间机器人的普及,基于图片、视频训练的视觉大模型,已能替代传统人工作业,实现表型数据的高效采集与精准测量。而要实现“基因—环境—性状”关联的精准建模,未来还需依托多模态大模型技术支撑的世界模型,破解三者组合的天文数字难题。 另一方面,大模型能推动育种科研流程智能化,通过构建AI科学家体系,实现科研效率的提升。国内科研机构已率先开展相关探索,上海人工智能实验室与崖州湾国家实验室、中国农业大学等单位跨领域协同,先后研发出首个育种大模型“丰登・种业大模型”和首个育种科研智能体“丰登・基因科学家”。目前“丰登”已经发现了未被报道的作物基因功能,首次利用大模型技术在作物科学研究中实现了范式的变革。 从新石器时代的驯化育种,到杂交育种、分子育种、设计育种,再到如今的智能育种,每一次技术革新都为育种这一古老事业注入新的生产力。大模型育种的前景广阔,但我国大模型育种仍处于早期探索阶段,除了面临智能育种原有的数据、算法、算力挑战,还存在社会接受度有限、技术体系不成熟等新问题,需要多措并举、系统推进。一是破解“数据孤岛”难题,发挥举国体制优势,加快制定国家育种数据统一标准,搭建全国性、地方性农业公共数据平台,推动育种数据跨机构、跨区域共享整合,为大模型育种筑牢数据基础。二是强化人才培养与引进,聚焦人工智能与育种交叉领域,搭建专业培养体系,培养复合型人才,同时加大高端人才引进力度,鼓励人工智能人才投身育种领域,打造高水平研发团队,夯实算法创新核心支撑。三是提升社会认知与认同,发挥媒体宣传作用,打破公众对农业工作的传统印象,展现大模型育种背后的信息技术、生物技术融合创新魅力,吸引更多青年人投身种业振兴事业。四是降低算力应用成本,依托国产大模型优化技术和国产智算芯片研发进展,推动大模型与国产算力深度适配,实现算力资源的低成本、高效化利用。 (作者系上海人工智能实验室研究员) (责编:郑继民)
【版权声明】凡来源学习时报网的内容,其版权均属中央党校报刊社所有。任何媒体、网站以及微信公众平台在引用、复制、转载、摘编或以其他任何方式使用上述内容时请注明来源为学习时报网。
|