简体中文

技术文章

喜报!华大新一产入选工信部人工智能在生物制造领域典型应用案例名单!

发布时间:2025-07-22

2025年7月7日,中华人民共和国工业和信息化部正式公示人工智能在生物制造领域典型应用案例名单(第一批)》。华大集团旗下常州新一产生命科技有限公司申报的 蛋白质智能预测和改造技术实现极端蛋白元件高效挖掘和性能优化 项目,经专家评审认定为 “典型” 级案例,成为高性能蛋白质元件设计及构建领域的标杆技术!

1751948839294.png

合成生物制造是驱动生物经济腾飞的核心引擎,预计2030-2040年将创造约3.6万亿美元/年的直接经济效益,支撑全球60%的产品生产。蛋白作为“合成生物芯片”的核心元件,极端特性的引入对重塑生物酶催化剂具有革命性工业价值。然而,传统开发手段因阳性率低、筛选成本高与周期冗长,导致可用的极端蛋白元件种类和数量仍很有限,严重制约了合成生物的发展。为此,本项目拟基于华大独有的“极端生境基因组数据资源”,结合高通量基因合成AI算法等优势,开发极端蛋白“序列-结构-能量”预测模型,深入挖掘改造关键极端蛋白,搭建平台推动其在合成生物制造中的工业应用。

项目方案与技术路线

(1)构建独有极端生境基因组资源

从南极、北极、马里亚纳海沟万米深渊、珠穆朗玛峰顶、深海热液喷口、火山喷发口和冰川冻土等极端生境采样大量微生物样本,并基于高通量测序获取Tb级海量数据资源。


图片

MEER计划(马里亚纳海沟环境与生态研究计划)与珠峰登顶


图片

面向国家重大需求:华大“探极”计划


(2)宏基因组信息获取与蛋白结构预测

基于华大宏基因组测序平台解析样本完整基因组,建立独有极端生境蛋白数据库(如华大自主构建的迄今为止最完整的海洋微生物组数据库GOMCNature2024633, 371-379.),分析并筛选非冗余新颖蛋白序列;利用Alphafold/ Esmfold预测蛋白序列三级结构(已完成超500万例新颖蛋白的三级结构预测),并进行精确标注。


https://db.cngb.org/maya/datasets/MDB0000002


▲ 4.31万组          ▲ 240 Tb测序数据  

▲ 是TARA Ocean基因组库的3倍、蛋白序列库的60倍


图片

构建迄今全球最大海洋微生物基因库


image.png

新颖蛋白三级结构预测


(3)多分类深度学习模型搭建、训练与极端蛋白预测

搭建图神经网络(GNN)多分类深度学习模型,开发融合序列-结构-能量多个维度极端蛋白预测模型。


图片

模型搭建、训练与预测




基于华大自主构建的全球独有极端基因组数据库,深度融合AI驱动的极端蛋白预测模型,系统性挖掘具有高工业价值的合成生物制造用极端蛋白元件,并通过整合荧光检测、多功能微板分析、HPLC-MS联用及虚拟筛选等高通量技术平台,实现蛋白功能与极端特性的高效表征;进一步结合酶分子改造技术显著提升目标蛋白活性与耐受性,构建商业化极端蛋白平台。

01
全产业链赋能-上游

开发耐极端环境的DNA聚合酶、基因编辑蛋白等分子工具酶,推动新一代测序/合成装备升级。

02
全产业链赋能-中游

通过底盘细胞核心蛋白元件替换,强化细胞工厂在高温/高盐/高有机溶剂条件下的耐受性,提升生物发酵效率与经济性40%以上。

03
全产业链赋能-下游

布局化工医药、环保、农业食品、生物能源等多元场景高性能元件,加速合成生物学技术产业化落地。


图片



📈华大新一产凭借“蛋白质智能预测改造技术”入选工信部AI+生物制造案例,依托极端蛋白AI平台的核心优势,我们将加速现有分子工具酶和生物技术应用酶等多场景产品的迭代升级!