新华社纽约1月11日电 美国研究人员开发出一个新的人工智能模型,经过大量数据的训练后,该模型能精确预测各种人体细胞内部的基因表达情况,将为生物和医学研究带来便利。
这个名为“通用表达转换器”(GET)的模型由美国哥伦比亚大学和卡内基-梅隆大学等机构研究人员联合开发,其准确性和有效性已得到实验验证,论文发表在新一期英国《自然》杂志上。
在基因表达过程中,以DNA形式储存的基因“蓝图”转录成为RNA形式的“抄本”,后者指导合成出蛋白质,执行具体的生理功能。参与转录调控的生物分子种类繁多,相互作用极为复杂,此前相关预测模型局限于几种特定的细胞,尤其是癌细胞,缺乏适用于人体多种细胞类型的通用工具。
研究人员根据转录调控机制的特点设计出机器学习模型,然后用来自1.3万个人体细胞的基因测序和表达数据对其进行训练。这些细胞涵盖213种人类胚胎细胞和成体细胞,都来自没有病变的正常人体组织。
就像ChatGPT等人工智能工具能根据大量语料总结出通用语法规则,GET模型也能从训练数据中总结出关于转录调控的“语法”,在此基础上能对其没有接触过的细胞类型进行基因表达预测。
该模型可用于揭示致病基因的作用机制,指导癌症和遗传疾病研究。例如某种儿童白血病的患者携带一个功能不明的变异基因,GET模型预测该基因会扰乱细胞中两种转录因子的相互作用,实验数据证实了这一结论。
研究人员说,该模型还可用于探寻基因组中“暗物质”的作用。蛋白质编码基因序列只占人类基因组的一小部分,占比达98%的非编码区域就像宇宙中的暗物质一样,其属性和功能目前难以捉摸。
![](http://zhonghua.jingji.net/static/show/images/bg6.jpg)
-
(寻味中华|非遗)弦管雅乐千年传 南音古曲情意浓中新社福州1月1日电 题:弦管雅乐千年传 南音古曲情意浓作者 叶秋云几声琵琶先声夺人,洞箫乐手持洞箫而起,君不见,君不...
-
中俄最大界湖兴凯湖进入冬捕期中新网鸡西1月1日电(张方洲 郑成金 记者姜辉)记者1日从黑龙江出入境边防检查总站鸡西边境管理支队获悉,随着气温不断降低,...
-
三峡工程2024年运行情况良好中新社宜昌1月1日电 (郭晓莹 朱文丽 吴晓)据三峡集团1月1日消息,2024年,三峡工程工作性态正常,各项监测指标均在设计允...
-
冷空气影响进入尾声 我国东部多地气温创入冬以来新低中新网12月21日电 据中央气象台网站21日消息,昨日,冷空气继续东移南下影响我国,内蒙古中东部、华北北部和西部及新疆北部...
-
“90后”浙江医生援藏日记:做扎根羌塘高原的牧草中新网杭州12月21日电 题:90后浙江医生援藏日记:做扎根羌塘高原的牧草作者 张煜欢血怎么还没止住……几天前一个寒冷的夜...
-
(寻味中华|非遗)弦管雅乐千年传 南音古曲情意浓
2025-01-01 17:44:08
-
中俄最大界湖兴凯湖进入冬捕期
2025-01-01 17:35:58
-
三峡工程2024年运行情况良好
2025-01-01 17:33:48
-
冷空气影响进入尾声 我国东部多地气温创入冬以来新低
2024-12-21 18:13:04
-
“90后”浙江医生援藏日记:做扎根羌塘高原的牧草
2024-12-21 18:07:43
推荐