模型学习单个氨基酸如何决定蛋白质功能
来自麻省理工学院研究人员的机器学习模型计算地分解了氨基酸链段如何决定蛋白质的功能,这可以帮助研究人员设计和测试用于药物开发或生物研究的新蛋白质。
蛋白质是氨基酸的线性链,通过肽键连接,折叠成极其复杂的三维结构,这取决于链内的序列和物理相互作用。反过来,这种结构决定了蛋白质的生物学功能。因此,了解蛋白质的三维结构对于预测蛋白质如何对某些药物产生反应是有价值的。
然而,尽管经过数十年的研究和多种成像技术的发展,我们只知道很少一部分可能的蛋白质结构 - 数以万计的成千上万。研究人员开始使用机器学习模型根据氨基酸序列预测蛋白质结构,这可以发现新的蛋白质结构。但这具有挑战性,因为不同的氨基酸序列可以形成非常相似的结构。并且没有很多结构可以训练模型。
在5月份的国际学习代表会议上发表的一篇论文中,麻省理工学院的研究人员开发了一种方法,用于“学习”蛋白质序列中每个氨基酸位置的易于计算的表示,最初使用3-D蛋白质结构作为培训指南。然后,研究人员可以使用这些表示作为输入,帮助机器学习模型预测单个氨基酸片段的功能 - 而无需再次需要蛋白质结构的任何数据。
将来,该模型可用于改进蛋白质工程,为研究人员提供更好地归零和修饰特定氨基酸片段的机会。该模型甚至可能引导研究人员完全脱离蛋白质结构预测。
“我希望将结构边缘化,”第一作者Tristan Bepler说,他是计算机科学与人工智能实验室(CSAIL)计算与生物学研究组的研究生。“我们想知道蛋白质的作用,知道结构对此非常重要。但是,我们能预测蛋白质的功能只能给出它的氨基酸序列吗?动机是远离专门预测结构,转向[发现]氨基酸序列如何与功能相关。“
加入Bepler的是共同作者Bonnie Berger,麻省理工学院Simons数学教授,电气工程和计算机科学系的联合教员,以及计算和生物学组的负责人。
从结构中学习
研究人员将预测的蛋白质结构信息直接编码为表示,而不是像传统模型那样直接预测结构。为此,他们使用已知的蛋白质结构相似性来监督他们的模型,因为该模型学习了特定氨基酸的功能。
他们根据蛋白质结构分类(SCOP)数据库对大约22,000种蛋白质进行了模型训练,该数据库包含数千种蛋白质,这些蛋白质通过结构和氨基酸序列的相似性组织成类别。对于每对蛋白质,他们根据他们的SCOP类计算出真实的相似性得分,这意味着它们在结构上的接近程度。
然后研究人员给他们的模型随机配对的蛋白质结构及其氨基酸序列,它们被编码器转换成称为嵌入的数字表示。在自然语言处理中,嵌入基本上是以对应于句子中的字母或单词的方式组合的数百个数字的表。两个嵌入越相似,字母或单词在句子中出现的可能性就越大。
在研究人员的工作中,每对嵌入包含有关每个氨基酸序列与另一个氨基酸序列有多相似的信息。该模型对齐两个嵌入并计算相似性得分,然后预测其三维结构的相似程度。然后,模型将其预测的相似性得分与其结构的实际SCOP相似性得分进行比较,并将反馈信号发送给编码器。
同时,该模型预测每个嵌入的“接触图”,基本上表示每个氨基酸与蛋白质预测的3-D结构中的所有其他氨基酸相距多远 - 基本上,它们是否接触?该模型还将其预测的接触图与来自SCOP的已知接触图进行比较,并将反馈信号发送到编码器。这有助于模型更好地了解氨基酸在蛋白质结构中的确切位置,从而进一步更新每种氨基酸的功能。
基本上,研究人员通过要求它预测配对序列嵌入是否将共享相似的SCOP蛋白结构来训练他们的模型。如果模型的预测分数接近真实分数,它就知道它在正确的轨道上;如果没有,它会调整。
蛋白质设计
最后,对于一个输入的氨基酸链,该模型将为3-D结构中的每个氨基酸位置产生一个数值表示或嵌入。机器学习模型然后可以使用这些序列嵌入来基于其预测的3-D结构“背景” - 其位置和与其他氨基酸的接触来准确地预测每个氨基酸的功能。
例如,研究人员使用该模型预测哪些片段(如果有的话)通过细胞膜。鉴于只有一个氨基酸序列,研究人员的模型比最先进的模型更准确地预测所有跨膜和非跨膜片段。
接下来,研究人员的目标是将该模型应用于更多预测任务,例如确定哪些序列片段与小分子结合,这对于药物开发至关重要。他们还致力于将该模型用于蛋白质设计。使用它们的序列嵌入,它们可以预测蛋白质会发出什么颜色的波长。
“我们的模型允许我们将信息从已知的蛋白质结构转移到具有未知结构的序列。使用我们的嵌入作为特征,我们可以更好地预测功能并实现更有效的数据驱动蛋白质设计,”Bepler说。“在很高的层面上,这种类型的蛋白质工程是目标。”
Berger补充说:“我们的机器学习模型因此使我们能够学习蛋白质折叠的'语言' - 最初的'圣杯'问题之一 - 来自相对较少的已知结构。”
论文:“使用结构信息学习蛋白质序列嵌入。”
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
江淮iEV7试驾预约流程如下:首先,访问江淮汽车官网或关注官方公众号,进入“试驾预约”页面。填写个人信息,...浏览全文>>
-
试驾MG4 EV全攻略:MG4 EV是一款主打年轻科技感的纯电紧凑型车,外观时尚,内饰简洁。试驾时重点关注其动力...浏览全文>>
-
预约试驾奥迪SQ5 Sportback,线上+线下操作指南如下:线上预约:访问奥迪官网或官方App,选择“试驾预约”,...浏览全文>>
-
试驾别克君越,一键启动,开启豪华驾驶之旅。作为一款中大型轿车,君越以优雅外观、舒适空间和强劲动力赢得广...浏览全文>>
-
试驾沃尔沃XC40时,需注意以下几点:首先,提前预约试驾时间,确保车辆状态良好。其次,熟悉车辆智能安全系统...浏览全文>>
-
预约宝马X1试驾前,建议提前通过官网或电话联系4S店,确认车型库存与试驾时间。到店后,先与销售顾问沟通需求...浏览全文>>
-
比亚迪海豹05 DM-i试驾预约流程如下:首先,访问比亚迪官网或关注官方公众号,进入“试驾预约”页面。填写个...浏览全文>>
-
试驾奇骏时,建议关注以下几点:首先,提前预约专业试驾路线,熟悉车辆性能;其次,注意检查车辆外观及内饰是...浏览全文>>
-
凯迪拉克CT5预约试驾,从线上到线下,体验顺畅而专业。只需几步简单操作,即可在官网或App上选择心仪门店与时...浏览全文>>
-
预约东风富康试驾可通过以下步骤进行:1 官网或官方App:访问东风富康官网或下载其官方App,进入“试驾预约...浏览全文>>
- 比亚迪海豹05DM-i试驾预约流程
- 云度新能源预约试驾有哪些途径
- 阿维塔07试驾预约,体验极致驾驶乐趣
- 宾利试驾,快速操作,轻松体验驾驶乐趣
- 全顺试驾预约,一键搞定,开启豪华驾驶之旅
- QQ多米试驾预约,轻松搞定试驾
- 零跑C10试驾的流程是什么
- 宝马X1预约试驾,4S店体验全攻略
- 试驾QQ多米,畅享豪华驾乘,体验卓越性能
- 江铃集团新能源试驾预约,一键搞定,开启豪华驾驶之旅
- 试驾雷克萨斯ES如何快速锁定试驾名额?
- 兰博基尼试驾预约有哪些途径
- 试驾五菱凯捷有哪些途径
- 力帆预约试驾,一键搞定,开启豪华驾驶之旅
- 极石汽车试驾预约,4S店体验全攻略
- 本田雅阁试驾,新手试驾注意事项
- 捷途旅行者试驾预约预约流程
- 昊铂试驾预约,快速通道开启豪华体验
- 五菱预约试驾,开启完美驾驭之旅
- 试驾捷豹E-PACE,4S店体验全攻略