在一项新的研究中,来自美国伊利诺伊大学厄巴纳-香槟分校的研究人员发现一种新的人工智能工具可以根据酶的氨基酸序列预测其功能,即使是在酶未被研究或理解不深的情况下。他们说,这种称为CLEAN的人工智能工具在准确性、可靠性和灵敏度方面都超过了最先进的工具。对酶及其功能的更好理解将是基因组学、化学、工业材料、医学、制药等方面研究的福音。相关研究结果发表在2023年3月31日的Science期刊上,论文标题为“Enzyme function prediction using contrastive learning”。
(相关资料图)
论文通讯作者、伊利诺伊大学厄巴纳-香槟分校化学与生物分子工程教授Huimin Zhao说,“就像ChatGPT使用书面语言的数据来创建预测文本一样,我们正在利用蛋白的语言来预测它们的活性。几乎每个研究人员在处理一种新的蛋白序列时,都想马上知道它的作用是什么。此外,当为生物学、医学个工业领域的任何应用制造化学物时,这种新的工具将帮助科学家们快速识别合成化学物和材料所需的适当的酶。”
Zhao说,随着基因组学的进步,许多酶已经被识别和测序,但是科学家们对这些酶的作用几乎没有任何信息。
其他的计算工具试图预测酶的功能。通常情况下,它们试图通过将查询到的序列与已知的酶目录进行比较并找到类似的序列来分配一种酶学委员会编号(enzyme commission number)---一种表明一种酶催化哪种反应的识别代码。Zhao说,然而,这些工具对较少研究或者未表征的酶,或对执行多种任务的酶,效果并不理想。
Zhao说,“我们不是第一个使用人工智能工具来预测酶学委员会编号的人,但我们是第一个使用这种新的称为称为对比学习(contrastive learning)的深度学习算法来预测酶的功能。我们发现,这种算法比其他人使用的人工智能工具效果要好得多。我们不能保证每个人的产物都能被正确预测,但我们可以得到比其他两种或其他三种方法更高的准确度。”
这些作者通过计算和体外实验验证了他们的工具。他们发现,该工具不仅可以预测以前未表征的酶的功能,而且它还校正了被先进软件错误标记的酶,并正确识别了具有两种或多种功能的酶。
图片来自Science, 2023, doi:10.1126/science.adf2465。
Zhao团队正在使CLEAN能够在线访问,供其他寻求描述一种酶的特征或确定一种酶是否能够催化所需反应的科学家们使用。Zhao说,“我们希望这种工具将被广大研究界广泛使用。有了这种网络界面,科学家们只需在一个搜索框中输入序列,就像搜索引擎一样,就能看到结果。”
Zhao说,该团队计划扩大CLEAN背后的人工智能,以确定诸如结合蛋白之类的其他蛋白的特征。该团队还希望进一步开发机器学习算法,以便用户可以搜索所需的反应,而人工智能就会指出一种合适的酶来完成这项任务。
Zhao说,“有很多未表征的结合蛋白,如受体和转录因子。我们也想预测它们的功能。我们想预测所有蛋白的功能,这样我们就能知道一个细胞拥有的所有蛋白,并更好地研究或改造整个细胞,以用于生物技术或生物医学应用。”(生物谷 Bioon.com)
参考资料:
Tianhao Yu et al. Enzyme function prediction using contrastive learning. Science, 2023, doi:10.1126/science.adf2465.
关键词:
凡注有"实况网-重新发现生活"或电头为"实况网-重新发现生活"的稿件,均为实况网-重新发现生活独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"实况网-重新发现生活",并保留"实况网-重新发现生活"的电头。