新闻网讯 2月23日,物理学院生物物理团队黄胜友教授和肖奕教授合作在冷冻电镜的RNA结构建模领域取得重要进展,研究成果以“All-atom RNA structure determination from cryo-EM maps”为题在线发表于《自然·生物技术》(NatureBiotechnology)。华中科技大学为唯一通讯单位,物理学院博士生李涛为论文第一作者,何佳铧博士、曹宏博士生、张仪博士和陈吉博士生为共同作者,黄胜友教授和肖奕教授为共同通讯作者。
RNA作为遗传信息的载体,在蛋白质合成、基因调控、免疫调节等许多生命活动中发挥重要作用,“结构决定功能”,因此,确定RNA的三维结构对于理解其功能及相关药物或疫苗开发至关重要。冷冻电镜技术作为生物大分子复合物结构测定的最重要技术之一,目标是获取生物大分子的三维原子模型。由于冷冻电镜技术很难达到原子分辨率,在中等或近原子分辨率的冷冻电镜密度图中难以观测到分立的原子信号,使得结构建模存在巨大挑战。为了解决精度不足和建模自动化的问题,研究人员提出了各种方法来辅助建模。但跟蛋白质相比,RNA结构具有更低的保守性,自由度更多,柔性更大,导致RNA区域的分辨率一般比蛋白质更低,因此,冷冻电镜的RNA结构建模一直是一个难点。
针对这一问题,研究团队提出了一种基于深度学习的建模算法¾EMRNA,对RNA的冷冻电镜密度图进行自动建模。EMRNA采用三维Swin-Conv-Unet深度学习网络架构,结合用于局部学习的传统残差卷积模块和用于非局部学习的移动窗口自注意力模块,并将这两种模块整合到了多尺度的UNet中预测RNA骨架原子P-C4’-N1/N9位置和核苷酸类型信息,进行RNA全长主链追踪。然后,EMRNA结合基于片段的路径搜索算法和从序列出发预测的二级结构,对多个RNA全长候选骨架进行评估。最后,基于得分最佳的RNA全长主链骨架,通过叠合核苷酸模版和螺旋构象优化来构建RNA全原子模型。EMRNA在多个测试集上进行了广泛的评估,并与其它RNA建模算法进行了比较。结果表明,EMRNA显著优于其它RNA结构建模算法,能够自动构建出比拟PDB结构的RNA原子模型。
图1.EMRNA自动结构建模方法的工作流程图
图2. EMRNA在71条RNA链的测试集上的表现结果
黄胜友教授课题组多年来一直致力于生物大分子(蛋白质和核酸)相互作用计算及复合物结构建模研究,在蛋白质-蛋白质、蛋白质-多肽、蛋白质-小分子和蛋白质-核酸相互作用及其复合物结构预测方面做了许多重要的工作,开发了HDOCK、EMRNA、EMReady、DeepInter等方法和计算平台,近年来以通讯作者在Nature Biotechnology (2024)、Nature Machine Intelligence (2023)、Nature Communications (2023, 2023, 2022)、Nature Protocols (2020)等杂志上发表多篇论文。肖奕教授多年来一直致力于RNA/DNA的三级结构预测,开发了3dRNA/DNA等方法和计算平台,在Nature Biotechnology、Nucleic Acids Research、Bioinformatics等杂志发表多篇论文。
该项研究工作得到了国家自然科学基金(32161133002, 62072199, 32071247)和华中科技大学人才引进基金的资助。
论文链接:https://www.nature.com/articles/s41587-024-02149-8