2025年1月7日,中国医学科学院基础医学研究所陈阳团队在Advanced Science《先进科学》发表了“SEE: A Method for Predicting the Dynamics of Chromatin Conformation Based on Single-Cell Gene Expression(SEE:一种基于单细胞基因表达的染色质构象动态预测方法)”的研究论文。该研究开发了一种人工智能方法SEE,用于解析单细胞尺度下的染色质动力学,为理解染色质与基因表达调控在发育和疾病中的分子机制提供了新视角。
该方法使用autoencoder和transformer技术,通过单细胞RNA测序数据和单细胞Hi-C数据实现单细胞染色质空间结构的预测。使用该方法可进一步定量研究:(1)染色质高级结构的动态变化;(2)染色质互作振荡与基因表达;(3)通过染色质动力学特征,解析疾病相关的单核苷酸多态性。
SEE的模型拥有5800万参数,在单次前向传递中大约需要7.57 GFLOPs,经过算法优化,可以在单核3090 GPU上运行。在batch_size设置为8的条件下,模型训练占用大约3000 MB的GPU内存,其中包括梯度、特征图和其他训练元件所需空间。因此,该方法对计算硬件要求低,可在24GB显存的GPU服务器进行端到端实验。与环境、训练、预测和分析相关的代码均可以在GitHub上公开获取。
本研究工作得到中国医学科学院医学与健康科技创新工程(2021-I2M-1-020, 2022-I2M-1-020)和国家重点研发计划(2022YFC2504003)等项目的资助。基础医学研究所陈阳研究员和北京科技大学张晓彤教授为论文共同通讯作者,基础医学研究所博士研究生李铭鸿和杨玉容为论文的共同第一作者。
论文链接:https://onlinelibrary.wiley.com/doi/10.1002/advs.202406413