蛋白质复合物链间残基距离深度学习预测方法
蒲奕霖, 王苏慧, 夏瑜豪, 张贵军
中国科学: 信息科学, 2025, 55(1): 94-109
关键词 蛋白质-蛋白质相互作用; 蛋白质复合物; 链间残基距离预测; 结构域间相互作用; 深度学习
Yilin PU, Suhui WANG, Yuhao XIA, et al. Inter-chain residue-residue distances prediction method for protein complexes using deep learning. Sci Sin Inform, 2025, 55(1): 94-109, doi: 10.1360/SSI-2024-0296
基于水平可视图多元联合模体熵的多维EEG情感脑电信号识别
杨小冬, 马志怡, 任彦霖, 陈梅辉, 何爱军, 王俊
中国科学: 信息科学, 2023, 53(12): 2406-2422
摘要 目前,许多基于深度学习和神经网络的算法被应用于脑电(electroencephalogram, EEG)信号情感识别.然而,现有研究大多采用提取单维脑电信号特征的方法.随着多传感技术的更新,更具全面性和系统性的多维信号特征提取需求出现.本文尝试将复杂网络研究应用到多维情感脑电识别中,提出一种基于水平可视图多元联合模体熵的情感识别算法,该方法可以有效避免人工选取特征对实验结果的影响,保持原始序列的非线性动力学特征.首先利用水平可视图算法将多维情感脑电信号分别转换为多路可视图网络,提取模体熵特征识别情感脑电研究中的关键频带和关键通道.在此基础上,将水平可视图网络两两联合,提取多元水平联合模体熵向量,作为输入参数对情感脑电信号进行识别.由于情感脑电序列长度会对识别效果产生影响,我们将脑电信号切割成大小不一的窗口,对比不同窗口大小对分类准确率的影响.实验结果表明,当切割窗口大小为10 s时,多元水平联合模体熵对情感脑电信号的识别效果最佳,对积极脑电/消极脑电、积极脑电/中性脑电、消极脑电/中性脑电的分类准确率分别达到95.07%, 97.73%, 90.26%,优于其他二维连接参数.同时,三分类的准确率为93.67%,本文算法无论在识别复杂度和准确率上,与已有算法相比均有较大提高.
关键词 EEG; 多路水平可视图; 多元联合模体熵; 情感识别; 多维分析; multiplex horizontal visibility graph; multivariate joint motif entropy; emotional recognition; multivariate analysis
Xiaodong YANG, Zhiyi MA, Yanlin REN, et al. Multivariate emotional EEG signal recognition based on multivariate joint motif entropy of a horizontal visibility graph. Sci Sin Inform, 2023, 53(12): 2406-2422, doi: 10.1360/SSI-2022-0454
基于图神经网络的环状RNA生物标志物筛选预测算法
李扬, 胡学钢, 王磊, 李培培, 尤著宏
中国科学: 信息科学, 2023, 53(11): 2214-2229
摘要 越来越多的证据表明,环状RNA (circular RNA, circRNA)在人类复杂疾病发病机制和许多重要生物学过程中发挥不可或缺的作用.确定环状RNA与疾病之间关联对于复杂人类疾病的诊断和治疗具有重要的潜在价值.然而,传统的湿实验方式通常是盲目、低效、耗时且昂贵的,往往还伴随着高的假阳性率.因此,迫切需要有效和可行的计算方法来大规模预测潜在的环状RNA–疾病关联.本文通过结合图神经网络的高阶图卷积网络算法与随机蕨分类器对环状RNA与疾病之间的关联关系进行预测.该方法能够从环状RNA和疾病多种属性信息构建的多源相似性网络中,有效抽取具有高阶混合邻域信息的高级特征,并对其进行准确分类.在5折交叉验证实验中,该方法在CircR2Disease数据集上取得了93.75%的AUC得分.此外,在案例研究中,该模型的预测结果得到了生物湿实验的支持,预测得分前15的环状RNA–疾病关联中的13个在最近发表文献中得以证实.这些优异的结果表明,所提模型是预测环状RNA–疾病关联的有效工具,并且可以为生物湿实验提供理论依据和高可信的环状RNA候选生物标志物.
关键词 环状RNA; 图神经网络; 环状RNA–疾病关联; 高阶图卷积网络; 随机蕨; circRNA; graph neural network; circRNA-disease association; high-order graph convolutional network; random ferns
Yang LI, Xuegang HU, Lei WANG, et al. Prediction algorithm for screening circRNA biomarker based on graph neural network. Sci Sin Inform, 2023, 53(11): 2214-2229, doi: 10.1360/SSI-2023-0070
基于单细胞数据的癌症协同驱动模块识别方法
陈希, 王峻, 余国先, 崔立真, 郭茂祖
中国科学: 信息科学, 2023, 53(2): 250-265
摘要 从大规模生物组学数据中准确识别导致癌症发生的协同驱动模块是生物信息学研究领域重大课题之一.现有研究方法通常只基于批量组学数据进行识别,忽视了细胞水平上的癌症异质性,易受噪声影响.针对上述问题,本文提出了一种基于单细胞数据和先验知识指导的协同驱动模块识别方法CDMFinder.该方法首先利用基因在不同亚型及正常细胞表达数据间存在的特异性共表达信息,融合基因交互网络,优化形成分子功能关联网络,在深入挖掘基因间功能关联的同时有效降低网络复杂度;再基于重叠马尔可夫(Markov)聚类从该网络中挖掘功能簇,并提出基于融合权重和贪心策略的驱动模块识别方法,从功能簇中获得驱动模块集合;最后,融合功能交互网络与突变共现定义模块距离函数,识别获取协同驱动模块. CDMFinder充分融合评估了表达、突变、差异分析等多种因素,展现了优良的识别性能.在乳腺癌和胶质母细胞瘤多组学数据上的实验结果表明,本文方法能够识别出超过对比方法 1.35倍的驱动基因,识别到的协同驱动模块在功能/通路水平富集度上超过现有算法1.5倍.
关键词 单细胞数据; 协同驱动模块; 分子功能关联网络; 马尔可夫聚类; 多组学数据融合; single-cell data; cooperative driver module; molecular functional association network; Markov clustering; multi-omics data fusion;
Xi CHEN, Jun WANG, Guoxian YU, et al. Cooperative driver module identification based on single cell data. Sci Sin Inform, 2023, 53(2): 250-265, doi: 10.1360/SSI-2022-0057