计算机 人工智能 评述 Website Google Scholar PDF

神经符号系统: 非确定性管理的视角

李泽南, 姚远, 马晓星, 吕建
中国科学: 信息科学, 2025, 55(1): 1-31

关键词 神经符号学习; 神经符号接地; 推理捷径; 符号约束合成

引用格式 李泽南, 姚远, 马晓星, 等. 神经符号系统: 非确定性管理的视角. 中国科学: 信息科学, 2025, 55(1): 1-31, doi: 10.1360/SSI-2024-0163
Zenan LI, Yuan YAO, Xiaoxing MA, et al. Neuro-symbolic systems: a perspective of uncertainty management. Sci Sin Inform, 2025, 55(1): 1-31, doi: 10.1360/SSI-2024-0163

计算机 人工智能 进展 Website Google Scholar PDF SCOPUS引次: 0

2018~2023年国家自然科学基金人工智能学科人才项目申请及资助综述

谢国, 王增茂, 王志衡, 肖斌, 廖清, 宋和平, 夏辉, 吴国政
中国科学: 信息科学, 2024, 54(11): 2689-2708

摘要 围绕国家自然科学基金委信息科学部人工智能学科(F06) 2018~2023年青年科学基金项目、地区科学基金项目、优秀青年科学基金项目以及国家杰出青年科学基金项目等人才项目的申请及资助情况,从学科领域分布、申请年龄性别、依托单位分布以及依托单位变更情况等角度进行了分析,为人工智能领域的人才队伍建设、学科发展布局提供参考.

关键词 国家自然科学基金; 人工智能学科; F06代码; 人才项目; 申请与资助; national natural science foundation; artificial intelligence discipline; F06; talent funding; application and funding

引用格式 谢国, 王增茂, 王志衡, 等. 2018~2023年国家自然科学基金人工智能学科人才项目申请及资助综述. 中国科学: 信息科学, 2024, 54(11): 2689-2708, doi: 10.1360/SSI-2024-0080
Guo XIE, Zengmao WANG, Zhiheng WANG, et al. Application and funding for talents of national natural science foundation of artificial intelligence discipline from 2018 to 2023. Sci Sin Inform, 2024, 54(11): 2689-2708, doi: 10.1360/SSI-2024-0080

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 0

基于注意力的联想忆阻脉冲神经网络及其无监督图像分类应用

邓泽坤, 王春华, 蔺海荣, 邓全利, Yichuang SUN
中国科学: 信息科学, 2024, 54(11): 2554-2571

摘要 无监督学习不需要对训练数据进行人工标注,在硬件系统的图像分类应用中具有重要价值.现有忆阻脉冲神经网络(memristive spiking neural network, MSNN)的无监督学习主要集中于前后神经元之间的突触调节过程,这导致学习仅限于局部神经活动而忽略了神经反应之间的内部联系.联想记忆是大脑实现记忆的重要方式,其通过无监督方式将不同刺激关联起来以建立互联的网络记忆.同时,人类视觉系统利用注意机制从海量信息中选择重要信息,以有效减少输入神经元的数量和神经网络的规模.本文提出了一种基于注意力的联想忆阻脉冲神经网络(attention-based associative memristive spiking neural network, AAMSNN)的全电路设计,并将其应用于无监督图像分类应用.其中,注意力编码模块和注意力选择模块启发于人脑的注意力机制,用于搜索并选择重要特征信息,减少AAMSNN的输入神经元数量.联想忆阻脉冲神经网络由巴甫洛夫联想忆阻交叉阵列构成,通过调节联想记忆权重实现无监督图像分类.与其他MSNN相比, AAMSNN具有更小的MSNN规模和更少的忆阻器数量,并实现了更优的无监督图像分类准确率.

关键词 忆阻脉冲神经网络; 注意力; 联想记忆; 无监督学习; 图像分类; memristive spiking neural network; attention; associative memory; unsupervised learning; image classification

引用格式 邓泽坤, 王春华, 蔺海荣, 等. 基于注意力的联想忆阻脉冲神经网络及其无监督图像分类应用. 中国科学: 信息科学, 2024, 54(11): 2554-2571, doi: 10.1360/SSI-2023-0393
Zekun DENG, Chunhua WANG, Hairong LIN, et al. An attention-based associative memristive spiking neural network and its application in unsupervised image classification. Sci Sin Inform, 2024, 54(11): 2554-2571, doi: 10.1360/SSI-2023-0393

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 0

集成效用与数据产品最优定价

王煜心, 李建平, 郝俊
中国科学: 信息科学, 2024, 54(11): 2533-2553

摘要 数据定价有助于释放数据的价值,并为数据交易提供依据,推动数据市场的发展和创新.目前,数据价值具有不确定性、多样性和制约性等问题,如何对数据进行准确的价值评估是数据定价的首要问题.在此背景下,本文提出的方法可以有效地解决数据定价的不确定性和多样性问题.本文构建了基于数据质量和容量的二元非线性集成效用函数来评估数据价值,融合斯塔克伯格(Stackelberg)博弈模型分析参与者行为,利用KKT算法实现了数据产品的最优定价.研究发现原始数据的最优容量、最优质量、最优价格和数据产品提供商利润与单位购买成本存在负相关关系,与消费者数量和消费者敏感程度存在正相关关系,且与消费者敏感程度的正相关关系更大.通过与基于一元效用函数的定价模型对比,进一步验证了本文所提出的考虑集成效用的数据产品定价模型具有显著的优越性.

关键词 数据定价; 数据产品; 数据交易; 集成效用; 斯塔克伯格博弈模型; data pricing; data products; data trading; integrated utility; Stackelberg game model

引用格式 王煜心, 李建平, 郝俊. 集成效用与数据产品最优定价. 中国科学: 信息科学, 2024, 54(11): 2533-2553, doi: 10.1360/SSI-2023-0277
Yuxin WANG, Jianping LI, Jun HAO. Integrated utility and optimizing pricing of data products. Sci Sin Inform, 2024, 54(11): 2533-2553, doi: 10.1360/SSI-2023-0277

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 0

基于原型学习的联邦持续学习方法

张浩东, 杨柳, 于剑, 胡清华, 景丽萍
中国科学: 信息科学, 2024, 54(10): 2428-2442

摘要 联邦学习能够在隐私保护的前提下联合多个参与者进行协同学习,然而经典的联邦学习不具备持续学习的能力,无法适应动态变化的应用场景.联邦持续学习近期引起了广泛的关注,其允许多个参与者在协同学习的同时进行持续学习.联邦持续学习是一种更加复杂的学习场景,其面临的挑战包括灾难性遗忘,异构性以及通信资源受限.为了应对这些挑战,本文提出一种基于原型学习的联邦持续学习方法.该方法利用原型进行知识的共享,提升通信效率的同时增强了对模型异构性的适应能力.此外,该方法设计了基于知识蒸馏和回放的灾难性遗忘的预防机制.本文提供了所提出方法的收敛性分析,并且通过对比实验和消融实验验证了该方法的有效性.

关键词 联邦持续学习; 原型学习; 知识蒸馏; 灾难性遗忘; 数据异构; federated continual learning; prototype learning; knowledge distillation; catastrophic forgetting; data heterogeneity

引用格式 张浩东, 杨柳, 于剑, 等. 基于原型学习的联邦持续学习方法. 中国科学: 信息科学, 2024, 54(10): 2428-2442, doi: 10.1360/SSI-2023-0239
Hao-Dong ZHANG, Liu YANG, Jian YU , et al. Federated continual learning based on prototype learning. Sci Sin Inform, 2024, 54(10): 2428-2442, doi: 10.1360/SSI-2023-0239

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 0

非线性信息瓶颈指导的层次图结构学习方法

孙庆赟, 罗家逸, 杨贝宁, 李建欣
中国科学: 信息科学, 2024, 54(10): 2409-2427

摘要 近年来,图神经网络在各个领域的图数据挖掘任务上取得了显著的成功,已成为领域的研究热点.图神经网络通过结构传播节点信息,并以此计算节点的表征,在大量应用场景上取得了显著的效果提升.大多数图神经网络模型遵循消息传递机制,直接将原始图数据作为输入,假设观测到的图结构准确地描述了节点之间完整的关系.然而,真实场景中图数据的产生往往受多种因素影响,包含大量随机噪声和人为扰动.这些噪声信息和干扰信息在图神经网络信息聚合的过程中随着图结构传播,对图表征质量产生严重的影响.如何度量、识别图数据中的噪声信息,是领域关注的热点问题之一.本文从信息论的角度出发,提出了一种非线性信息瓶颈指导的层次图结构学习方法 NIB-HGSL,针对图层级分类任务,为去除结构噪声、学习鲁棒的图表征提供了一个统一通用的框架. NIB-HGSL通过有效信息保留与噪声信息压缩的均衡优化,可以获得对下游任务来说最关键的层次化最小充分图.实验结果表明,本文所提出的NIB-HGSL方法与其他基线方法相比,可提高图分类和图回归任务的准确性和鲁棒性.

关键词 图表示学习; 信息瓶颈; 图结构学习; 图神经网络; 图分类; graph representation learning; information bottleneck; graph structure learning; graph neural networks; graph classification

引用格式 孙庆赟, 罗家逸, 杨贝宁, 等. 非线性信息瓶颈指导的层次图结构学习方法. 中国科学: 信息科学, 2024, 54(10): 2409-2427, doi: 10.1360/SSI-2024-0049
Qingyun SUN, Jiayi LUO, Beining YANG, et al. Hierarchical graph structure learning with nonlinear information bottleneck. Sci Sin Inform, 2024, 54(10): 2409-2427, doi: 10.1360/SSI-2024-0049

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 0

基于全局密度更新策略的两阶段多模态多目标进化算法

贺娟娟, 杨倩, 许志伟, 张凯, 张兴义, 葛明峰
中国科学: 信息科学, 2024, 54(10): 2385-2408

摘要 多模态多目标问题需要求解多个全局或局部最优帕累托解集,找到这些最优解集具有极大的理论意义和实际经济效益.近年来,学者们提出许多进化算法用于解决该问题.然而,多数算法在进化过程中首先选择收敛性好的个体构建交配池,然后再考虑决策空间和目标空间的多样性.因此,决策空间中多样性好的个体可能被目标空间收敛性好的个体所替代.另外,由于帕累托最优子集在决策空间中有不同的形状和位置,因此个体很难均匀地收敛到每个帕累托子区域.本文提出了基于全局密度更新策略的两阶段多模态多目标进化算法.首先,为减轻交配池和亲本与子代一对一比较的负面影响,我们并不构建交配池,而是提出了新的算法框架,分两阶段寻优.该框架利用不同阶段进化算法的特征进行子代更新,有利于平衡种群的搜索和开发.然后,为了解决帕累托子集分布不均的问题,我们设计了目标空间密度自适应策略和全局密度估计更新种群策略,用于保持目标空间和决策空间种群多样性.我们将提出的算法与7种有代表性的多模态多目标算法进行比较.实验结果表明,我们的算法在决策空间中能找到更多等价的解,并且能更好地保持决策空间和目标空间多样性和收敛性的平衡,整体性能要好于所比较算法.

关键词 多目标进化算法; 多模态多目标优化问题; 进化算法; 全局密度; 参考向量; 边界点聚集; multi-objective evolutionary algorithm; multimodal multi-objective optimization problem; evolutionary algorithm; global density; reference vector; boundary point clustering

引用格式 贺娟娟, 杨倩, 许志伟, 等. 基于全局密度更新策略的两阶段多模态多目标进化算法. 中国科学: 信息科学, 2024, 54(10): 2385-2408, doi: 10.1360/SSI-2022-0294
Juanjuan HE, Qian YANG, Zhiwei XU, et al. Two-stage multimodal multi-objective evolutionary algorithm based on global density updating strategy. Sci Sin Inform, 2024, 54(10): 2385-2408, doi: 10.1360/SSI-2022-0294

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 0

正线性约束组合优化问题的非自回归学习求解

汪润中, 郦洋, 严骏驰, 杨小康
中国科学: 信息科学, 2024, 54(10): 2368-2384

摘要 组合优化问题的求解是计算机科学、应用数学等学科共同研究的基础性问题.其固有的计算复杂性为精确求解带来了挑战.而采用深度神经网络进行求解已经成为一个前沿的研究方向.本文设计了一种能够求解正线性约束组合优化问题的非自回归式神经网络.本文方法的优势在于,正线性约束代表了一大类组合优化问题,突破了现有非自回归网络的通用性瓶颈;与目前常用的自回归网络相比,非自回归网络具有高效性、排列不变性等优势;在神经网络框架中,本文采用的离线无监督学习对标注的需求低,无需求解最优解进行监督训练;本文提出的在线可微分搜索方法显著提升了神经网络求解器的泛化能力.本文在设施布局、最大集合覆盖、旅行商问题等代表性的组合优化问题中验证了非自回归求解器的有效性.特别是在综合考虑求解效率和求解效果时,非自回归网络求解器持平甚至超越了SCIP, Gurobi等开源或者商用的主流传统求解软件.

关键词 组合优化; 深度学习; 非自回归网络; 图神经网络; 梯度优化; combinatorial optimization; deep learning; non-autoregressive neural network; graph neural network; gradient-based optimization

引用格式 汪润中, 郦洋, 严骏驰, 等. 正线性约束组合优化问题的非自回归学习求解. 中国科学: 信息科学, 2024, 54(10): 2368-2384, doi: 10.1360/SSI-2023-0269
Runzhong WANG, Yang LI, Junchi YAN, et al. Learning to solve combinatorial optimization under positive linear constraints via non-autoregressive neural networks. Sci Sin Inform, 2024, 54(10): 2368-2384, doi: 10.1360/SSI-2023-0269

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 0

基于高阶图融合的多视图聚类算法

尤运宁, 唐厂, 刘新旺, 邹鑫, 刘袁缘, 蒋良孝, 张长青
中国科学: 信息科学, 2024, 54(9): 2098-2115

摘要 基于图的多视图聚类算法通过探索样本点之间的邻近关系,受到了广泛的关注.尽管在实际应用中已经取得了较好的聚类性能,但是观察到大多数算法只是利用一阶邻近关系去构建相似图,这导致信息探索不足和多视图数据表征能力下降.为了解决这个挑战,本文提出了一种新颖的基于高阶图融合的多视图聚类算法(high-order graph fusion for multi-view clustering, HCDMC).具体地,所提出的算法通过一种新颖的隐式权重学习策略,从每个视图对应的一阶和二阶邻近图中学习相应的高阶图.引入希尔伯特–施密特(Hilbert-Schmidt)独立性准则作为一种差异性正则化项,旨在加强一致性高阶图的互补信息.最后,对学习到的一致性高阶图施加连通性约束,直接得到聚类标签矩阵,无需任何后处理步骤.使用交替方向乘子法去解决模型的优化问题.在6个真实的数据集上进行了一系列的实验,相较于最新的算法,本文提出的算法具有更好的聚类性能.

关键词 多视图聚类; 高阶图; 图结构学习; 图融合; 差异性正则化; multi-view clustering; high-order graph; graph structure learning; graph fusion; diversity regularization

引用格式 尤运宁, 唐厂, 刘新旺, 等. 基于高阶图融合的多视图聚类算法. 中国科学: 信息科学, 2024, 54(9): 2098-2115, doi: 10.1360/SSI-2023-0217
Yunning YOU, Chang TANG, Xinwang LIU, et al. High-order graph fusion for multi-view clustering. Sci Sin Inform, 2024, 54(9): 2098-2115, doi: 10.1360/SSI-2023-0217

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 0

社会大数据跨尺度系统学习理论与方法

郑志明, 吕金虎, 王亮, 鲁仁全, 崔鹏, 王鑫, 韦卫
中国科学: 信息科学, 2024, 54(9): 2083-2097

摘要 以GPT-4为代表的AI大模型时代正加速而至,深刻改变着社会生活的方方面面.大模型巨参数深度学习是破解复杂大数据智能学习瓶颈的一种有效途径.大模型在展现出强大学习能力的同时也面临着高能耗、大算力挑战.研究表明,平均一个AI大模型训练产生的能耗约等于五辆汽车一生排放的碳总量,驱动AI大模型所需算力每3.5个月翻一番.作为一种有益的补充,内嵌规律的跨尺度系统学习是破解复杂大数据智能学习瓶颈的另一种有效途径.跨尺度系统学习已经在某些专业领域展现出了巨大的成功,如2021年诺贝尔物理学奖授予复杂物理系统跨尺度建模及其在全球气候变暖中的应用.事实上,我国科学家甚至更早开拓了复杂系统跨尺度学习研究,如北京航空航天大学暗物质大数据分析团队利用跨尺度系统学习方法实现了在PB级数据中实时学习KB级关键数据,精度达到万分之一.本文从微观尺度、介观尺度和宏观尺度上分析了跨尺度系统学习的基本原理,构建了内嵌规律跨尺度系统学习的普适方法,并以社会大数据为例开展了典型应用示范.社会大数据跨尺度系统学习应用于疫情防控、舆情分析等领域,并取得显著成效,为我国社会治理数字化、网络化、智能化发展提供了新的成功样本.

关键词 人工智能; 大模型; 跨尺度系统学习; 社会大数据; 可解释性; artificial intelligence; large models; cross-scale systematic learning; social big data; interpretability

引用格式 郑志明, 吕金虎, 王亮, 等. 社会大数据跨尺度系统学习理论与方法. 中国科学: 信息科学, 2024, 54(9): 2083-2097, doi: 10.1360/SSI-2023-0408
Zhiming ZHENG, Jinhu LÜ, Liang WANG, et al. Cross-scale systematic learning for social big data: theory and methods. Sci Sin Inform, 2024, 54(9): 2083-2097, doi: 10.1360/SSI-2023-0408

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 0

一种求解偏微分方程的动态平衡物理信息神经网络

邓书超, 宋孝天, 钟旻霄, 李庆, 孙亚楠, 吕建成
中国科学: 信息科学, 2024, 54(8): 1843-1859

摘要 近年来,物理信息神经网络(physics-informed neural networks, PINNs)在求解非线性偏微分方程(partial differential equations, PDEs)中得到了大量应用. PINN将物理信息作为正则化约束加入神经网络损失函数,可以减少传统神经网络方法对训练数据的大量依赖.然而, PINN无法根据数据变化动态调整损失函数中各个损失项的权重,导致其在求解非线性PDEs时存在求解误差较大的问题.为此,本文提出了一种动态平衡物理信息神经网络(dynamic balanced PINN, DBPINN).首先,DBPINN为PINN损失函数的各个损失项设计了一种动态权重系数,并使用随机函数对该系数进行动态更新,能够显著提升PINN的精度.其次, DBPINN为PNNN损失函数的各个损失项之间建立了一种平衡求和方法,该方法考虑了所有损失项之间的竞争关系,使得PINN各损失项朝着有利于收敛的方向进行优化. DBPINN通过动态权重系数和平衡求和方法使得PINN可以更好地进行优化,进而解决了PINN在实际应用中求解误差较大的问题.本文选择了科学机器学习领域中4个经典的非线性PDEs对DBPINN进行了数值验证和分析.实验结果表明,相比于PINN, DBPINN在Schrodinger和Allen-Cahn方程上误差分别降低了46%和64%. DBPINN在求解Navier-Stokes方程时将系数λ1和λ2的误差分别降低了1~2个数量级和约50%. DBPINN在KdV方程中能够在多项系数中将误差降低1个数量级.最后,本文在多种形式的Burgers方程和Allen-Cahn方程上进行性能和参数消融验证,结果表明DBPINN不仅能够提升模型性能、处理小数据量以及拟合不同时间状态下的方程的能力,而且DBPINN相比于PINN具有更好的稳定性、准确率以及收敛性. DBPINN可以取代PINN被应用于各种非线性PDEs的高精度求解.

关键词 物理信息神经网络; 非线性偏微分方程; 动态权重系数; 平衡求和方法; 科学机器学习; physics-informed neural networks; nonlinear partial differential equations; dynamic weight coefficients; balanced summation method; scientific machine learning

引用格式 邓书超, 宋孝天, 钟旻霄, 等. 一种求解偏微分方程的动态平衡物理信息神经网络. 中国科学: 信息科学, 2024, 54(8): 1843-1859, doi: 10.1360/SSI-2023-0195
Shuchao DENG, Xiaotian SONG, Minxiao ZHONG, et al. A dynamic balanced physics-informed neural network for solving partial differential equations. Sci Sin Inform, 2024, 54(8): 1843-1859, doi: 10.1360/SSI-2023-0195

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 1

人工智能伦理计算

高漪澜, 张睿, 李学龙
中国科学: 信息科学, 2024, 54(7): 1646-1676

摘要 人工智能技术作为试图研究、模仿、扩展人类智能的科学研究领域,自诞生以来就伴随着深刻的技术伦理争辩.随着近年来机器学习等相关工作的突破性进展和快速落地应用,伦理问题日趋显著并迫使学界和社会开始直面该技术的伦理治理挑战.尽管在伦理治理的规范研究上已取得初步进展,其治理实践落地方面依然困难重重,伦理实践表现出逐渐落后于技术发展需求的趋势.因此,建立与不断发展的人工智能技术相互匹配的伦理治理实践方案,实现治理理论和治理实践的良性互动将是人工智能领域未来发展的关键问题.伦理治理理论的抽象性导致了当下人工智能伦理原则难以落地实现,人工智能伦理计算(AI ethical computation)将是应对这一挑战的重要方案.本研究通过探讨现实必要性和发展可能性明确了伦理计算的重要意义,在相关研究基础上给出伦理计算的研究范畴,依据计算过程对伦理机理的认知程度和系统伦理决策的自主化程度进行划分,建立了伦理计算的高阶认知与低阶认知两类研究范式,并按其计算阶段抽象出伦理度量、伦理决策和伦理推理3个计算层次.该伦理计算框架能够对当前的伦理计算应用进行梳理,本文以伦理嵌入和公平机器学习为例说明了两类研究范式的研究特点和技术方法.在此基础上,进一步讨论构建了以伦理计算为核心的伦理治理体系,分析通过伦理计算化解伦理治理困境的可能方案,并对人工智能伦理计算的发展做出展望.

关键词 人工智能; 伦理问题; 伦理治理; 伦理计算; 伦理嵌入; 公平机器学习; artificial intelligence; ethics issues; ethical governance; ethical computation; ethical embedding; fair machine learning

引用格式 高漪澜, 张睿, 李学龙. 人工智能伦理计算. 中国科学: 信息科学, 2024, 54(7): 1646-1676, doi: 10.1360/SSI-2023-0076
Yilan GAO, Rui ZHANG, Xuelong LI. Artificial intelligence ethical computation. Sci Sin Inform, 2024, 54(7): 1646-1676, doi: 10.1360/SSI-2023-0076

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 1

面向大规模数据的高效超图神经网络

吉书仪, 魏宇轩, 戴琼海, 高跃
中国科学: 信息科学, 2024, 54(4): 853-871

摘要 高阶关联广泛存在于现实世界中,如社交网络、生物网络、交通网络等,建模及优化高阶关联对于网络属性研究和演化趋势预测具有重要意义.超图是一种灵活的数据结构,能够自然地建模高阶关联.近年来,随着深度学习的发展,基于超图建模的超图神经网络被广泛应用于面向高阶关联的表示学习.然而,现有的超图神经网络均基于直推学习范式,虽然在小规模超图数据集上取得了不错的效果,但难以应用到大规模数据上,限制了其应用范围.本文首先分析了现有超图神经网络方法在大规模数据上应用的挑战,然后针对该问题提出了面向大规模数据的高效超图神经网络方法 (efficient hypergraph neural network, EHGNN).针对现有方法空间、时间复杂度过高的问题, EHGNN分别设计了超图采样模块和基于单阶段超图卷积的计算加速模块,同时降低了超图神经网络的空间开销和时间开销,使得超图神经网络适用于大规模超图数据,显著增强了可扩展性.在4个真实超图数据集上的实验结果验证了EHGNN的有效性和高效性.

关键词 超图计算; 超图神经网络; 高阶关联; 大规模数据; 节点分类; hypergraph computation; hypergraph neural network; high-order correlation; large-scale data; vertex classification

引用格式 吉书仪, 魏宇轩, 戴琼海, 等. 面向大规模数据的高效超图神经网络. 中国科学: 信息科学, 2024, 54(4): 853-871, doi: 10.1360/SSI-2022-0379
Shuyi JI, Yuxuan WEI, Qionghai DAI, et al. Efficient hypergraph neural network on million-level data. Sci Sin Inform, 2024, 54(4): 853-871, doi: 10.1360/SSI-2022-0379

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 0

深度ReLU神经网络的万有一致性

刘霞, 王迪
中国科学: 信息科学, 2024, 54(3): 638-652

摘要 随着数据量爆炸式增长、计算资源愈加丰富,浅层神经网络并不总能满足时代需求,从而导致深度神经网络的出现.深度神经网络的迅猛发展主要体现在应用领域,其理论研究相对匮乏.基于此,本文聚焦研究深度ReLU神经网络的万有一致性,具体内容包括:首先,是否存在一个具有统一结构的深度神经网络(即深度、宽度、激活函数等均已确定)使得该深度神经网络可以学习更多特征,并具有万有逼近性;其次,针对已确定的深度神经网络模型,证明其是强万有一致的;最后,从实验的角度验证理论结果的合理性.

关键词 深度神经网络; 万有一致性; 深度学习; ReLU 函数; 逼近性; deep neural networks; universal consistency; deep learning; ReLU function; approximation

引用格式 刘霞, 王迪. 深度ReLU神经网络的万有一致性. 中国科学: 信息科学, 2024, 54(3): 638-652, doi: 10.1360/SSI-2022-0401
Xia LIU, Di WANG. Universal consistency of deep ReLU neural networks. Sci Sin Inform, 2024, 54(3): 638-652, doi: 10.1360/SSI-2022-0401

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 2

稳健选择伪标注的混合式半监督学习

郭兰哲, 李宇峰
中国科学: 信息科学, 2024, 54(3): 623-637

摘要 半监督学习旨在数据标注缺乏的情形下利用无标注数据提升学习性能,是重要的机器学习范式.尽管不少研究报道表明半监督学习取得了优异的性能表现,然而其在面临诸多实践任务时仍存在伪标注质量判断困难、超参数选择敏感、理论指导缺乏等瓶颈.针对上述挑战,本文提出一种稳健选择伪标注的混合式半监督学习方法,通过综合利用模型预测结果之间的分歧自适应地判断伪标注质量,无需预设超参数,显著提升了半监督学习的稳健性.本文在理论上证明了新方法的错误率随训练轮数的增加而显著下降.实验验证了本文方法较主流技术取得了明显的性能提升,例如,相较于在CIFAR-10数据集中表现最优的半监督学习技术FixMatch,新方法的分类错误率下降了11%以上,在更具挑战的STL-10数据集中分类错误率下降了18.8%.

关键词 机器学习; 深度学习; 半监督学习; 伪标注; 稳健性; machine learning; deep learning; semi-supervised learning; pseudo-label; robust

引用格式 郭兰哲, 李宇峰. 稳健选择伪标注的混合式半监督学习. 中国科学: 信息科学, 2024, 54(3): 623-637, doi: 10.1360/SSI-2022-0421
Lanzhe GUO, Yufeng LI. Robust pseudo-label selection for holistic semi-supervised learning. Sci Sin Inform, 2024, 54(3): 623-637, doi: 10.1360/SSI-2022-0421

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 0

基于混合比例估计的标签噪声学习方法

郑庆华, 曹书植, 阮建飞, 赵锐, 董博
中国科学: 信息科学, 2024, 54(3): 603-622

摘要 近年来,人工智能蓬勃发展,伴随着计算硬件算力的提升,深度学习已成为了人工智能算法的新范式.然而深度学习依赖大量精确标注的数据,在现实的多类别分类场景中,受限于标注成本和隐私数据保护等因素,大量精准标注的数据往往难以获得.近些年,移动众包和网络爬虫这类经济廉价的数据收集方法被广泛采用,但他们不可避免地引入了错误标注,即标签噪声.鉴于深度神经网络强大的数据拟合能力,标签噪声的存在将造成算法的过拟合,严重制约了深度学习方法的泛化能力.针对标签噪声问题,现有研究大多显式或隐式地依赖锚点(明确属于某一类别的样本),然而在现实场景中锚点难以获取,这使得现有解决方案不再适用.为解决这一问题,本文创造性地将多类别标签噪声学习问题转化为混合比例估计(mixture proportion estimation, MPE)问题,构建了一种不依赖锚点的满足统计一致性的学习算法.本文的主要贡献包括:(1)对现有的仅适用于二组成物MPE场景的R-MPE(regrouping-MPE)方法进行推广,提出了多组成物场景下不依赖不可约假设的MPE方法 MR-MPE(multi-component oriented R-MPE);(2)理论上证明了多类别分类场景下标签噪声学习算法锚点假设和MPE问题不可约假设的等价性,并基于所提出的MR-MPE方法构建了不依赖锚点的满足统计一致性的算法.本文在合成噪声数据集和真实噪声数据集上分别与现有算法进行了对比实验,结果显示本文所提算法在多个数据集上均展现出了最优的性能;同时,在移除锚点的情况下,本文对算法的鲁棒性进行了测试,验证了所提算法不依赖锚点的特性.

关键词 混合比例估计; 多类别分类; 标签噪声学习; 锚点; 不可约假设; 统计一致性; mixture proportion estimation; multi-class classification; label-noise learning; anchor point; irreducible assumption; statistical consistency

引用格式 郑庆华, 曹书植, 阮建飞, 等. 基于混合比例估计的标签噪声学习方法. 中国科学: 信息科学, 2024, 54(3): 603-622, doi: 10.1360/SSI-2023-0126
Qinghua ZHENG, Shuzhi CAO, Jianfei RUAN, et al. Label-noise learning via mixture proportion estimation. Sci Sin Inform, 2024, 54(3): 603-622, doi: 10.1360/SSI-2023-0126

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 0

缓解随机一致性的基尼指数与决策树方法

王婕婷, 李飞江, 李珏, 钱宇华, 梁吉业
中国科学: 信息科学, 2024, 54(1): 159-190

摘要 决策树模型具有较强的可解释性,是随机森林、深度森林等机器学习方法的基础.如何选择节点的分割属性与分割值是决策树算法的关键问题,对树的泛化能力、深度、平衡程度等重要性能产生影响.传统属性选择准则的定义大多基于凹函数,使得决策树算法存在多值偏向问题,即倾向于选择取值种类多的属性作为节点分割属性.已有研究表明缓解随机一致性的评价准则能够降低分类偏差与类簇个数偏向.本文将基于标准化框架缓解基尼指数的随机一致性,以此缓解其多值偏向问题.通过人造数据集验证,标准基尼指数能够缓解基尼指数的多值偏向问题,并且选择出具有决策信息的属性.通过12个基准数据集与两个图像数据集的实验验证,基于标准基尼指数的决策树算法比现有缓解多值偏向的决策树算法具有较高的泛化性能.

关键词 基尼指数; 多值偏向; 决策树; 随机一致性; Gini index; bias to multi-value; decision tree; random consistency

引用格式 王婕婷, 李飞江, 李珏, 等. 缓解随机一致性的基尼指数与决策树方法. 中国科学: 信息科学, 2024, 54(1): 159-190, doi: 10.1360/SSI-2022-0337
Jieting WANG, Feijiang LI, Jue LI, et al. Gini index and decision tree method with mitigating random consistency. Sci Sin Inform, 2024, 54(1): 159-190, doi: 10.1360/SSI-2022-0337

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 0

面向标签噪声的联合训练框架

魏琦, 孙皓亮, 马玉玲, 尹义龙
中国科学: 信息科学, 2024, 54(1): 144-158

摘要 当前面向标签噪声的鲁棒性学习通常依赖样本选择和标签修正两种策略,但是这两类方法均存在缺陷.基于样本选择的方法忽略了被过滤掉的样本中的有效信息,进而降低了模型的性能.基于标签修正的方法常使用自标签技术而引起模型的错误积累问题.对此,本文提出了一个集成样本选择、标签修正的联合训练框架.针对样本选择模块,本文设计了一种新的选择标准,通过在线选择的方法对所挑选的样本集合进行更新.相较于现有选择标准,本文提出的标准可保留更多边界样本,提升了模型对决策边界的学习性能,增强了模型的泛化性能.针对标签修正模块,本文提出了一种联合标签修正策略.相比于传统的自标签修正技术,该模块通过联合特征空间视角,对噪声样本进行多视角的标签修正,解决了传统自标签技术的错误累积问题.此外,本文引入对比学习正则化项,提升了标签修正效果和模型表征学习能力.本文方法在4个测试基准上取得了当前最好分类效果,验证了所提训练框架的有效性.

关键词 标签噪声学习; 样本选择; 标签修正; 对比学习; learning with noisy labels; sample selection; label correction; contrastive learning

引用格式 魏琦, 孙皓亮, 马玉玲, 等. 面向标签噪声的联合训练框架. 中国科学: 信息科学, 2024, 54(1): 144-158, doi: 10.1360/SSI-2022-0395
Qi WEI, Haoliang SUN, Yuling MA, et al. A joint training framework for learning with noisy labels. Sci Sin Inform, 2024, 54(1): 144-158, doi: 10.1360/SSI-2022-0395

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 0

基于专家知识的主动因果效应辨识

王天佐, 周志华
中国科学: 信息科学, 2023, 53(12): 2341-2354

摘要 因果效应定量描述变量间的影响作用,在许多现实任务中发挥着重要作用.辨识因果效应需要依赖已知的因果关系.一种确定因果关系的主流方法是引入干预信息,即通过人为干预某些因素而获取的信息.鉴于实际干预通常会带来巨大的成本,本文提出利用易于获取的专家知识替代干预,通过设计形如“在XX干预下,目标变量的值相较不干预时增大还是减小?”的问题并向专家咨询,确定因果关系,进而辨识因果效应.尽管每次专家返回的信息量少于干预信息,但通过一定次数的咨询,本文方法可以达到与使用干预信息方法相近的因果效应辨识效果.实验验证了上述结论.

关键词 因果效应辨识; 因果关系; 人机交互; 专家知识; causal effect identification; causal relation; human-in-the-loop; expert knowledge

引用格式 王天佐, 周志华. 基于专家知识的主动因果效应辨识. 中国科学: 信息科学, 2023, 53(12): 2341-2354, doi: 10.1360/SSI-2022-0390
Tian-Zuo WANG, Zhi-Hua ZHOU. Active causal effect identification with expert knowledge. Sci Sin Inform, 2023, 53(12): 2341-2354, doi: 10.1360/SSI-2022-0390

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 0

面向多维分类的监督式降维

贾彬彬, 张敏灵
中国科学: 信息科学, 2023, 53(12): 2325-2340

摘要 与传统多类分类相比,多维分类中每个对象仍由一个示例(特征向量)表示,但同时与多个类别变量相关联,各类别变量基于异构类别空间刻画对象的语义.降维可以有效地缓解维度灾难并加速模型训练,已有多维分类研究均关注于设计性能更好的学习算法,尚未出现面向多维分类数据降维方面的工作.本文基于特征空间和语义空间的相关性,首次面向多维分类数据设计了一种名为SDeM的监督式线性降维方法.该方法使用Hilbert-Schmidt独立判据衡量两个空间的相关性,通过最大化投影特征空间与语义空间在该度量下的相关性确定投影矩阵.实验结果表明,相比于无监督式降维方法,SDeM所得降维特征更有利于多维分类方法取得更好的泛化性能.

关键词 机器学习; 多维分类; 降维; 空间相关性; Hilbert-Schmidt独立准则; machine learning; multi-dimensional classification; dimensionality reduction; dependence between spaces; Hilbert-Schmidt independence criterion

引用格式 贾彬彬, 张敏灵. 面向多维分类的监督式降维. 中国科学: 信息科学, 2023, 53(12): 2325-2340, doi: 10.1360/SSI-2022-0363
Bin-Bin JIA, Min-Ling ZHANG. Supervised dimensionality reduction for multi-dimensional classification. Sci Sin Inform, 2023, 53(12): 2325-2340, doi: 10.1360/SSI-2022-0363

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 0

基于自监督的端到端图数据异常检测方法

张震, 刘美含, 李朝, 卜佳俊
中国科学: 信息科学, 2023, 53(11): 2202-2213

摘要 异常检测旨在发掘数据中异于寻常的模式,它在金融欺诈以及网络入侵检测等领域有着广泛的应用前景.本文主要研究了如何在结构复杂的图数据中进行异常检测,这涉及到挖掘异常的图结构信息以及节点属性信息.现有大部分工作通常采用一个两步的框架,即先对结构复杂的图数据进行表征学习生成图表征向量,然后再将该向量用于下游异常检测任务.由于分开训练的图表征学习任务与下游异常检测任务存在一定的语义鸿沟,这导致现有方法无法有效地挖掘出图中潜在的异常模式.因此,我们提出了一种基于自监督的端到端图数据异常检测框架SGAD,它可以有效地捕获图数据的语义信息并用于异常检测.具体来说, SGAD对无标签图数据进行了一系列变换用于构建自监督辅助任务,然后该自监督任务的输出结果可以直接用于异常检测.我们在多个公开数据集上进行了大量实验,实验结果表明本文提出的SGAD与现有方法相比获得了显著的效果提升.

关键词 图结构数据; 异常检测; 自监督学习; 图神经网络; 图表征学习; graph-structured data; anomaly detection; self-supervised learning; graph neural network; graph representation learning

引用格式 张震, 刘美含, 李朝, 等. 基于自监督的端到端图数据异常检测方法. 中国科学: 信息科学, 2023, 53(11): 2202-2213, doi: 10.1360/SSI-2022-0179
Zhen ZHANG, Meihan LIU, Zhao LI, et al. Self-supervised end-to-end graph level anomaly detection. Sci Sin Inform, 2023, 53(11): 2202-2213, doi: 10.1360/SSI-2022-0179

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 0

联邦无监督跨模态哈希

朱磊, 李京智, 王天时, 李晶晶, 张化祥
中国科学: 信息科学, 2023, 53(11): 2180-2201

摘要 联邦跨模态检索利用分散的客户端学习一个共享跨模态检索模型,从而降低集中大规模多模态训练数据时高昂的维护成本,解决分布式数据存储场景下跨模态检索中存在的数据隐私问题.然而现有的联邦跨模态检索方法大多依赖于大量的语义标注,这限制了检索模型在大规模应用场景下的扩展性.与之不同,本文提出一种无监督的联邦跨模态哈希检索模型,旨在保护客户端数据隐私的前提下,学习不依赖语义标注的跨模态检索模型.由于联邦环境中多模态数据分布不平衡,局部信息不足以让模型学习到整体数据上的模态间相似性,从而影响检索性能.为解决此问题,本文提出一个全局–局部模态间对比正则化方法,通过使用不同模态的全局哈希模型对单个模态的局部哈希模型进行约束,使局部哈希模型能够充分感知整体数据的相似性语义,从而加强对本地跨模态哈希学习过程的引导.同时,本文引入一种全局–局部模态内知识蒸馏策略来进一步地获取模态内特有的全局知识.5个基准跨模态检索数据集上的实验结果验证了本文提出方法的有效性.

关键词 联邦学习; 多模态学习; 无监督学习; 跨模态检索; 无监督跨模态哈希; federated learning; multimodal learning; unsupervised learning; cross-modal retrieval; unsupervised cross-modal Hashing

引用格式 朱磊, 李京智, 王天时, 等. 联邦无监督跨模态哈希. 中国科学: 信息科学, 2023, 53(11): 2180-2201, doi: 10.1360/SSI-2022-0366
Lei ZHU, Jingzhi LI, Tianshi WANG, et al. Federated unsupervised cross-modal Hashing. Sci Sin Inform, 2023, 53(11): 2180-2201, doi: 10.1360/SSI-2022-0366

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 0

基于堆叠式对抗变分循环神经网络的多维时间序列异常检测

陈文超, 方博为, 代良, 陈渤, 刘畅, 赵小楠
中国科学: 信息科学, 2023, 53(9): 1750-1767

摘要 为了建模多维时间序列(multivariate time series, MTS)中复杂的时序依赖性与随机性,并实现对它的无监督异常检测这一工业机器或互联网基础设施设备质量管理中的关键任务,本文提出了一种堆叠式对抗变分循环神经网络(stacked adversarial variational recurrent neural network, SaVRNN).SaVRNN是一个层次化概率动态模型,它将层次化概率生成模型、堆叠式循环结构和多层对抗优化方式整合到一个联合贝叶斯框架下.具体来说, SaVRNN核心思想是利用堆叠循环结构捕捉多层次与长距离的时序相关性,利用层次化的概率生成操作建模多层的结构特性,进而实现对多维时间序列正常模式的学习,最后通过重构的概率来判断异常模式.为了实现模型的高效推理,本文创新性地提出了一种向上–向下对抗变分推理方案,实现对隐层变量后验的准确估计.针对多层对抗网络中难以实现生成器与判别器的更新平衡导致的SaVRNN训练困难的问题,本文基于条件传输(conditional transport,CT)提出了一个新的优化方法.最后,基于Sa VRNN的层次化结构,本文将多层似然进行融合以改进传统的异常检测策略.在两个公共数据集和一个实测数据集上显示所提方法在F1-score指标上实现了相比目前主流方法的更优性能,证明了所提模型在时间序列在线异常检测任务上的有效性.

关键词 异常检测; 多维时间序列; 对抗变分贝叶斯; 变分循环神经网络; 条件传输; anomaly detection; multivariate time series; adversarial variational Bayesian; variational RNN; conditional transport

引用格式 陈文超, 方博为, 代良, 等. 基于堆叠式对抗变分循环神经网络的多维时间序列异常检测. 中国科学: 信息科学, 2023, 53(9): 1750-1767, doi: 10.1360/SSI-2022-0277
Wenchao CHEN, Bowei FANG, Liang DAI, et al. Stacked adversarial variational recurrent neural network for anomaly detection of multivariate time series. Sci Sin Inform, 2023, 53(9): 1750-1767, doi: 10.1360/SSI-2022-0277

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 7

基于模糊密度峰值聚类的区域同位模式并行挖掘算法

蒋希文, 王丽珍, Vanha TRAN
中国科学: 信息科学, 2023, 53(7): 1281-1298

摘要 区域同位模式挖掘(RCPM, regional co-location pattern mining)是为了发掘某个局部区域内存在的同位(co-location)模式,以发现在全局中无法发现的信息.传统的区域挖掘大多会采用明确界限的几何体框定同位模式产生的区域.但是现实中的各类区域可能是无明确边界的.另外,数据的分布情况作为区域的重要特征之一,也应该成为区域选择的因素.基于上述思考,本文引入密度峰值聚类(DPC, density peak-based clustering),提出新的密度度量函数,并结合模糊集理论与k近邻距离,设计了一个行之有效的并行区域同位模式挖掘算法.实验结果表明,利用本文方法挖掘到的结果更具有现实意义,并且并行化极大地提升了挖掘算法的效率.在真实数据上, 2线程下的加速比达到了1.89.

关键词 空间数据挖掘; 区域同位模式; 模糊密度峰值聚类; 并行算法; k近邻; spatial data mining; regional co-location pattern; fuzzy density peak clustering; parallel algorithm; k-nearest neighbor;

引用格式 蒋希文, 王丽珍, Vanha TRAN. 基于模糊密度峰值聚类的区域同位模式并行挖掘算法. 中国科学: 信息科学, 2023, 53(7): 1281-1298, doi: 10.1360/SSI-2022-0004
Xiwen JIANG, Lizhen WANG, Vanha TRAN. A parallel algorithm for regional co-location mining based on fuzzy density peak clustering. Sci Sin Inform, 2023, 53(7): 1281-1298, doi: 10.1360/SSI-2022-0004

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 2

一种基于偏差-方差权衡的贝叶斯分类学习框架

张文钧, 蒋良孝, 张欢, 胡成玉
中国科学: 信息科学, 2023, 53(6): 1078-1095

摘要 朴素贝叶斯由于其简单、高效和有效性成为十大数据挖掘算法之一.然而它要求的属性条件独立假设在实际应用中很难成立.为了削弱其属性条件独立假设,学者们提出了结构扩展、属性选择、属性加权、实例选择、实例加权5类改进方法.现有改进方法虽然在一定程度上降低了模型的偏差,但同时也提高了模型的方差,因而限制了模型的泛化性能.偏差–方差权衡是机器学习的核心原则之一,该原则要求模型具有较低偏差的同时,方差也要尽量低.如何在贝叶斯分类学习中引入偏差–方差权衡,同时获得较低的偏差和方差,从而进一步提升模型的泛化性能,是本文关注的重点.为此,本文首先理论分析了在贝叶斯分类学习中做偏差–方差权衡的可行性,探讨了保证可行性的关键因素;然后通过构建回归任务来学习贝叶斯分类模型的后验概率损失,调控关键因素的变化;最后提出了一种基于偏差–方差权衡的贝叶斯分类学习框架,并在提出的学习框架下重新实现了朴素贝叶斯及其各类改进模型.在大量经典的UCI标准数据集上的实验结果表明,现有的各类先进的贝叶斯分类模型在本文所提学习框架下的分类性能显著优于其原始性能.

关键词 朴素贝叶斯; 属性条件独立假设; 偏差 – 方差权衡; 后验概率损失; 学习框架; naive Bayes; attribute conditional independence assumption; bias–variance trade-off; posterior probability loss; learning framework;

引用格式 张文钧, 蒋良孝, 张欢, 等. 一种基于偏差-方差权衡的贝叶斯分类学习框架. 中国科学: 信息科学, 2023, 53(6): 1078-1095, doi: 10.1360/SSI-2022-0025
Wenjun ZHANG, Liangxiao JIANG, Huan ZHANG, et al. Bayesian classification learning framework based on bias–variance trade-off. Sci Sin Inform, 2023, 53(6): 1078-1095, doi: 10.1360/SSI-2022-0025

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 0

硬件感知的神经架构搜索

王鑫, 姚洋, 蒋昱航, 关超宇, 朱文武
中国科学: 信息科学, 2023, 53(5): 899-917

摘要 深度神经网络(deep neural networks, DNNs)能否取得令人满意的性能很大程度上依赖于其神经网络架构.研究人员提出神经网络架构搜索(neural architecture search, NAS)来自动搜索神经网络的最优架构,现有的工作大多使用每秒浮点运算次数(floating point operations per second, FLOPs)来评价神经网络架构的实际效率,但是FLOPs和实际延迟并不是完全一致的.随着任务变得越来越复杂以及越来越多的硬件平台开始运行基于深度神经网络的算法,为硬件平台搜索高效的神经网络架构已成为亟待解决的难题.为了解决这一问题,本文提出了硬件感知的搜索空间构造方法,并借助考虑架构推断延迟的搜索策略,来搜索最优的神经网络架构.本文在可变换神经网络架构搜索方法(transformable architecture search, TAS)和图神经网络架构搜索方法 (graph neural architecture search, GraphNAS)上应用了该方法,提出了硬件可感知的可变换神经网络架构搜索方法 (hardwareaware transformable architecture search, HTAS)和硬件感知的图神经网络架构搜索方法 (hardwareaware graph neural architecture search, HGNAS).相比于现有方法,本文所提出的这两种算法在多种数据集上均针对不同类型目标硬件搜索出了更加高效的深度神经网络架构,从而证明了该方法的有效性.

关键词 深度学习; 神经网络架构搜索; 可变换神经网络架构搜索; 图神经网络架构搜索; 硬件感知; deep learning; neural architecture search; transformable architecture search; graph neural architecture search; hardware-aware;

引用格式 王鑫, 姚洋, 蒋昱航, 等. 硬件感知的神经架构搜索. 中国科学: 信息科学, 2023, 53(5): 899-917, doi: 10.1360/SSI-2021-0446
Xin WANG, Yang YAO, Yuhang JIANG, et al. Hardware-aware neural architecture search. Sci Sin Inform, 2023, 53(5): 899-917, doi: 10.1360/SSI-2021-0446

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 0

卷积效力评价机制驱动的深度神经网络全局剪枝

周成, 李军华, 黎明, 张聪炫, 蔡昊
中国科学: 信息科学, 2023, 53(5): 878-898

摘要 模型剪枝被广泛应用于深度神经网络(deep neural network, DNN)的压缩与加速,为资源受限的终端设备部署DNN提供了技术支持.然而以往的剪枝研究缺乏对卷积核效力机制的有效评估,同时忽视了压缩空间中多种不可控因素的潜在干扰.因此本文提出一种卷积效力评价机制驱动的DNN全局剪枝方法,在特征图信息丰富度的基础上,以可视化的方式评估卷积核的效力值,优化了卷积核选择机制.同时探索了压缩空间中卷积结构的效力相关性,并在不同卷积层中使用不同的剪枝标准.首先,本文通过离散傅里叶变换(discrete Fourier transform, DFT)对特征图的信息度进行定量分析,并提出一种评估卷积核效力值的数据驱动方法.然后,基于卷积结构的相关性,引入损失因子以度量剪枝过程中剩余压缩单元的效力损失.最后根据层索引值的变化,在不同结构的功能层中自适应修正剪枝标准.实验表明,相比于最新的剪枝策略,本文的剪枝方法具有更佳的压缩性能和模型优化能力.

关键词 深度神经网络压缩; 模型剪枝; 重要度评估; 损失因子; 特征图信息度; deep neural network compression; model pruning; significance evaluation; loss factor; informativeness of feature map;

引用格式 周成, 李军华, 黎明, 等. 卷积效力评价机制驱动的深度神经网络全局剪枝. 中国科学: 信息科学, 2023, 53(5): 878-898, doi: 10.1360/SSI-2022-0021
Cheng ZHOU, Junhua LI, Ming LI, et al. Global pruning of deep neural networks driven by convolutional effectiveness evaluation mechanism. Sci Sin Inform, 2023, 53(5): 878-898, doi: 10.1360/SSI-2022-0021

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 1

知识图谱驱动的图卷积神经网络谣言检测模型

徐凡, 李明昊, 黄琪, 鄢克雨, 王明文, 周国栋
中国科学: 信息科学, 2023, 53(4): 663-681

摘要 社交媒体谣言以极低的成本在互联网中被快速扩散,给社会带来显著的负面影响.传统的谣言检测模型主要考虑传播模式、写作风格、用户信用和世界知识等信息.然而,谣言的传播模式通常难以被捕捉,写作风格却容易被模仿,由元数据(如职业、家乡、学历、年龄等)构成的用户信息也容易被伪造.本文提出了一种新颖的知识驱动的图卷积神经网络谣言检测模型.该模型首先将社交媒体文本表示成一种语义–实体无向图结构,其中节点包含原社交媒体文本中的词语,利用世界知识库扩展的实体词语,以及利用语言知识库扩展的语义词语,边包含三类节点的6种有效组合.该语义–实体图可以有效地增强任意两种节点的共现性,从而丰富了原社交媒体文本的表示,从一定程度上缓解数据稀疏共现问题.语言知识利用了HowNet (义原和同义词)以及WordNet (上义词、下义词和同义词)分别对中英文社交媒体文本的主题词进行扩充.并成功地将语言知识和实体知识通过图卷积神经网络框架有效集成.在4个国际基准中英文谣言语料库上的实验结果和可视化分析表明了本文模型的有效性.

关键词 语言知识; 世界知识; 主题模型; 图卷积神经网络; 谣言检测; language knowledge; world knowledge; topic model; graph convolutional neural networks; rumor detection;

引用格式 徐凡, 李明昊, 黄琪, 等. 知识图谱驱动的图卷积神经网络谣言检测模型. 中国科学: 信息科学, 2023, 53(4): 663-681, doi: 10.1360/SSI-2022-0170
Fan XU, Minghao LI, Qi HUANG, et al. Knowledge graph-driven graph neural network-based model for rumor detection. Sci Sin Inform, 2023, 53(4): 663-681, doi: 10.1360/SSI-2022-0170

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 0

基于细粒度迁移的跨场景认知能力评估方法

张迎伟, 陈益强, 于汉超, 杨晓东, 谷洋
中国科学: 信息科学, 2023, 53(4): 647-662

摘要 认知健康是大脑健康的重要组成部分,与个体全生命周期的正常发展密切相关.目前,非受限普适场景下的认知能力评估已成为实现认知障碍相关疾病早期预警的重要途径.然而,在医疗、家庭等不同计算场景下,因感知设备、认知评估流程等的不同,往往存在不同场景间评估模型相互适用难的问题.针对以上跨场景认知能力评估挑战,本文提出了一种参数自适应的细粒度迁移学习方法 PAFG-TL.PAFG-TL基于随机森林模型实现,通过参数自适应的个体分类器评估策略和领域自适应的决策树生长机制实现参数无关的个体分类器聚类评估和决策树细粒度进化生长.通过在临床认知评估和公开基准数据集上进行实验验证,证明了PAFG-TL方法在跨场景认知能力评估中的有效性.

关键词 参数自适应; 细粒度; 迁移学习; 跨场景; 认知能力评估; parameter adapative; fine-grained; transfer learning; cross-scenario; cognitive ability assessment;

引用格式 张迎伟, 陈益强, 于汉超, 等. 基于细粒度迁移的跨场景认知能力评估方法. 中国科学: 信息科学, 2023, 53(4): 647-662, doi: 10.1360/SSI-2021-0269
Yingwei ZHANG, Yiqiang CHEN, Hanchao YU, et al. A fine-grained transfer learning method for cross-scenario cognitive-ability assessment. Sci Sin Inform, 2023, 53(4): 647-662, doi: 10.1360/SSI-2021-0269

计算机 人工智能 论文 Website Google Scholar PDF SCOPUS引次: 3

基于进化策略的自适应联邦学习算法

公茂果, 高原, 王炯乾, 张元侨, 王善峰, 谢飞
中国科学: 信息科学, 2023, 53(3): 437-453

摘要 联邦学习是一种多设备参与的,保护数据隐私的深度学习技术.它能够在私有数据不出本地的同时训练全局共享模型.然而,在复杂的物联网环境中,联邦学习面临着统计异构性和系统异构性的挑战.不同的本地数据分布和高额的通信计算成本,使得过参数化的模型不适合在物联网应用中直接部署.同时,非独立同分布的数据也使采用参数平均聚合的联邦学习更加难以收敛.联邦学习场景下的研究难点在于,如何根据私有数据为每个客户端建立个性化的轻量级模型的同时,把这些模型汇总成为联合模型.为了解决这一问题,本文提出了一种基于进化策略的自适应联邦学习算法.该方法将模型结构进行编码,把每个参与者视作进化策略中的个体,通过全局优化来为每个客户端自适应地生成不同的个性化子模型.客户端根据网络单元重要性和编码在服务器端超网中抽取相应的子网来进行本地更新,而这种网络局部更新的方法天然契合dropout的思想.在真实数据集上进行的大量实验证明,本文提出的框架相比于经典的联邦学习方法,模型性能得到了显著改善.在客户端数据非独立同分布的情况下,该算法在有效降低了客户端在通信带宽和计算力受限条件下参与联邦学习门槛的同时,提高了全局模型的泛化能力.

关键词 联邦学习; 进化策略; 模型编码; 网络剪枝; 本地个性化; federated learning; evolution strategy; model encoding; network pruning; local customization;

引用格式 公茂果, 高原, 王炯乾, 等. 基于进化策略的自适应联邦学习算法. 中国科学: 信息科学, 2023, 53(3): 437-453, doi: 10.1360/SSI-2021-0190
Maoguo GONG, Yuan GAO, Jiongqian WANG, et al. Adaptive federated learning algorithm based on evolution strategies. Sci Sin Inform, 2023, 53(3): 437-453, doi: 10.1360/SSI-2021-0190