基于注意力的联想忆阻脉冲神经网络及其无监督图像分类应用
邓泽坤, 王春华, 蔺海荣, 邓全利, Yichuang SUN
中国科学: 信息科学, 2024, 54(11): 2554-2571
摘要 无监督学习不需要对训练数据进行人工标注,在硬件系统的图像分类应用中具有重要价值.现有忆阻脉冲神经网络(memristive spiking neural network, MSNN)的无监督学习主要集中于前后神经元之间的突触调节过程,这导致学习仅限于局部神经活动而忽略了神经反应之间的内部联系.联想记忆是大脑实现记忆的重要方式,其通过无监督方式将不同刺激关联起来以建立互联的网络记忆.同时,人类视觉系统利用注意机制从海量信息中选择重要信息,以有效减少输入神经元的数量和神经网络的规模.本文提出了一种基于注意力的联想忆阻脉冲神经网络(attention-based associative memristive spiking neural network, AAMSNN)的全电路设计,并将其应用于无监督图像分类应用.其中,注意力编码模块和注意力选择模块启发于人脑的注意力机制,用于搜索并选择重要特征信息,减少AAMSNN的输入神经元数量.联想忆阻脉冲神经网络由巴甫洛夫联想忆阻交叉阵列构成,通过调节联想记忆权重实现无监督图像分类.与其他MSNN相比, AAMSNN具有更小的MSNN规模和更少的忆阻器数量,并实现了更优的无监督图像分类准确率.
关键词 忆阻脉冲神经网络; 注意力; 联想记忆; 无监督学习; 图像分类; memristive spiking neural network; attention; associative memory; unsupervised learning; image classification
Zekun DENG, Chunhua WANG, Hairong LIN, et al. An attention-based associative memristive spiking neural network and its application in unsupervised image classification. Sci Sin Inform, 2024, 54(11): 2554-2571, doi: 10.1360/SSI-2023-0393
集成效用与数据产品最优定价
王煜心, 李建平, 郝俊
中国科学: 信息科学, 2024, 54(11): 2533-2553
摘要 数据定价有助于释放数据的价值,并为数据交易提供依据,推动数据市场的发展和创新.目前,数据价值具有不确定性、多样性和制约性等问题,如何对数据进行准确的价值评估是数据定价的首要问题.在此背景下,本文提出的方法可以有效地解决数据定价的不确定性和多样性问题.本文构建了基于数据质量和容量的二元非线性集成效用函数来评估数据价值,融合斯塔克伯格(Stackelberg)博弈模型分析参与者行为,利用KKT算法实现了数据产品的最优定价.研究发现原始数据的最优容量、最优质量、最优价格和数据产品提供商利润与单位购买成本存在负相关关系,与消费者数量和消费者敏感程度存在正相关关系,且与消费者敏感程度的正相关关系更大.通过与基于一元效用函数的定价模型对比,进一步验证了本文所提出的考虑集成效用的数据产品定价模型具有显著的优越性.
关键词 数据定价; 数据产品; 数据交易; 集成效用; 斯塔克伯格博弈模型; data pricing; data products; data trading; integrated utility; Stackelberg game model
Yuxin WANG, Jianping LI, Jun HAO. Integrated utility and optimizing pricing of data products. Sci Sin Inform, 2024, 54(11): 2533-2553, doi: 10.1360/SSI-2023-0277
基于原型学习的联邦持续学习方法
张浩东, 杨柳, 于剑, 胡清华, 景丽萍
中国科学: 信息科学, 2024, 54(10): 2428-2442
摘要 联邦学习能够在隐私保护的前提下联合多个参与者进行协同学习,然而经典的联邦学习不具备持续学习的能力,无法适应动态变化的应用场景.联邦持续学习近期引起了广泛的关注,其允许多个参与者在协同学习的同时进行持续学习.联邦持续学习是一种更加复杂的学习场景,其面临的挑战包括灾难性遗忘,异构性以及通信资源受限.为了应对这些挑战,本文提出一种基于原型学习的联邦持续学习方法.该方法利用原型进行知识的共享,提升通信效率的同时增强了对模型异构性的适应能力.此外,该方法设计了基于知识蒸馏和回放的灾难性遗忘的预防机制.本文提供了所提出方法的收敛性分析,并且通过对比实验和消融实验验证了该方法的有效性.
关键词 联邦持续学习; 原型学习; 知识蒸馏; 灾难性遗忘; 数据异构; federated continual learning; prototype learning; knowledge distillation; catastrophic forgetting; data heterogeneity
Hao-Dong ZHANG, Liu YANG, Jian YU , et al. Federated continual learning based on prototype learning. Sci Sin Inform, 2024, 54(10): 2428-2442, doi: 10.1360/SSI-2023-0239
非线性信息瓶颈指导的层次图结构学习方法
孙庆赟, 罗家逸, 杨贝宁, 李建欣
中国科学: 信息科学, 2024, 54(10): 2409-2427
摘要 近年来,图神经网络在各个领域的图数据挖掘任务上取得了显著的成功,已成为领域的研究热点.图神经网络通过结构传播节点信息,并以此计算节点的表征,在大量应用场景上取得了显著的效果提升.大多数图神经网络模型遵循消息传递机制,直接将原始图数据作为输入,假设观测到的图结构准确地描述了节点之间完整的关系.然而,真实场景中图数据的产生往往受多种因素影响,包含大量随机噪声和人为扰动.这些噪声信息和干扰信息在图神经网络信息聚合的过程中随着图结构传播,对图表征质量产生严重的影响.如何度量、识别图数据中的噪声信息,是领域关注的热点问题之一.本文从信息论的角度出发,提出了一种非线性信息瓶颈指导的层次图结构学习方法 NIB-HGSL,针对图层级分类任务,为去除结构噪声、学习鲁棒的图表征提供了一个统一通用的框架. NIB-HGSL通过有效信息保留与噪声信息压缩的均衡优化,可以获得对下游任务来说最关键的层次化最小充分图.实验结果表明,本文所提出的NIB-HGSL方法与其他基线方法相比,可提高图分类和图回归任务的准确性和鲁棒性.
关键词 图表示学习; 信息瓶颈; 图结构学习; 图神经网络; 图分类; graph representation learning; information bottleneck; graph structure learning; graph neural networks; graph classification
Qingyun SUN, Jiayi LUO, Beining YANG, et al. Hierarchical graph structure learning with nonlinear information bottleneck. Sci Sin Inform, 2024, 54(10): 2409-2427, doi: 10.1360/SSI-2024-0049
基于全局密度更新策略的两阶段多模态多目标进化算法
贺娟娟, 杨倩, 许志伟, 张凯, 张兴义, 葛明峰
中国科学: 信息科学, 2024, 54(10): 2385-2408
摘要 多模态多目标问题需要求解多个全局或局部最优帕累托解集,找到这些最优解集具有极大的理论意义和实际经济效益.近年来,学者们提出许多进化算法用于解决该问题.然而,多数算法在进化过程中首先选择收敛性好的个体构建交配池,然后再考虑决策空间和目标空间的多样性.因此,决策空间中多样性好的个体可能被目标空间收敛性好的个体所替代.另外,由于帕累托最优子集在决策空间中有不同的形状和位置,因此个体很难均匀地收敛到每个帕累托子区域.本文提出了基于全局密度更新策略的两阶段多模态多目标进化算法.首先,为减轻交配池和亲本与子代一对一比较的负面影响,我们并不构建交配池,而是提出了新的算法框架,分两阶段寻优.该框架利用不同阶段进化算法的特征进行子代更新,有利于平衡种群的搜索和开发.然后,为了解决帕累托子集分布不均的问题,我们设计了目标空间密度自适应策略和全局密度估计更新种群策略,用于保持目标空间和决策空间种群多样性.我们将提出的算法与7种有代表性的多模态多目标算法进行比较.实验结果表明,我们的算法在决策空间中能找到更多等价的解,并且能更好地保持决策空间和目标空间多样性和收敛性的平衡,整体性能要好于所比较算法.
关键词 多目标进化算法; 多模态多目标优化问题; 进化算法; 全局密度; 参考向量; 边界点聚集; multi-objective evolutionary algorithm; multimodal multi-objective optimization problem; evolutionary algorithm; global density; reference vector; boundary point clustering
Juanjuan HE, Qian YANG, Zhiwei XU, et al. Two-stage multimodal multi-objective evolutionary algorithm based on global density updating strategy. Sci Sin Inform, 2024, 54(10): 2385-2408, doi: 10.1360/SSI-2022-0294
正线性约束组合优化问题的非自回归学习求解
汪润中, 郦洋, 严骏驰, 杨小康
中国科学: 信息科学, 2024, 54(10): 2368-2384
摘要 组合优化问题的求解是计算机科学、应用数学等学科共同研究的基础性问题.其固有的计算复杂性为精确求解带来了挑战.而采用深度神经网络进行求解已经成为一个前沿的研究方向.本文设计了一种能够求解正线性约束组合优化问题的非自回归式神经网络.本文方法的优势在于,正线性约束代表了一大类组合优化问题,突破了现有非自回归网络的通用性瓶颈;与目前常用的自回归网络相比,非自回归网络具有高效性、排列不变性等优势;在神经网络框架中,本文采用的离线无监督学习对标注的需求低,无需求解最优解进行监督训练;本文提出的在线可微分搜索方法显著提升了神经网络求解器的泛化能力.本文在设施布局、最大集合覆盖、旅行商问题等代表性的组合优化问题中验证了非自回归求解器的有效性.特别是在综合考虑求解效率和求解效果时,非自回归网络求解器持平甚至超越了SCIP, Gurobi等开源或者商用的主流传统求解软件.
关键词 组合优化; 深度学习; 非自回归网络; 图神经网络; 梯度优化; combinatorial optimization; deep learning; non-autoregressive neural network; graph neural network; gradient-based optimization
Runzhong WANG, Yang LI, Junchi YAN, et al. Learning to solve combinatorial optimization under positive linear constraints via non-autoregressive neural networks. Sci Sin Inform, 2024, 54(10): 2368-2384, doi: 10.1360/SSI-2023-0269
基于高阶图融合的多视图聚类算法
尤运宁, 唐厂, 刘新旺, 邹鑫, 刘袁缘, 蒋良孝, 张长青
中国科学: 信息科学, 2024, 54(9): 2098-2115
摘要 基于图的多视图聚类算法通过探索样本点之间的邻近关系,受到了广泛的关注.尽管在实际应用中已经取得了较好的聚类性能,但是观察到大多数算法只是利用一阶邻近关系去构建相似图,这导致信息探索不足和多视图数据表征能力下降.为了解决这个挑战,本文提出了一种新颖的基于高阶图融合的多视图聚类算法(high-order graph fusion for multi-view clustering, HCDMC).具体地,所提出的算法通过一种新颖的隐式权重学习策略,从每个视图对应的一阶和二阶邻近图中学习相应的高阶图.引入希尔伯特–施密特(Hilbert-Schmidt)独立性准则作为一种差异性正则化项,旨在加强一致性高阶图的互补信息.最后,对学习到的一致性高阶图施加连通性约束,直接得到聚类标签矩阵,无需任何后处理步骤.使用交替方向乘子法去解决模型的优化问题.在6个真实的数据集上进行了一系列的实验,相较于最新的算法,本文提出的算法具有更好的聚类性能.
关键词 多视图聚类; 高阶图; 图结构学习; 图融合; 差异性正则化; multi-view clustering; high-order graph; graph structure learning; graph fusion; diversity regularization
Yunning YOU, Chang TANG, Xinwang LIU, et al. High-order graph fusion for multi-view clustering. Sci Sin Inform, 2024, 54(9): 2098-2115, doi: 10.1360/SSI-2023-0217
社会大数据跨尺度系统学习理论与方法
郑志明, 吕金虎, 王亮, 鲁仁全, 崔鹏, 王鑫, 韦卫
中国科学: 信息科学, 2024, 54(9): 2083-2097
摘要 以GPT-4为代表的AI大模型时代正加速而至,深刻改变着社会生活的方方面面.大模型巨参数深度学习是破解复杂大数据智能学习瓶颈的一种有效途径.大模型在展现出强大学习能力的同时也面临着高能耗、大算力挑战.研究表明,平均一个AI大模型训练产生的能耗约等于五辆汽车一生排放的碳总量,驱动AI大模型所需算力每3.5个月翻一番.作为一种有益的补充,内嵌规律的跨尺度系统学习是破解复杂大数据智能学习瓶颈的另一种有效途径.跨尺度系统学习已经在某些专业领域展现出了巨大的成功,如2021年诺贝尔物理学奖授予复杂物理系统跨尺度建模及其在全球气候变暖中的应用.事实上,我国科学家甚至更早开拓了复杂系统跨尺度学习研究,如北京航空航天大学暗物质大数据分析团队利用跨尺度系统学习方法实现了在PB级数据中实时学习KB级关键数据,精度达到万分之一.本文从微观尺度、介观尺度和宏观尺度上分析了跨尺度系统学习的基本原理,构建了内嵌规律跨尺度系统学习的普适方法,并以社会大数据为例开展了典型应用示范.社会大数据跨尺度系统学习应用于疫情防控、舆情分析等领域,并取得显著成效,为我国社会治理数字化、网络化、智能化发展提供了新的成功样本.
关键词 人工智能; 大模型; 跨尺度系统学习; 社会大数据; 可解释性; artificial intelligence; large models; cross-scale systematic learning; social big data; interpretability
Zhiming ZHENG, Jinhu LÜ, Liang WANG, et al. Cross-scale systematic learning for social big data: theory and methods. Sci Sin Inform, 2024, 54(9): 2083-2097, doi: 10.1360/SSI-2023-0408
一种求解偏微分方程的动态平衡物理信息神经网络
邓书超, 宋孝天, 钟旻霄, 李庆, 孙亚楠, 吕建成
中国科学: 信息科学, 2024, 54(8): 1843-1859
摘要 近年来,物理信息神经网络(physics-informed neural networks, PINNs)在求解非线性偏微分方程(partial differential equations, PDEs)中得到了大量应用. PINN将物理信息作为正则化约束加入神经网络损失函数,可以减少传统神经网络方法对训练数据的大量依赖.然而, PINN无法根据数据变化动态调整损失函数中各个损失项的权重,导致其在求解非线性PDEs时存在求解误差较大的问题.为此,本文提出了一种动态平衡物理信息神经网络(dynamic balanced PINN, DBPINN).首先,DBPINN为PINN损失函数的各个损失项设计了一种动态权重系数,并使用随机函数对该系数进行动态更新,能够显著提升PINN的精度.其次, DBPINN为PNNN损失函数的各个损失项之间建立了一种平衡求和方法,该方法考虑了所有损失项之间的竞争关系,使得PINN各损失项朝着有利于收敛的方向进行优化. DBPINN通过动态权重系数和平衡求和方法使得PINN可以更好地进行优化,进而解决了PINN在实际应用中求解误差较大的问题.本文选择了科学机器学习领域中4个经典的非线性PDEs对DBPINN进行了数值验证和分析.实验结果表明,相比于PINN, DBPINN在Schrodinger和Allen-Cahn方程上误差分别降低了46%和64%. DBPINN在求解Navier-Stokes方程时将系数λ1和λ2的误差分别降低了1~2个数量级和约50%. DBPINN在KdV方程中能够在多项系数中将误差降低1个数量级.最后,本文在多种形式的Burgers方程和Allen-Cahn方程上进行性能和参数消融验证,结果表明DBPINN不仅能够提升模型性能、处理小数据量以及拟合不同时间状态下的方程的能力,而且DBPINN相比于PINN具有更好的稳定性、准确率以及收敛性. DBPINN可以取代PINN被应用于各种非线性PDEs的高精度求解.
关键词 物理信息神经网络; 非线性偏微分方程; 动态权重系数; 平衡求和方法; 科学机器学习; physics-informed neural networks; nonlinear partial differential equations; dynamic weight coefficients; balanced summation method; scientific machine learning
Shuchao DENG, Xiaotian SONG, Minxiao ZHONG, et al. A dynamic balanced physics-informed neural network for solving partial differential equations. Sci Sin Inform, 2024, 54(8): 1843-1859, doi: 10.1360/SSI-2023-0195
人工智能伦理计算
高漪澜, 张睿, 李学龙
中国科学: 信息科学, 2024, 54(7): 1646-1676
摘要 人工智能技术作为试图研究、模仿、扩展人类智能的科学研究领域,自诞生以来就伴随着深刻的技术伦理争辩.随着近年来机器学习等相关工作的突破性进展和快速落地应用,伦理问题日趋显著并迫使学界和社会开始直面该技术的伦理治理挑战.尽管在伦理治理的规范研究上已取得初步进展,其治理实践落地方面依然困难重重,伦理实践表现出逐渐落后于技术发展需求的趋势.因此,建立与不断发展的人工智能技术相互匹配的伦理治理实践方案,实现治理理论和治理实践的良性互动将是人工智能领域未来发展的关键问题.伦理治理理论的抽象性导致了当下人工智能伦理原则难以落地实现,人工智能伦理计算(AI ethical computation)将是应对这一挑战的重要方案.本研究通过探讨现实必要性和发展可能性明确了伦理计算的重要意义,在相关研究基础上给出伦理计算的研究范畴,依据计算过程对伦理机理的认知程度和系统伦理决策的自主化程度进行划分,建立了伦理计算的高阶认知与低阶认知两类研究范式,并按其计算阶段抽象出伦理度量、伦理决策和伦理推理3个计算层次.该伦理计算框架能够对当前的伦理计算应用进行梳理,本文以伦理嵌入和公平机器学习为例说明了两类研究范式的研究特点和技术方法.在此基础上,进一步讨论构建了以伦理计算为核心的伦理治理体系,分析通过伦理计算化解伦理治理困境的可能方案,并对人工智能伦理计算的发展做出展望.
关键词 人工智能; 伦理问题; 伦理治理; 伦理计算; 伦理嵌入; 公平机器学习; artificial intelligence; ethics issues; ethical governance; ethical computation; ethical embedding; fair machine learning
Yilan GAO, Rui ZHANG, Xuelong LI. Artificial intelligence ethical computation. Sci Sin Inform, 2024, 54(7): 1646-1676, doi: 10.1360/SSI-2023-0076
面向大规模数据的高效超图神经网络
吉书仪, 魏宇轩, 戴琼海, 高跃
中国科学: 信息科学, 2024, 54(4): 853-871
摘要 高阶关联广泛存在于现实世界中,如社交网络、生物网络、交通网络等,建模及优化高阶关联对于网络属性研究和演化趋势预测具有重要意义.超图是一种灵活的数据结构,能够自然地建模高阶关联.近年来,随着深度学习的发展,基于超图建模的超图神经网络被广泛应用于面向高阶关联的表示学习.然而,现有的超图神经网络均基于直推学习范式,虽然在小规模超图数据集上取得了不错的效果,但难以应用到大规模数据上,限制了其应用范围.本文首先分析了现有超图神经网络方法在大规模数据上应用的挑战,然后针对该问题提出了面向大规模数据的高效超图神经网络方法 (efficient hypergraph neural network, EHGNN).针对现有方法空间、时间复杂度过高的问题, EHGNN分别设计了超图采样模块和基于单阶段超图卷积的计算加速模块,同时降低了超图神经网络的空间开销和时间开销,使得超图神经网络适用于大规模超图数据,显著增强了可扩展性.在4个真实超图数据集上的实验结果验证了EHGNN的有效性和高效性.
关键词 超图计算; 超图神经网络; 高阶关联; 大规模数据; 节点分类; hypergraph computation; hypergraph neural network; high-order correlation; large-scale data; vertex classification
Shuyi JI, Yuxuan WEI, Qionghai DAI, et al. Efficient hypergraph neural network on million-level data. Sci Sin Inform, 2024, 54(4): 853-871, doi: 10.1360/SSI-2022-0379
深度ReLU神经网络的万有一致性
刘霞, 王迪
中国科学: 信息科学, 2024, 54(3): 638-652
摘要 随着数据量爆炸式增长、计算资源愈加丰富,浅层神经网络并不总能满足时代需求,从而导致深度神经网络的出现.深度神经网络的迅猛发展主要体现在应用领域,其理论研究相对匮乏.基于此,本文聚焦研究深度ReLU神经网络的万有一致性,具体内容包括:首先,是否存在一个具有统一结构的深度神经网络(即深度、宽度、激活函数等均已确定)使得该深度神经网络可以学习更多特征,并具有万有逼近性;其次,针对已确定的深度神经网络模型,证明其是强万有一致的;最后,从实验的角度验证理论结果的合理性.
关键词 深度神经网络; 万有一致性; 深度学习; ReLU 函数; 逼近性; deep neural networks; universal consistency; deep learning; ReLU function; approximation
Xia LIU, Di WANG. Universal consistency of deep ReLU neural networks. Sci Sin Inform, 2024, 54(3): 638-652, doi: 10.1360/SSI-2022-0401
稳健选择伪标注的混合式半监督学习
郭兰哲, 李宇峰
中国科学: 信息科学, 2024, 54(3): 623-637
摘要 半监督学习旨在数据标注缺乏的情形下利用无标注数据提升学习性能,是重要的机器学习范式.尽管不少研究报道表明半监督学习取得了优异的性能表现,然而其在面临诸多实践任务时仍存在伪标注质量判断困难、超参数选择敏感、理论指导缺乏等瓶颈.针对上述挑战,本文提出一种稳健选择伪标注的混合式半监督学习方法,通过综合利用模型预测结果之间的分歧自适应地判断伪标注质量,无需预设超参数,显著提升了半监督学习的稳健性.本文在理论上证明了新方法的错误率随训练轮数的增加而显著下降.实验验证了本文方法较主流技术取得了明显的性能提升,例如,相较于在CIFAR-10数据集中表现最优的半监督学习技术FixMatch,新方法的分类错误率下降了11%以上,在更具挑战的STL-10数据集中分类错误率下降了18.8%.
关键词 机器学习; 深度学习; 半监督学习; 伪标注; 稳健性; machine learning; deep learning; semi-supervised learning; pseudo-label; robust
Lanzhe GUO, Yufeng LI. Robust pseudo-label selection for holistic semi-supervised learning. Sci Sin Inform, 2024, 54(3): 623-637, doi: 10.1360/SSI-2022-0421
基于混合比例估计的标签噪声学习方法
郑庆华, 曹书植, 阮建飞, 赵锐, 董博
中国科学: 信息科学, 2024, 54(3): 603-622
摘要 近年来,人工智能蓬勃发展,伴随着计算硬件算力的提升,深度学习已成为了人工智能算法的新范式.然而深度学习依赖大量精确标注的数据,在现实的多类别分类场景中,受限于标注成本和隐私数据保护等因素,大量精准标注的数据往往难以获得.近些年,移动众包和网络爬虫这类经济廉价的数据收集方法被广泛采用,但他们不可避免地引入了错误标注,即标签噪声.鉴于深度神经网络强大的数据拟合能力,标签噪声的存在将造成算法的过拟合,严重制约了深度学习方法的泛化能力.针对标签噪声问题,现有研究大多显式或隐式地依赖锚点(明确属于某一类别的样本),然而在现实场景中锚点难以获取,这使得现有解决方案不再适用.为解决这一问题,本文创造性地将多类别标签噪声学习问题转化为混合比例估计(mixture proportion estimation, MPE)问题,构建了一种不依赖锚点的满足统计一致性的学习算法.本文的主要贡献包括:(1)对现有的仅适用于二组成物MPE场景的R-MPE(regrouping-MPE)方法进行推广,提出了多组成物场景下不依赖不可约假设的MPE方法 MR-MPE(multi-component oriented R-MPE);(2)理论上证明了多类别分类场景下标签噪声学习算法锚点假设和MPE问题不可约假设的等价性,并基于所提出的MR-MPE方法构建了不依赖锚点的满足统计一致性的算法.本文在合成噪声数据集和真实噪声数据集上分别与现有算法进行了对比实验,结果显示本文所提算法在多个数据集上均展现出了最优的性能;同时,在移除锚点的情况下,本文对算法的鲁棒性进行了测试,验证了所提算法不依赖锚点的特性.
关键词 混合比例估计; 多类别分类; 标签噪声学习; 锚点; 不可约假设; 统计一致性; mixture proportion estimation; multi-class classification; label-noise learning; anchor point; irreducible assumption; statistical consistency
Qinghua ZHENG, Shuzhi CAO, Jianfei RUAN, et al. Label-noise learning via mixture proportion estimation. Sci Sin Inform, 2024, 54(3): 603-622, doi: 10.1360/SSI-2023-0126
缓解随机一致性的基尼指数与决策树方法
王婕婷, 李飞江, 李珏, 钱宇华, 梁吉业
中国科学: 信息科学, 2024, 54(1): 159-190
摘要 决策树模型具有较强的可解释性,是随机森林、深度森林等机器学习方法的基础.如何选择节点的分割属性与分割值是决策树算法的关键问题,对树的泛化能力、深度、平衡程度等重要性能产生影响.传统属性选择准则的定义大多基于凹函数,使得决策树算法存在多值偏向问题,即倾向于选择取值种类多的属性作为节点分割属性.已有研究表明缓解随机一致性的评价准则能够降低分类偏差与类簇个数偏向.本文将基于标准化框架缓解基尼指数的随机一致性,以此缓解其多值偏向问题.通过人造数据集验证,标准基尼指数能够缓解基尼指数的多值偏向问题,并且选择出具有决策信息的属性.通过12个基准数据集与两个图像数据集的实验验证,基于标准基尼指数的决策树算法比现有缓解多值偏向的决策树算法具有较高的泛化性能.
关键词 基尼指数; 多值偏向; 决策树; 随机一致性; Gini index; bias to multi-value; decision tree; random consistency
Jieting WANG, Feijiang LI, Jue LI, et al. Gini index and decision tree method with mitigating random consistency. Sci Sin Inform, 2024, 54(1): 159-190, doi: 10.1360/SSI-2022-0337
面向标签噪声的联合训练框架
魏琦, 孙皓亮, 马玉玲, 尹义龙
中国科学: 信息科学, 2024, 54(1): 144-158
摘要 当前面向标签噪声的鲁棒性学习通常依赖样本选择和标签修正两种策略,但是这两类方法均存在缺陷.基于样本选择的方法忽略了被过滤掉的样本中的有效信息,进而降低了模型的性能.基于标签修正的方法常使用自标签技术而引起模型的错误积累问题.对此,本文提出了一个集成样本选择、标签修正的联合训练框架.针对样本选择模块,本文设计了一种新的选择标准,通过在线选择的方法对所挑选的样本集合进行更新.相较于现有选择标准,本文提出的标准可保留更多边界样本,提升了模型对决策边界的学习性能,增强了模型的泛化性能.针对标签修正模块,本文提出了一种联合标签修正策略.相比于传统的自标签修正技术,该模块通过联合特征空间视角,对噪声样本进行多视角的标签修正,解决了传统自标签技术的错误累积问题.此外,本文引入对比学习正则化项,提升了标签修正效果和模型表征学习能力.本文方法在4个测试基准上取得了当前最好分类效果,验证了所提训练框架的有效性.
关键词 标签噪声学习; 样本选择; 标签修正; 对比学习; learning with noisy labels; sample selection; label correction; contrastive learning
Qi WEI, Haoliang SUN, Yuling MA, et al. A joint training framework for learning with noisy labels. Sci Sin Inform, 2024, 54(1): 144-158, doi: 10.1360/SSI-2022-0395
基于专家知识的主动因果效应辨识
王天佐, 周志华
中国科学: 信息科学, 2023, 53(12): 2341-2354
摘要 因果效应定量描述变量间的影响作用,在许多现实任务中发挥着重要作用.辨识因果效应需要依赖已知的因果关系.一种确定因果关系的主流方法是引入干预信息,即通过人为干预某些因素而获取的信息.鉴于实际干预通常会带来巨大的成本,本文提出利用易于获取的专家知识替代干预,通过设计形如“在XX干预下,目标变量的值相较不干预时增大还是减小?”的问题并向专家咨询,确定因果关系,进而辨识因果效应.尽管每次专家返回的信息量少于干预信息,但通过一定次数的咨询,本文方法可以达到与使用干预信息方法相近的因果效应辨识效果.实验验证了上述结论.
关键词 因果效应辨识; 因果关系; 人机交互; 专家知识; causal effect identification; causal relation; human-in-the-loop; expert knowledge
Tian-Zuo WANG, Zhi-Hua ZHOU. Active causal effect identification with expert knowledge. Sci Sin Inform, 2023, 53(12): 2341-2354, doi: 10.1360/SSI-2022-0390
面向多维分类的监督式降维
贾彬彬, 张敏灵
中国科学: 信息科学, 2023, 53(12): 2325-2340
摘要 与传统多类分类相比,多维分类中每个对象仍由一个示例(特征向量)表示,但同时与多个类别变量相关联,各类别变量基于异构类别空间刻画对象的语义.降维可以有效地缓解维度灾难并加速模型训练,已有多维分类研究均关注于设计性能更好的学习算法,尚未出现面向多维分类数据降维方面的工作.本文基于特征空间和语义空间的相关性,首次面向多维分类数据设计了一种名为SDeM的监督式线性降维方法.该方法使用Hilbert-Schmidt独立判据衡量两个空间的相关性,通过最大化投影特征空间与语义空间在该度量下的相关性确定投影矩阵.实验结果表明,相比于无监督式降维方法,SDeM所得降维特征更有利于多维分类方法取得更好的泛化性能.
关键词 机器学习; 多维分类; 降维; 空间相关性; Hilbert-Schmidt独立准则; machine learning; multi-dimensional classification; dimensionality reduction; dependence between spaces; Hilbert-Schmidt independence criterion
Bin-Bin JIA, Min-Ling ZHANG. Supervised dimensionality reduction for multi-dimensional classification. Sci Sin Inform, 2023, 53(12): 2325-2340, doi: 10.1360/SSI-2022-0363
基于自监督的端到端图数据异常检测方法
张震, 刘美含, 李朝, 卜佳俊
中国科学: 信息科学, 2023, 53(11): 2202-2213
摘要 异常检测旨在发掘数据中异于寻常的模式,它在金融欺诈以及网络入侵检测等领域有着广泛的应用前景.本文主要研究了如何在结构复杂的图数据中进行异常检测,这涉及到挖掘异常的图结构信息以及节点属性信息.现有大部分工作通常采用一个两步的框架,即先对结构复杂的图数据进行表征学习生成图表征向量,然后再将该向量用于下游异常检测任务.由于分开训练的图表征学习任务与下游异常检测任务存在一定的语义鸿沟,这导致现有方法无法有效地挖掘出图中潜在的异常模式.因此,我们提出了一种基于自监督的端到端图数据异常检测框架SGAD,它可以有效地捕获图数据的语义信息并用于异常检测.具体来说, SGAD对无标签图数据进行了一系列变换用于构建自监督辅助任务,然后该自监督任务的输出结果可以直接用于异常检测.我们在多个公开数据集上进行了大量实验,实验结果表明本文提出的SGAD与现有方法相比获得了显著的效果提升.
关键词 图结构数据; 异常检测; 自监督学习; 图神经网络; 图表征学习; graph-structured data; anomaly detection; self-supervised learning; graph neural network; graph representation learning
Zhen ZHANG, Meihan LIU, Zhao LI, et al. Self-supervised end-to-end graph level anomaly detection. Sci Sin Inform, 2023, 53(11): 2202-2213, doi: 10.1360/SSI-2022-0179
联邦无监督跨模态哈希
朱磊, 李京智, 王天时, 李晶晶, 张化祥
中国科学: 信息科学, 2023, 53(11): 2180-2201
摘要 联邦跨模态检索利用分散的客户端学习一个共享跨模态检索模型,从而降低集中大规模多模态训练数据时高昂的维护成本,解决分布式数据存储场景下跨模态检索中存在的数据隐私问题.然而现有的联邦跨模态检索方法大多依赖于大量的语义标注,这限制了检索模型在大规模应用场景下的扩展性.与之不同,本文提出一种无监督的联邦跨模态哈希检索模型,旨在保护客户端数据隐私的前提下,学习不依赖语义标注的跨模态检索模型.由于联邦环境中多模态数据分布不平衡,局部信息不足以让模型学习到整体数据上的模态间相似性,从而影响检索性能.为解决此问题,本文提出一个全局–局部模态间对比正则化方法,通过使用不同模态的全局哈希模型对单个模态的局部哈希模型进行约束,使局部哈希模型能够充分感知整体数据的相似性语义,从而加强对本地跨模态哈希学习过程的引导.同时,本文引入一种全局–局部模态内知识蒸馏策略来进一步地获取模态内特有的全局知识.5个基准跨模态检索数据集上的实验结果验证了本文提出方法的有效性.
关键词 联邦学习; 多模态学习; 无监督学习; 跨模态检索; 无监督跨模态哈希; federated learning; multimodal learning; unsupervised learning; cross-modal retrieval; unsupervised cross-modal Hashing
Lei ZHU, Jingzhi LI, Tianshi WANG, et al. Federated unsupervised cross-modal Hashing. Sci Sin Inform, 2023, 53(11): 2180-2201, doi: 10.1360/SSI-2022-0366
基于堆叠式对抗变分循环神经网络的多维时间序列异常检测
陈文超, 方博为, 代良, 陈渤, 刘畅, 赵小楠
中国科学: 信息科学, 2023, 53(9): 1750-1767
摘要 为了建模多维时间序列(multivariate time series, MTS)中复杂的时序依赖性与随机性,并实现对它的无监督异常检测这一工业机器或互联网基础设施设备质量管理中的关键任务,本文提出了一种堆叠式对抗变分循环神经网络(stacked adversarial variational recurrent neural network, SaVRNN).SaVRNN是一个层次化概率动态模型,它将层次化概率生成模型、堆叠式循环结构和多层对抗优化方式整合到一个联合贝叶斯框架下.具体来说, SaVRNN核心思想是利用堆叠循环结构捕捉多层次与长距离的时序相关性,利用层次化的概率生成操作建模多层的结构特性,进而实现对多维时间序列正常模式的学习,最后通过重构的概率来判断异常模式.为了实现模型的高效推理,本文创新性地提出了一种向上–向下对抗变分推理方案,实现对隐层变量后验的准确估计.针对多层对抗网络中难以实现生成器与判别器的更新平衡导致的SaVRNN训练困难的问题,本文基于条件传输(conditional transport,CT)提出了一个新的优化方法.最后,基于Sa VRNN的层次化结构,本文将多层似然进行融合以改进传统的异常检测策略.在两个公共数据集和一个实测数据集上显示所提方法在F1-score指标上实现了相比目前主流方法的更优性能,证明了所提模型在时间序列在线异常检测任务上的有效性.
关键词 异常检测; 多维时间序列; 对抗变分贝叶斯; 变分循环神经网络; 条件传输; anomaly detection; multivariate time series; adversarial variational Bayesian; variational RNN; conditional transport
Wenchao CHEN, Bowei FANG, Liang DAI, et al. Stacked adversarial variational recurrent neural network for anomaly detection of multivariate time series. Sci Sin Inform, 2023, 53(9): 1750-1767, doi: 10.1360/SSI-2022-0277
基于模糊密度峰值聚类的区域同位模式并行挖掘算法
蒋希文, 王丽珍, Vanha TRAN
中国科学: 信息科学, 2023, 53(7): 1281-1298
摘要 区域同位模式挖掘(RCPM, regional co-location pattern mining)是为了发掘某个局部区域内存在的同位(co-location)模式,以发现在全局中无法发现的信息.传统的区域挖掘大多会采用明确界限的几何体框定同位模式产生的区域.但是现实中的各类区域可能是无明确边界的.另外,数据的分布情况作为区域的重要特征之一,也应该成为区域选择的因素.基于上述思考,本文引入密度峰值聚类(DPC, density peak-based clustering),提出新的密度度量函数,并结合模糊集理论与k近邻距离,设计了一个行之有效的并行区域同位模式挖掘算法.实验结果表明,利用本文方法挖掘到的结果更具有现实意义,并且并行化极大地提升了挖掘算法的效率.在真实数据上, 2线程下的加速比达到了1.89.
关键词 空间数据挖掘; 区域同位模式; 模糊密度峰值聚类; 并行算法; k近邻; spatial data mining; regional co-location pattern; fuzzy density peak clustering; parallel algorithm; k-nearest neighbor;
Xiwen JIANG, Lizhen WANG, Vanha TRAN. A parallel algorithm for regional co-location mining based on fuzzy density peak clustering. Sci Sin Inform, 2023, 53(7): 1281-1298, doi: 10.1360/SSI-2022-0004
一种基于偏差-方差权衡的贝叶斯分类学习框架
张文钧, 蒋良孝, 张欢, 胡成玉
中国科学: 信息科学, 2023, 53(6): 1078-1095
摘要 朴素贝叶斯由于其简单、高效和有效性成为十大数据挖掘算法之一.然而它要求的属性条件独立假设在实际应用中很难成立.为了削弱其属性条件独立假设,学者们提出了结构扩展、属性选择、属性加权、实例选择、实例加权5类改进方法.现有改进方法虽然在一定程度上降低了模型的偏差,但同时也提高了模型的方差,因而限制了模型的泛化性能.偏差–方差权衡是机器学习的核心原则之一,该原则要求模型具有较低偏差的同时,方差也要尽量低.如何在贝叶斯分类学习中引入偏差–方差权衡,同时获得较低的偏差和方差,从而进一步提升模型的泛化性能,是本文关注的重点.为此,本文首先理论分析了在贝叶斯分类学习中做偏差–方差权衡的可行性,探讨了保证可行性的关键因素;然后通过构建回归任务来学习贝叶斯分类模型的后验概率损失,调控关键因素的变化;最后提出了一种基于偏差–方差权衡的贝叶斯分类学习框架,并在提出的学习框架下重新实现了朴素贝叶斯及其各类改进模型.在大量经典的UCI标准数据集上的实验结果表明,现有的各类先进的贝叶斯分类模型在本文所提学习框架下的分类性能显著优于其原始性能.
关键词 朴素贝叶斯; 属性条件独立假设; 偏差 – 方差权衡; 后验概率损失; 学习框架; naive Bayes; attribute conditional independence assumption; bias–variance trade-off; posterior probability loss; learning framework;
Wenjun ZHANG, Liangxiao JIANG, Huan ZHANG, et al. Bayesian classification learning framework based on bias–variance trade-off. Sci Sin Inform, 2023, 53(6): 1078-1095, doi: 10.1360/SSI-2022-0025
硬件感知的神经架构搜索
王鑫, 姚洋, 蒋昱航, 关超宇, 朱文武
中国科学: 信息科学, 2023, 53(5): 899-917
摘要 深度神经网络(deep neural networks, DNNs)能否取得令人满意的性能很大程度上依赖于其神经网络架构.研究人员提出神经网络架构搜索(neural architecture search, NAS)来自动搜索神经网络的最优架构,现有的工作大多使用每秒浮点运算次数(floating point operations per second, FLOPs)来评价神经网络架构的实际效率,但是FLOPs和实际延迟并不是完全一致的.随着任务变得越来越复杂以及越来越多的硬件平台开始运行基于深度神经网络的算法,为硬件平台搜索高效的神经网络架构已成为亟待解决的难题.为了解决这一问题,本文提出了硬件感知的搜索空间构造方法,并借助考虑架构推断延迟的搜索策略,来搜索最优的神经网络架构.本文在可变换神经网络架构搜索方法(transformable architecture search, TAS)和图神经网络架构搜索方法 (graph neural architecture search, GraphNAS)上应用了该方法,提出了硬件可感知的可变换神经网络架构搜索方法 (hardwareaware transformable architecture search, HTAS)和硬件感知的图神经网络架构搜索方法 (hardwareaware graph neural architecture search, HGNAS).相比于现有方法,本文所提出的这两种算法在多种数据集上均针对不同类型目标硬件搜索出了更加高效的深度神经网络架构,从而证明了该方法的有效性.
关键词 深度学习; 神经网络架构搜索; 可变换神经网络架构搜索; 图神经网络架构搜索; 硬件感知; deep learning; neural architecture search; transformable architecture search; graph neural architecture search; hardware-aware;
Xin WANG, Yang YAO, Yuhang JIANG, et al. Hardware-aware neural architecture search. Sci Sin Inform, 2023, 53(5): 899-917, doi: 10.1360/SSI-2021-0446
卷积效力评价机制驱动的深度神经网络全局剪枝
周成, 李军华, 黎明, 张聪炫, 蔡昊
中国科学: 信息科学, 2023, 53(5): 878-898
摘要 模型剪枝被广泛应用于深度神经网络(deep neural network, DNN)的压缩与加速,为资源受限的终端设备部署DNN提供了技术支持.然而以往的剪枝研究缺乏对卷积核效力机制的有效评估,同时忽视了压缩空间中多种不可控因素的潜在干扰.因此本文提出一种卷积效力评价机制驱动的DNN全局剪枝方法,在特征图信息丰富度的基础上,以可视化的方式评估卷积核的效力值,优化了卷积核选择机制.同时探索了压缩空间中卷积结构的效力相关性,并在不同卷积层中使用不同的剪枝标准.首先,本文通过离散傅里叶变换(discrete Fourier transform, DFT)对特征图的信息度进行定量分析,并提出一种评估卷积核效力值的数据驱动方法.然后,基于卷积结构的相关性,引入损失因子以度量剪枝过程中剩余压缩单元的效力损失.最后根据层索引值的变化,在不同结构的功能层中自适应修正剪枝标准.实验表明,相比于最新的剪枝策略,本文的剪枝方法具有更佳的压缩性能和模型优化能力.
关键词 深度神经网络压缩; 模型剪枝; 重要度评估; 损失因子; 特征图信息度; deep neural network compression; model pruning; significance evaluation; loss factor; informativeness of feature map;
Cheng ZHOU, Junhua LI, Ming LI, et al. Global pruning of deep neural networks driven by convolutional effectiveness evaluation mechanism. Sci Sin Inform, 2023, 53(5): 878-898, doi: 10.1360/SSI-2022-0021
知识图谱驱动的图卷积神经网络谣言检测模型
徐凡, 李明昊, 黄琪, 鄢克雨, 王明文, 周国栋
中国科学: 信息科学, 2023, 53(4): 663-681
摘要 社交媒体谣言以极低的成本在互联网中被快速扩散,给社会带来显著的负面影响.传统的谣言检测模型主要考虑传播模式、写作风格、用户信用和世界知识等信息.然而,谣言的传播模式通常难以被捕捉,写作风格却容易被模仿,由元数据(如职业、家乡、学历、年龄等)构成的用户信息也容易被伪造.本文提出了一种新颖的知识驱动的图卷积神经网络谣言检测模型.该模型首先将社交媒体文本表示成一种语义–实体无向图结构,其中节点包含原社交媒体文本中的词语,利用世界知识库扩展的实体词语,以及利用语言知识库扩展的语义词语,边包含三类节点的6种有效组合.该语义–实体图可以有效地增强任意两种节点的共现性,从而丰富了原社交媒体文本的表示,从一定程度上缓解数据稀疏共现问题.语言知识利用了HowNet (义原和同义词)以及WordNet (上义词、下义词和同义词)分别对中英文社交媒体文本的主题词进行扩充.并成功地将语言知识和实体知识通过图卷积神经网络框架有效集成.在4个国际基准中英文谣言语料库上的实验结果和可视化分析表明了本文模型的有效性.
关键词 语言知识; 世界知识; 主题模型; 图卷积神经网络; 谣言检测; language knowledge; world knowledge; topic model; graph convolutional neural networks; rumor detection;
Fan XU, Minghao LI, Qi HUANG, et al. Knowledge graph-driven graph neural network-based model for rumor detection. Sci Sin Inform, 2023, 53(4): 663-681, doi: 10.1360/SSI-2022-0170
基于细粒度迁移的跨场景认知能力评估方法
张迎伟, 陈益强, 于汉超, 杨晓东, 谷洋
中国科学: 信息科学, 2023, 53(4): 647-662
摘要 认知健康是大脑健康的重要组成部分,与个体全生命周期的正常发展密切相关.目前,非受限普适场景下的认知能力评估已成为实现认知障碍相关疾病早期预警的重要途径.然而,在医疗、家庭等不同计算场景下,因感知设备、认知评估流程等的不同,往往存在不同场景间评估模型相互适用难的问题.针对以上跨场景认知能力评估挑战,本文提出了一种参数自适应的细粒度迁移学习方法 PAFG-TL.PAFG-TL基于随机森林模型实现,通过参数自适应的个体分类器评估策略和领域自适应的决策树生长机制实现参数无关的个体分类器聚类评估和决策树细粒度进化生长.通过在临床认知评估和公开基准数据集上进行实验验证,证明了PAFG-TL方法在跨场景认知能力评估中的有效性.
关键词 参数自适应; 细粒度; 迁移学习; 跨场景; 认知能力评估; parameter adapative; fine-grained; transfer learning; cross-scenario; cognitive ability assessment;
Yingwei ZHANG, Yiqiang CHEN, Hanchao YU, et al. A fine-grained transfer learning method for cross-scenario cognitive-ability assessment. Sci Sin Inform, 2023, 53(4): 647-662, doi: 10.1360/SSI-2021-0269
基于进化策略的自适应联邦学习算法
公茂果, 高原, 王炯乾, 张元侨, 王善峰, 谢飞
中国科学: 信息科学, 2023, 53(3): 437-453
摘要 联邦学习是一种多设备参与的,保护数据隐私的深度学习技术.它能够在私有数据不出本地的同时训练全局共享模型.然而,在复杂的物联网环境中,联邦学习面临着统计异构性和系统异构性的挑战.不同的本地数据分布和高额的通信计算成本,使得过参数化的模型不适合在物联网应用中直接部署.同时,非独立同分布的数据也使采用参数平均聚合的联邦学习更加难以收敛.联邦学习场景下的研究难点在于,如何根据私有数据为每个客户端建立个性化的轻量级模型的同时,把这些模型汇总成为联合模型.为了解决这一问题,本文提出了一种基于进化策略的自适应联邦学习算法.该方法将模型结构进行编码,把每个参与者视作进化策略中的个体,通过全局优化来为每个客户端自适应地生成不同的个性化子模型.客户端根据网络单元重要性和编码在服务器端超网中抽取相应的子网来进行本地更新,而这种网络局部更新的方法天然契合dropout的思想.在真实数据集上进行的大量实验证明,本文提出的框架相比于经典的联邦学习方法,模型性能得到了显著改善.在客户端数据非独立同分布的情况下,该算法在有效降低了客户端在通信带宽和计算力受限条件下参与联邦学习门槛的同时,提高了全局模型的泛化能力.
关键词 联邦学习; 进化策略; 模型编码; 网络剪枝; 本地个性化; federated learning; evolution strategy; model encoding; network pruning; local customization;
Maoguo GONG, Yuan GAO, Jiongqian WANG, et al. Adaptive federated learning algorithm based on evolution strategies. Sci Sin Inform, 2023, 53(3): 437-453, doi: 10.1360/SSI-2021-0190
面向异构数据的自适应个性化联邦学习——一种基于参数分解和持续学习的方法
倪宣明, 沈鑫圆, 张海
中国科学: 信息科学, 2022, 52(12): 2306-2320
摘要 联邦学习允许资源受限的边缘计算设备协作训练机器学习模型,同时能够保证数据不离开本地设备,但也面临着异构数据下全局模型收敛缓慢甚至偏离最优解的挑战.为解决上述问题,本文提出一种自适应个性化联邦学习(adaptive personalized federated learning, APFL)算法,在同时包括空间和时间维度的多任务学习框架下,考虑面向异构数据的联邦优化问题.首先, APFL采用参数分解策略,将待训练模型参数分解为全局共享参数和客户端特定参数,在提取所有客户端公共知识的同时实现针对每个客户端的个性化建模.进一步地, APFL将每个客户端上执行的局部优化构建为顺序多任务学习,通过对全局共享参数的更新施加弹性权重巩固(elastic weight consolidation, EWC)惩罚,实现了全局共享模型中重要参数的记忆保留和非重要参数的快速学习.多个联邦基准数据集上的对比实验验证了本文方法的有效性和优越性.
关键词 联邦学习; 边缘计算; 异构数据; 多任务学习; 持续学习; 参数分解; 个性化; federated learning; edge computing; heterogeneous data; multi-task learning; continual learning; parameter decomposition; personalization;
Xuanming NI, Xinyuan SHEN, Hai ZHANG. Adaptive personalized federated learning for heterogeneous data: a method based on parameter decomposition and continual learning. Sci Sin Inform, 2022, 52(12): 2306-2320, doi: 10.1360/SSI-2021-0152
基于特征增广的生成—判别混合模型构建方法
张文钧, 蒋良孝, 张欢
中国科学: 信息科学, 2022, 52(10): 1792-1807
摘要 从概率框架的角度来看,生成模型首先由数据学习联合概率分布,然后再求出条件概率分布,通常具有更快的收敛速度;而判别模型由数据直接学习条件概率分布,往往具有更高的准确率.生成–判别混合模型作为二者的有效结合,同时集成了它们的优点.然而,现有方法在构建混合模型时,需要将原始特征划分为两个独立的特征空间,分别用于训练生成模型和判别模型.特征划分不仅提升了模型的时间复杂度,还削弱了原始特征空间的表达能力.为了解决这一问题,本文提出了一种基于特征增广的生成–判别混合模型构建方法.该方法首先利用生成模型学习条件概率分布,然后将学到的条件概率分布作为新特征增广到原始特征空间中,最后在增广后的特征空间中训练判别模型并预测最终的分类结果.该方法利用特征增广的思想做模型混合,无需对原始特征进行划分,具有较低的时间复杂度,同时还增强了原始特征空间的表达能力.在36个经典UCI标准数据集上的实验结果表明,所提方法不仅具有有效性和通用性,还遵循了偏差–方差权衡原则.
关键词 生成模型; 判别模型; 特征增广; 条件概率分布; 偏差–方差权衡; generative model; discriminative model; feature augmentation; conditional probability distribution; bias-variance trade-off;
Wenjun ZHANG, Liangxiao JIANG, Huan ZHANG. A feature augmentation-based method for constructing generative-discriminative hybrid models. Sci Sin Inform, 2022, 52(10): 1792-1807, doi: 10.1360/SSI-2021-0199
基于多尺度空洞卷积的知识图谱表示方法
杜昊桐, 王震, 聂弘毅, 姚权铭, 李学龙
中国科学: 信息科学, 2022, 52(7): 1204-1220
摘要 知识图谱嵌入是知识图谱研究中的一项重要课题.它旨在根据已观测到的三元组,学习知识图谱中实体与关系的低维向量表示.知识图谱嵌入在许多下游任务中发挥了巨大作用,例如知识图谱补全、三元组分类.如今,深度模型利用神经网络强大的非线性拟合能力,在知识图谱嵌入领域展示出了优异的性能.然而,现有的大多数方法忽略了实体与关系之间的多尺度特征交互, InceptionE是目前唯一考虑到了多尺度交互特征的模型,但由于大量的计算开销导致其很难进行训练.本文提出了一种全新的知识图谱嵌入模型MDCE,它使用多尺度空洞卷积核在不同的尺度空间捕捉丰富的交互特征.同时, MDCE相比于InceptionE方法的计算开销更小.我们在多个基准数据集上进行了大量实验.在链接预测任务上的结果表明, MDCE不仅在性能方面超过了已有的工作,而且更加高效、稳健.
关键词 知识图谱; 知识图谱嵌入; 深层模型; 多尺度特征; 链接预测; 人工智能; knowledge graph; knowledge graph embedding; deep model; multi-scale feature; link prediction; artificial intelligence;
Haotong DU, Zhen WANG, Hongyi NIE, et al. Multi-scale dilated convolutional network for knowledge graph embedding. Sci Sin Inform, 2022, 52(7): 1204-1220, doi: 10.1360/SSI-2021-0111
基于独立自表达学习的不完全多视图聚类
诸葛文章, 范瑞东, 罗廷金, 陶红, 侯臣平
中国科学: 信息科学, 2022, 52(7): 1186-1203
摘要 不完全多视图聚类是通过结合多视图数据的异构不完全特征来获得数据本征结构,从而提高聚类性能的一种学习范式.在实际应用中,各个视图除了缺失某些完整样本外,还会受到缺失值与异常值的影响,使得大部分传统的不完全多视图聚类方法失效.为解决上述问题,本文提出一种基于独立自表达学习的不完全多视图聚类方法.该方法通过自表达重构,补全缺失的特征的同时学习视图独有的自表达矩阵,然后为自表达矩阵添加低秩约束,更好地挖掘本征结构,并通过引入希尔伯特–施密特独立性准则来衡量不同视图间的差异性.多个数据集上的实验结果表明,所提方法在大多数情况下能取得较对比方法更优的聚类结果.
关键词 不完全多视图聚类; 特征任意缺失; 自表达; 差异性; incomplete multi-view clustering; arbitrary missing feature; self-presentation; diversity;
Wenzhang ZHUGE, Ruidong FAN, Tingjin LUO, et al. Incomplete multi-view clustering via independent self-representation learning. Sci Sin Inform, 2022, 52(7): 1186-1203, doi: 10.1360/SSI-2021-0070
珠算: 可微概率编程库的设计与实现
石佳欣, 陈键飞, 朱军
中国科学: 信息科学, 2022, 52(5): 804-821
摘要 概率模型为机器学习处理广泛存在的不确定性提供了强大的工具.概率编程利用计算机程序表示概率模型,支持采样和以任意观察值为条件进行的概率推断.长期以来,概率程序中的依赖关系往往是线性或广义线性的,许多成功的模型和推断算法往往都依赖于这一简化.然而,这也限制了概率程序的表达能力和灵活性.可微概率编程允许构建具有参数化的非线性依赖关系(如神经网络)的概率程序,并使用基于梯度的方法从数据中学习未知参数.这种编程范式容易扩展,极大地避免了繁琐的模型选择过程,且允许端到端地部署概率模型.本文介绍珠算(ZhuSuan),一种开源的可微概率编程库,并以此为例,探讨可微概率编程系统的设计与实现.
关键词 概率模型; 概率编程; 贝叶斯推断; 变分推断; 深度学习; probabilistic models; probabilistic programming; Bayesian inference; variational inference; deep learning;
Jiaxin SHI, Jianfei CHEN, Jun ZHU. ZhuSuan: design and implementation of differentiable probabilistic programming libraries. Sci Sin Inform, 2022, 52(5): 804-821, doi: 10.1360/SSI-2021-0005
局部-全局关系耦合的低照度图像增强
王克琪, 钱宇华, 梁吉业, 刘畅, 黄琴, 陈路, 贾洁茹
中国科学: 信息科学, 2022, 52(3): 443-460
摘要 卷积神经网络目前在人工智能多个领域均取得了不同程度的进展.卷积计算是基于参数共享的滑窗机制,这导致卷积神经网络更多地关注特征信息的局部关系,对全局关系的建模能力有限.局部关系和全局关系对特征的表达均具有重要的作用.为此,本文聚焦于如何对特征信息的局部–全局关系进行构建并有效耦合,从而挖掘更加丰富的特征信息,提高特征的判别性.本文提出了局部–全局关系耦合模块,该模块是由特征提取、基于深度卷积(depth-wise convolution, DWConv)的局部关系构建分支、基于多头自注意力机制(mutli-head self-attention, MHSA)的全局关系构建分支和基于点向卷积(point-wise convolution, PWConv)的关系耦合4部分组成.基于此模块,本文构建了编解码结构的局部–全局关系耦合神经网络,该网络可以对特征信息的局部–全局关系进行建模,增强特征信息的表征能力,进而提升模型的性能.为验证所提算法的有效性,本文在低照度图像增强任务上,使用基准数据集与其他算法进行了实验对比.实验结果表明,本文所提出的方法取得了较好的图像增强结果,优于当前先进的图像增强方法.最后,本文通过消融实验和扩展实验从多个角度进一步验证了有效耦合局部–全局关系的重要性和可扩展性.
关键词 低照度图像增强; 局部–全局关系; 计算机视觉; 卷积神经网络; 深度学习; low-light image enhancement; local-global relationship; computer vision; convolution neural network; deep learning;
Keqi WANG, Yuhua QIAN, Jiye LIANG, et al. Local-global coupling relationship based low-light image enhancement. Sci Sin Inform, 2022, 52(3): 443-460, doi: 10.1360/SSI-2021-0174
基于特征归因和泰勒展开引导重要度评价的梯度流剪枝
高畅, 王家祺, 景丽萍, 于剑
中国科学: 信息科学, 2022, 52(3): 430-442
摘要 卷积神经网络压缩是近年来研究的热点.本文将模型存在冗余的原因归结为部分卷积核未学到任务相关特征.为去除这部分冗余,本文基于剪枝框架,从卷积核学习任务相关特征的程度和卷积核对损失函数的影响两个角度出发,提出一种新颖的重要度评价标准.此评价标准能准确量化卷积核的重要度,并以此指导卷积核剪枝操作.此外,本文还将梯度流策略引入到卷积核剪枝的过程中,在每次训练迭代中根据重要性和压缩率将卷积核分成两类并对它们分别用不同的更新策略.对于冗余参数,此策略将目标函数反传的梯度进行截流,仅使其权重逐渐衰减直至为零.本文在VGGNet和ResNet两种网络框架上对此剪枝算法进行验证.结果表明:本算法不仅能够在分类精度、计算量、参数量和任务相关特征的保留程度上优于当前主流剪枝算法,而且在高压缩率情况下表现优越.
关键词 卷积神经网络; 压缩; 剪枝; 任务相关特征; 梯度流; convolutional neural networks; compressing; pruning; features related to task; gradient flow;
Chang GAO, Jiaqi WANG, Liping JING, et al. Gradient flow pruning based on the evaluation of the importance of characteristic attribution and Taylor-guidance. Sci Sin Inform, 2022, 52(3): 430-442, doi: 10.1360/SSI-2021-0172
群体智能系统的动力学模型与群体熵度量
罗杰, 姜鑫, 郭炳晖, 郑宏威, 吴文峻, 吕卫锋
中国科学: 信息科学, 2022, 52(1): 99-110
摘要 群体智能是自然界普遍存在的现象,受到了国内外研究者的广泛关注.网络和人工智能技术的高速发展,使得大规模群体在网络上通过个体智慧激发和群体智慧汇聚形成超越个体能力的群体智能成为可能.随之而来,如何认知和形成这样的群体智能系统成为了研究的热点.本文将在广义群体智能的概念体系之下,探索群体智能系统的度量理论和方法,以此来促进对群体智能形成机理的更深层认知.本文提出了群体智能系统的基本特性以及其形成的激发汇聚建模,指出群体智能系统实质上是一类复杂非线性动力学系统,包含微观个体激发、宏观群体协作、全局群智汇聚3个核心动力学属性.并以此为基础,讨论了群体智能系统群体熵度量所应满足的基本性质.最后以图的群体化搜索为例,说明了群体的激发和汇聚过程,以及在此过程中如何通过群体熵来度量群体行为的变化,验证了本文提出的群体熵度量思想的有效性.
关键词 群体智能系统; 动力学模型; 群体熵; 度量; 激发; 汇聚; crowd intelligence system; dynamic model; crowd entropy; measurement; incentive; convergence;
Jie LUO, Xin JIANG, Binghui GUO, et al. Dynamic model and crowd entropy measurement of crowd intelligence system. Sci Sin Inform, 2022, 52(1): 99-110, doi: 10.1360/SSI-2020-0193
面向半监督聚类的最优间隔分布学习机
张腾, 黎铭, 金海
中国科学: 信息科学, 2022, 52(1): 86-98
摘要 基于间隔的聚类是一类经典的聚类算法,此类算法假设聚类结构能通过引入监督学习中的间隔来确定.即一个好的聚类结果,当以其簇标记作为类别标记进行监督学习时,所得分类器产生的关于间隔的目标物理量也同时达到最优.目前最为有效的间隔物理量是间隔分布,其基于最新的间隔理论,取得了比优化最小间隔更好的效果.然而在现实聚类任务中,我们往往还能获得一些额外的监督信息,例如两两样本之间的"必连"约束和"勿连"约束,此时优化间隔分布是否还有效尚未可知.对此,本文提出面向半监督聚类的最优间隔分布学习机(ODMSSC),对该问题进行初步探索. ODMSSC对应的形式化是一个混合整数规划,我们将其放松成一个鞍点问题,并提出一种高效的交替优化方法进行求解.最终通过真实数据集上的实验,我们验证了所提算法的有效性.
关键词 半监督聚类; 约束聚类; 最优间隔分布学习机; 间隔分布; 间隔; semi-supervised clustering; constrained clustering; optimal margin distribution machine; margin distribution; margin;
Teng ZHANG, Ming LI, Hai JIN. Optimal margin distribution machine for semi-supervised clustering. Sci Sin Inform, 2022, 52(1): 86-98, doi: 10.1360/SSI-2021-0187
连续无监督异常检测
倪一鸣, 陈松灿
中国科学: 信息科学, 2022, 52(1): 75-85
摘要 无监督异常检测(unsupervised anomaly detection, UAD)旨在检测任何未见过的偏离预期模式或正常分布的数据,由于其学习过程不依赖对罕见异常样本的获取,因此在现实动态环境下备受青睐.然而,在现实场景中,目标任务往往会随时间动态变化,这要求模型能够连续执行多个不同的UAD任务,确保在仅有当前任务正常数据的前提下,实现对所有见过任务的异常检测.本文旨在研究这一问题,尝试从互信息角度,提出一种新的连续UAD (CUAD)算法.具体而言,我们针对原始目标依赖过往任务原始数据和异常数据的问题,给出基于信息论的损失函数,并对其进行近似优化.据此,我们构建出来的深度编码器模型既能连续执行不同的UAD任务,又能有效应对连续学习带来的灾难性遗忘问题.最后,我们在多个标准数据集上的实验验证了所提出方法的优越性.
关键词 异常检测; 无监督; 灾难性遗忘; 连续学习; 信息论; anomaly detection; unsupervised; catastrophic forgetting; continual learning; information theory;
Yiming NI, Songcan CHEN. Continual unsupervised anomaly detection. Sci Sin Inform, 2022, 52(1): 75-85, doi: 10.1360/SSI-2021-0192
基于单簇聚类的非对齐多视图异常检测算法
史小艳, 陈松灿
中国科学: 信息科学, 2021, 51(12): 2037-2052
摘要 多视图数据广泛存在于现实,而异常也不可避免地伴随其中.现有的多视图异常检测方法针对的都是对齐的多视图场景,无法胜任更具挑战的非对齐多视图场景.为此,本文提出了4种基于单簇可能性C–均值(possibilistic C-means, PCM),即P1M (PCM, C=1)算法的非对齐多视图异常检测算法.不同于对齐的多视图场景,非对齐特性造成了样本在各视图间对应关系的缺失,以致我们无法利用在对齐场景下示例级的局部关键信息.为此,我们设法通过各视图的全局信息进行学习.本文的关键之处在于借助交替优化法为各视图分别学得一个变换矩阵,用其将各视图投影到一个公共子空间,进而在该公共子空间中用P1M学得所有训练数据对目标类的隶属度,并设置隶属度阈值,从而实现异常检测.在多个UCI数据集上的实验结果表明,本文方法能够有效应对非对齐多视图场景中的异常检测.
关键词 可能性C–均值; 非对齐多视图; 异常检测; 公共子空间; 单簇; possibilistic C-means; non-aligned multi-view; anomaly detection; the common subspace; one-cluster;
Xiaoyan SHI, Songcan CHEN. Non-aligned multi-view anomaly detection algorithms based on one-cluster clustering. Sci Sin Inform, 2021, 51(12): 2037-2052, doi: 10.1360/SSI-2020-0141
基于隐式网络和显式网络相似性学习的零样本意图识别
孙鹏飞, 欧阳亚文, 戴新宇, 张文明
中国科学: 信息科学, 2021, 51(11): 1853-1866
摘要 意图识别是对话系统的一个重要组成部分.现有的工作主要集中在使用充足的标记数据进行意图识别.然而,这些方法不能识别训练数据中不存在的意图.为了解决这个问题,我们提出了一种基于隐式网络和显式网络的相似性学习模型,用于零样本意图识别,该模型能够从词级和句子级学习用户话术和意图描述之间的相似性.为了增强意图的表示,我们引入槽位类型作为意图描述.并依据表达方式的不同将意图分为显式意图和隐式意图,分别从词级和句子级构建显式网络和隐式网络.同时,为了更好地结合这两部分信息,我们还设计了关系层来融合不同层级的信息.在两个基准数据集上的实验结果表明,我们的模型明显优于现有的最先进的模型,并展示了从词级和句子级同时学习相似性的有效性.
关键词 零样本意图识别; 隐式网络; 显式网络; 关系层; 选择门; zero-shot intent detection; implicit network; explicit network; relation layer; switch gate;
Pengfei SUN, Yawen OUYANG, Xinyu DAI, et al. Similarity learning with implicit-network and explicit-network for zero-shot intent detection. Sci Sin Inform, 2021, 51(11): 1853-1866, doi: 10.1360/SSI-2020-0266
三元空间大数据网络关联表征
朱文武, 王鑫
中国科学: 信息科学, 2021, 51(11): 1802-1839
摘要 三元空间是由信息空间、物理世界、人类社会所构成,三元空间大数据由信息空间所产生的互联网数据、物理空间所产生的物联网数据和人类社会空间所产生的数据所构成.本文介绍了三元空间大数据的关联复杂性,并针对三元空间大数据关联复杂性这一本质困难,提出解决三元空间异构数据的关联表征这一关键科学问题.传统信息科学往往依据既有的先验信息进行特征表达,并在先验表征空间内分析信息语义及其关联关系.然而,在表征层面所引入的先验偏见,极大限制了信息理解和关联的广度和深度,使得蕴含于三元空间大数据之中的超出人类现有经验的知识难以被发掘.为解决上述难题,本文提出将三元空间数据关联关系通过拓扑图理论表征成网络或图以实现三元空间大数据的关联表征和融合分析.具体地,利用数据驱动的深层网络表征对三元空间异构数据的弱先验关联关系进行深度建模以保持原始数据间的异构关联关系,通过对非线性、非凸异构数据关联表达进行深度解离化计算以提升深层关联表征的鲁棒性与可解释性,借助拓扑图理论挖掘三元空间大数据中蕴含的异构关联关系以达到对三元空间异构关系的精准刻画.最后,本文从知识与数据双驱动、自适应,以及可推理三元空间大数据分析的角度对三元空间大数据关联表征的未来研究方向进行展望.
关键词 三元空间; 大数据; 关联表征; 深层表征; 网络表征; cyber-physical-human space; big data; correlational representation; deep representation; network representation;
Wenwu ZHU, Xin WANG. Cyber-physical-human big data correlational representation. Sci Sin Inform, 2021, 51(11): 1802-1839, doi: 10.1360/SSI-2020-0052
基于自适应对偶图与非凸约束的嵌入特征选择
尚荣华, 徐开明, 焦李成
中国科学: 信息科学, 2021, 51(10): 1640-1657
摘要 在传统的特征选择方法中,为了保证行的稀疏性,经常采用l_1范数或者l_(2,1)范数来约束评价矩阵.作为凸正则项,它们在多数情况下可以发挥良好的作用.然而在处理冗余性特征时,一些非凸正则项有望表现出更好的性能.借助自适应流形学习与非凸约束的优点,本文提出了一种新的算法,叫做基于自适应对偶图与非凸约束的嵌入特征选择(adaptive dual graphs and non-convex constraint based embedded feature selection, DNEFS).借助稀疏回归框架, DNEFS同时保留了数据空间与特征空间的流形结构信息.通过运用信息熵原理,对偶图中的局部流形信息可以自适应的学习与更新,因此可以获得更好的特征选择效果.不同于传统的凸约束,本文引入了一个新的非凸正则项,这一正则项由l_(2,1)范数与Frobenius范数的差分构成,并记为l_(2,1-2)范数.通过使用这一新正则项, DNEFS可以更好地处理冗余性的特征.本文运用交替迭代更新的方式来优化目标函数,并在6个基准数据集上测试DNEFS算法的性能.通过与6种对比算法做对比,实验结果表明提出的DNEFS优于对比算法的性能.
关键词 对偶图; 流形结构; 非凸约束; 嵌入; 特征选择; dual graphs; manifold structure; non-convex constraint; embedded; feature selection;
Ronghua SHANG, Kaiming XU, Licheng JIAO. Adaptive dual graphs and non-convex constraint based embedded feature selection. Sci Sin Inform, 2021, 51(10): 1640-1657, doi: 10.1360/SSI-2020-0055
基于本质自表示的多视角子空间聚类
于晓, 刘慧, 吴彦, 张彩明
中国科学: 信息科学, 2021, 51(10): 1625-1639
摘要 大数据时代,针对高维数据的聚类分析已成为数据挖掘的热点和难点问题,与此同时,近年来数据获取方式的重大变革推动了多视角研究快速兴起.多视角子空间聚类能够针对高维数据进行聚类,已成为目前聚类研究的一个重要分支.然而,现有部分方法直接从原始数据学习相似度矩阵,极易受到数据中噪声的影响.因此,本文提出了一种基于本质自表示的多视角子空间聚类方法 (intrinsic self-representation for multi-view subspace clustering, ISMSC),从数据的潜在表示中学习相似度矩阵,并利用数据的自表达特性将所有视角的特征融合成本质表示.然后,本文使用交替方向乘子法(alternating direction method of multipliers, ADMM)设计了有效的求解策略对模型进行优化.最后,将ISMSC在人造数据集和8个真实基准数据集上的实验结果与9种基准方法进行了对比,结果表明了模型的鲁棒性和有效性.
关键词 多视; 聚类; 子空间; 谱聚类; 稀疏; multi-view; clustering; subspace; spectral clustering; sparse;
Xiao YU, Hui LIU, Yan WU, et al. Intrinsic self-representation for multi-view subspace clustering. Sci Sin Inform, 2021, 51(10): 1625-1639, doi: 10.1360/SSI-2020-0274
基于联合分布核适配的迁移学习及其隐私保护
倪宣明, 沈鑫圆, 张海
中国科学: 信息科学, 2021, 51(10): 1609-1624
摘要 迁移学习利用不同但相关的源域标记数据来解决目标领域的学习问题,大多数减小域间分布差异的方法依赖于最大均值差异距离,但其仅仅能匹配域间数据分布的各阶矩.此外,隐私保护意识的增强限制了对数据源的访问,对迁移学习的发展提出了新的挑战.本文提出一种基于联合分布核适配的迁移学习及其隐私保护方法,直接在再生核希尔伯特空间中同时减小域间边缘分布和条件分布的差异,从而学习一个域不变核矩阵.此外,我们设置数据源双方首先访问一个相同的随机投影函数,然后聚合器发布基于目标扰动的差分隐私核分类器,在实现基于核的联合分布适配的同时,避免了数据源与聚合器直接共享原始特征数据.在多个文本和图像迁移学习基准数据集上进行了对比实验和参数分析,结果显示本文方法具有良好的有效性.
关键词 迁移学习; 隐私保护; 分布适配; 谱学习; 差分隐私; transfer learning; privacy protection; distribution adaptation; spectral learning; differential privacy;
Xuanming NI, Xinyuan SHEN, Hai ZHANG. Transfer learning based on joint distribution kernel adaptation and its privacy protection. Sci Sin Inform, 2021, 51(10): 1609-1624, doi: 10.1360/SSI-2020-0020
复杂担保网络中传染路径的风险评估
程大伟, 牛志彬, 刘新海, 张丽清
中国科学: 信息科学, 2021, 51(7): 1068-1083
摘要 中小企业贷款在促进技术创新、推动经济发展、改善民生和增加就业等方面有着重要的作用.为了满足商业银行的贷款评估标准,很多中小企业选择互相提供担保以获得授信,形成了结构复杂的担保网络.当借款方的贷款违约时,风险则沿着担保方向在网络中层层传播,由此造成的潜在系统性风险给国家的金融安全和监管带来了严峻的挑战.因此,迫切需要发展相应的方法从系统角度对复杂金融担保网络中的传染路径进行风险评估和预测.本文提出了一种基于深度学习的风险评估模型,该方法应用图神经网络和注意力机制直接从网络化的贷款行为数据中学习风险特征,无需依赖于金融领域专业知识的人工特征工程.实验结果表明,本文设计的方法在多数评价指标上均优于现有的7个对比的基准模型.在传染路径风险评估任务中,比基准方法在精确率和召回率的调和平均数(F1-score)方面平均提升了2%~15%.在新路径风险评估任务中,比最好的基准方法平均提升了3.5%.结果表明了本文设计方法在传染路径风险评估中的有效性,可为监管部门和金融机构对担保网络进行系统性风险评估提供方法理论基础.
关键词 风险评估; 传染路径; 担保网络; 图神经网络; 注意力机制
Dawei CHENG, Zhibin NIU, Xinhai LIU, et al. Risk assessment for contagion path in complex loan network. Sci Sin Inform, 2021, 51(7): 1068-1083, doi: 10.1360/SSI-2020-0028
EL-Picker: 基于集成学习的余震P波初动实时拾取方法
申大忠, 张琦, 徐童, 祝恒书, 赵雯佳, 殷子凯, 周培伦, 房立华, 陈恩红, 熊辉
中国科学: 信息科学, 2021, 51(6): 912-926
摘要 在实时地震监测中,地震P波(primary wave)的初动拾取任务具有至关重要的作用,其有助于地震应急响应的及时实施.虽然此前在该领域已开展了大量的研究,但是如何从地震分布密集并且充满噪声的监测波形中有效地识别出P波仍然是一个具有挑战性的任务.例如对于大地震的余震监测,实践中使用的普遍方法仍依赖于专家辅助标注.本文针对地震实时监测任务,基于集成学习策略,提出一个全新的技术框架——EL-Picker,实现从连续地震波形中自主拾取P波的初动到时.具体而言,EL-Picker包含3个模块,即触发器、分类器和精化器.其中,分类器模块借鉴集成学习策略,实现对多个个体学习器的整合,提升整体模型性能.基于汶川Ms8.0地震的余震数据集进行的大量实验,我们发现EL-Picker不仅较好地实现P波初动拾取效果,并且多诊断出120%被人工遗漏的地震P波.同时,实验结果也启发我们探索如何针对不同的地震站台选取个性化的个体学习器构建分类器模块.此外,我们进一步地讨论了被人工遗漏的地震波形的规律特点,用于指导人工地震标注.这些发现清晰地验证了EL-Picker框架的鲁棒性、时效性、灵活性以及稳定性.
关键词 P波拾取; 机器学习; 集成学习; 汶川余震; 实时地震监测
Dazhong SHEN, Qi ZHANG, Tong XU, et al. El-Picker: a machine learning-enhanced robust P-phase picker for real-time seismic monitoring. Sci Sin Inform, 2021, 51(6): 912-926, doi: 10.1360/SSI-2020-0214
联邦学习下对抗训练样本表示的研究
冯霁, 蔡其志, 姜远
中国科学: 信息科学, 2021, 51(6): 900-911
摘要 联邦机器学习系统由于能够在多方之间训练联合模型而无需各方共享训练数据,因此在学术界和工业界都获得了越来越多的关注和应用.与传统的机器学习框架相比,这类系统被认为具有保护数据隐私的良好潜力.另一方面,训练阶段攻击是一种通过故意扰动训练数据,从而希望在测试时操纵相应的学习系统预测行为的攻击方法.例如, DeepConfuse是最近的一种高效生成对抗训练数据的方法,展示了传统监督学习范式在此类攻击下的脆弱性.在本文中,作者扩展了DeepConfuse方法,将其应用在联邦机器学习框架中.这是首次针对联邦学习系统的训练阶段攻击.实验结果表明,在δ–准确率损失的衡量标准下,相比于传统的机器学习框架,联邦学习系统在DeepConfuse攻击下更加脆弱.
关键词 联邦学习; 学件; 表示学习
Ji FENG, Qi-Zhi CAI, Yuan JIANG. Towards training time attacks for federated machine learning systems. Sci Sin Inform, 2021, 51(6): 900-911, doi: 10.1360/SSI-2019-0145
一种基于对抗学习和语义相似度的社交网络跨媒体搜索方法
刘翀, 杜军平, 周南
中国科学: 信息科学, 2021, 51(5): 779-794
摘要 社交网络蕴含着丰富的多媒体信息,如何实现社交网络跨媒体信息的搜索已成为研究热点.基于深度学习的单一模态语义特征提取和学习在社交网络信息搜索上取得了较好的效果.在跨模态信息搜索时不同模态的数据特征不能直接比较,因此不同模态之间的语义鸿沟是亟待解决的关键问题.针对上述问题,本文提出了一种基于对抗学习和语义相似度的跨媒体搜索方法,实现了文本和图像之间的相互匹配、排序和搜索.该方法使用对抗学习方法框架构建训练特征映射网络和模态判别网络,其中特征映射网络使用多维语义分布向量将不同模态的数据映射到同一语义空间中,使得相同语义下的不同模态数据在该空间距离小,不同语义下相同模态数据距离大.使用语义分布及相似度作为特征映射网训练依据,模态判别网络负责判定空间中不同数据的模态.基于对抗学习交替训练两个网络,使得特征映射网络得到的数据和原数据语义一致,并消除模态特性,最终在同一空间内使用相似度来排序并得到搜索结果.实验结果表明本文提出的方法在文本和图像的相互搜索的map值比同类方法高,并验证了该方法在社交网络安全话题数据上的有效性.
关键词 跨媒体搜索; 对抗学习; 语义相似度; 社交网络; 搜索排序; cross-media retrieval; adversarial learning; semantic similarity; social network; search and rank;
Chong LIU, Junping DU, Nan ZHOU. A cross-media search method for social networks based on adversarial learning and semantic similarity. Sci Sin Inform, 2021, 51(5): 779-794, doi: 10.1360/SSI-2019-0120
稀疏连接的异步池计算网络
薄迎春, 张欣, 刘宝, 王平
中国科学: 信息科学, 2021, 51(5): 764-778
摘要 针对池计算网络的构建问题,提出了一种稀疏连接的异步神经元池构造方法,该方法将多个子神经元池顺序连接,并在子神经元池之间设置滞后环节,以实现各子神经元池对输入信息的异步处理,进而构成串行的记忆.为实现信息高效传输,子神经元池之间采用稀疏的连接方式.实验表明,所提方法能够有效地提高神经元池的记忆容量,易于解决长时依赖问题.此外,该结构能够使神经元池产生丰富的动力学行为,对初始参数也有较好的鲁棒性.
关键词 人工神经网络; 池计算; 记忆; 鲁棒性; 动力学; artificial neural network; reservoir computing; memory; robustness; dynamics;
Yingchun BO, Xin ZHANG, Bao LIU, et al. Sparsely connected asynchronous reservoir computing network. Sci Sin Inform, 2021, 51(5): 764-778, doi: 10.1360/SSI-2019-0183
生成式对抗网络的不稳定性分析及其处理技术
谭宏卫, 周林勇, 王国栋, 张自力
中国科学: 信息科学, 2021, 51(4): 602-617
摘要 生成式对抗网络(generative adversarial networks, GANs)训练的不稳定性问题一直是GANs研究领域最具挑战性的问题之一.目前,仍未从理论上找到影响GANs训练稳定性的根本原因及有效的解决办法.本文通过理论分析发现, GANs训练的不稳定性主要是由于训练最优判别器与最小化生成器之间相互矛盾所致.经逐步分析得出,控制判别器的Lipschitz常数是解决GANs不稳定性问题的关键,进而提出一种有针对性的梯度惩罚技术来解决此问题.最后,本文从损失函数的振荡幅度(收敛性)、梯度总体变化趋势,以及网络整体性能3个方面进行了全面对比实验.结果显示,本文所提出的惩罚技术对处理GANs训练的不稳定性问题具有显著的效果.
关键词 生成式对抗网络; 不稳定性分析; 惩罚技术; 梯度范数; Lipschitz常数; generative adversarial networks; instability analysis; penalty technique; gradient norm; Lipschitz constant;
Hongwei TAN, Linyong ZHOU, Guodong WANG, et al. Instability analysis for generative adversarial networks and its solving. Sci Sin Inform, 2021, 51(4): 602-617, doi: 10.1360/SSI-2019-0205
求解增量二分图优化问题的动态规划驱动的局部搜索算法
彭博, 卢晨贝, 赵岳虎, 苏宙行, 廖毅, 吕志鹏
中国科学: 信息科学, 2021, 51(4): 582-601
摘要 增量二分图优化问题(dynamic bipartite drawing problem, DBDP)是一个具有NP难度的组合优化问题,该问题在实际生产生活中有着广泛的应用.本文提出了一种新的动态规划驱动的局部搜索(DP-LS)算法来求解该问题.不同于文献中求解该问题和该类问题的所有启发式算法的邻域搜索方式(即每次邻域操作只对一个或两个节点进行插入或交换动作),本文提出的动态规划驱动的局部搜索算法能从邻域结构中挑选出并执行多个独立的邻域动作,大大提高了邻域搜索的效率. DP-LS算法从一个随机初始解出发,迭代地利用基于动态规划的局部搜索算法来寻找局部最优解,同时结合扰动机制跳出局部极值陷阱实现全局搜索.本文提出的增量评估方法能够快速评估基于插入和交换的邻域动作,可以大大提高算法的搜索效率.本文针对1120个公共算例进行了计算实验并同文献中已有算法(包括通用求解器Gurobi)进行对比,表明了所提出的动态规划驱动的局部搜索算法在解的优度和计算效率两方面的有效性.此外,通过对比实验表明了DP-LS算法中动态规划机制的有效性(提升近十倍的搜索效率).值得注意的是,本文提出的基于动态规划的局部搜索算法不仅能够用于求解DBDP问题,也能作为一种通用的启发式算法来求解其他组合优化问题,尤其是排序类优化问题.
关键词 增量二分图优化问题; 动态规划; 局部搜索; 增量评估机制; dynamic bipartite drawing problem; dynamic programming; local search; incremental evaluation technique;
Bo PENG, Chenbei LU, Yuehu ZHAO, et al. A dynamic programming-based local search algorithm for solving the dynamic bipartite drawing problem. Sci Sin Inform, 2021, 51(4): 582-601, doi: 10.1360/SSI-2019-0122
基于深度线性判别分析的哈希技术
胡迪, 聂飞平, 李学龙
中国科学: 信息科学, 2021, 51(2): 279-293
摘要 传统基于分类学习的监督哈希方法并不能完全满足哈希检索技术需求,但是线性判别分析却能够在一定程度上做到这一点.本文提出将线性判别分析作为深度网络的优化目标,以端到端训练的方式学习有效的哈希编码.但是,直接以上述目标训练神经网络就必须解决具有较高计算复杂度的特征值分解问题.在本文中,线性判别分析目标被转化为一个简单的最小均方问题,这种转化可以解决上述问题,同时可以利用成熟的优化方法优化网络.这种基于线性判别分析的深度网络拓展可以弥补传统判别分析在简单线性投影和特征学习上的劣势.本文在3个基准数据集上进行大量对比实验,相对于传统线性判别分析,本文所提方法在检索基准指标上有70%的提升,并超过大多数基于深度模型的哈希方法,这些实验结果证明了本文方法的有效性.
关键词 哈希技术; 线性判别分析; 最近邻检索; 深度网络; 量化技术; hashing technique; linear discriminant analysis; nearest-neighbor search; deep network; quantization technique;
Di HU, Feiping NIE, Xuelong LI. Deep linear discriminant analysis hashing. Sci Sin Inform, 2021, 51(2): 279-293, doi: 10.1360/SSI-2019-0175
基于地质知识蒸馏学习的油气储集层识别方法
李徵, 刘淇, 王喆锋, 郑毅, 林霞, 怀宝兴, 米兰, 陈恩红
中国科学: 信息科学, 2021, 51(1): 40-55
摘要 油气储集层识别是石油能源企业在勘测和开发业务中核心的任务之一.长期以来,油气行业一直依靠专家人工分析海量测井数据以对地下油气储集层进行定性分析,虽然专家解释结论有着很高的精准度,但是时间与经济成本都十分高昂.近些年来,随着以深度学习为代表的人工智能技术的迅速发展,智能油气储集层识别技术成为学术界和工业界共同关注的问题.然而,真实工业环境存在严重的传感数据不一致问题,给传统的监督学习模型带来巨大的挑战.本文针对传感器不一致情境中油气储集层识别任务展开研究,提出多尺度地质知识蒸馏网络的方法.首先,该方法提出一种多尺度特征自注意力融合机制来学习地质信息的多尺度动态表征.其次,该方法设计一种地质知识蒸馏学习模型,从非一致传感数据中学习额外的地质知识,进一步提升模型准确度.最后,在真实数据集上进行大量实验,结果充分证明本文提出的模型在油气储集层识别任务上的有效性和鲁棒性.
关键词 油气储集层识别; 地质知识; 蒸馏学习; 传感数据; 深度神经网络; oil and gas reservoirs detection; geological knowledge; distillation learning; sensor data; deep neural network;
Zhi LI, Qi LIU, Zhefeng WANG, et al. Method of oil and gas reservoir detection based on geological knowledge distillation learning. Sci Sin Inform, 2021, 51(1): 40-55, doi: 10.1360/SSI-2020-0178
K-近邻分类器鲁棒性验证: 从约束放松法到随机平滑法
王璐, 姜远
中国科学: 信息科学, 2021, 51(1): 27-39
摘要 本文研究K-近邻分类器的鲁棒性验证问题.形式化鲁棒性验证的目标是计算分类器在给定样本点上的最小对抗扰动的精确值或者最小对抗扰动的非平凡下界.我们将计算K-近邻分类器的最小对抗扰动形式化为一组二次规划问题.二次规划问题的数目随近邻参数K的增大呈指数级增长,精确求解该组二次规划问题往往不可行.约束放松法通过放松优化的约束项,可以在多项式时间内求解最小对抗扰动的下界.然而,本文通过理论分析和实验发现,当近邻参数K取值较大时,约束放松法求得的下界往往过于宽松,甚至会出现K越大下界越小的反直觉结果.为解决这一问题,本文提出使用随机平滑法对K-近邻分类器进行鲁棒性验证.随机平滑法利用了K-近邻分类器对高斯(Gauss)白噪声鲁棒的特点,获得了较为理想的鲁棒性验证效果.基准数据集上的实验结果表明,相比于最新的鲁棒神经网络,"随机平滑的" K-近邻分类器展现出了更好的验证鲁棒性.
关键词 监督学习; 对抗机器学习; 对抗鲁棒性; 鲁棒性验证; K-近邻分类器; supervised learning; adversarial machine learning; adversarial robustness; robustness verification; K-NN classifier;
Lu WANG, Yuan JIANG. Robustness verification of K-NN classifiers via constraint relaxation and randomized smoothing. Sci Sin Inform, 2021, 51(1): 27-39, doi: 10.1360/SSI-2020-0172
基于特征归因重要度评价的卷积网络剪枝
张彪, 杨朋波, 桑基韬, 于剑
中国科学: 信息科学, 2021, 51(1): 13-26
摘要 近几年,深度模型在诸多任务中取得了巨大成功,但是深度模型需要大量的存储和计算资源实现精确决策,研究者为了将深度模型应用到资源受限的终端设备中,设计了模型压缩的优化策略来降低模型占存和计算量.本文基于剪枝压缩框架,从卷积核重要度评价的角度提出了两种模型剪枝算法.(1)由于每个卷积核都可以学习到其独有特征信息,因此本文提出了一种归因评价机制用于评价卷积核所学特征与因果特征的相关度,将模型中与因果特征相关度较低的卷积核进行裁剪,以实现模型压缩的目的,同时也能够保留原模型的归因特征,称此算法为归因剪枝.(2)第2种剪枝算法基于迭代优化剪枝框架,采用卷积通道和梯度中正相关特征评价相应卷积核重要度,以便于提高剪枝冗余卷积核的精准度,称为Taylor-guided剪枝算法.本文在VGGNet和ResNet两种网络架构上进行实验验证,结果表明:归因剪枝算法可以极大地保留原模型的归因特征;并且两种剪枝算法能够取得比当前主流剪枝算法更优异的压缩效果.
关键词 深度学习; 网络剪枝; 归因; 压缩; Taylor展开; deep learning; network pruning; attribution; compression; Taylor expansion;
Biao ZHANG, Pengbo YANG, Jitao SANG, et al. Convolution network pruning based on the evaluation of the importance of characteristic attributions. Sci Sin Inform, 2021, 51(1): 13-26, doi: 10.1360/SSI-2020-0186
基于决策树模型重用的分布变化流数据学习
赵鹏, 周志华
中国科学: 信息科学, 2021, 51(1): 1-12
摘要 在很多真实应用中,数据以流的形式不断被收集得到.由于数据收集环境往往发生动态变化,流数据的分布也会随时间不断变化.传统的机器学习技术依赖于数据独立同分布假设,因而在这类分布变化的流数据学习问题上难以奏效.本文提出一种基于决策树模型重用的算法进行分布变化的流数据学习.该算法是一种在线集成学习方法:算法将维护一个模型库,并通过决策树模型重用机制更新模型库.其核心思想是希望从历史数据中挖掘与当前学习相关的知识,从而抵御分布变化造成的影响.通过在合成数据集和真实数据集上进行实验,我们验证了本文提出方法的有效性.
关键词 机器学习; 分布变化; 流数据; 模型重用; 集成学习; 动态环境; machine learning; distribution change; data stream; model reuse; ensemble methods; dynamic environments;
Peng ZHAO, Zhi-Hua ZHOU. Learning from distribution-changing data streams via decision tree model reuse. Sci Sin Inform, 2021, 51(1): 1-12, doi: 10.1360/SSI-2020-0170
可成长软件专题
深度学习模型终端环境自适应方法研究
郭斌, 仵允港, 王虹力, 王豪, 刘思聪, 刘佳琪, 於志文, 周兴社
中国科学: 信息科学, 2020, 50(11): 1629-1644
摘要 随着人工智能和物联网的快速发展与融合,智能物联网AIoT正成长为一个极具前景的新兴前沿领域,其中深度学习模型的终端运行是其主要特征之一.针对智能物联网应用场景动态多样,以及物联网终端(智能手机、可穿戴及其他嵌入式设备等)计算和存储资源受限等问题,深度学习模型环境自适应正成为一种新的模型演化方式.其旨在确保适当性能的条件下,能自适应地根据环境变化动态调整模型,从而降低资源消耗、提高运算效率.具体来说,它需要主动感知环境、任务性能需求和平台资源约束等动态需求,进而通过终端模型的自适应压缩、云边端模型分割、领域自适应等方法,实现深度学习模型对终端环境的动态自适应和持续演化.本文围绕深度学习模型自适应问题,从其概念、系统架构、研究挑战与关键技术等不同方面进行阐述和讨论,并介绍我们在这方面的研究实践.
关键词 智能物联; 环境自适应; 模型演化; 深度模型压缩; 云边端模型分割; 领域自适应; AIoT; context-aware adaptation; model evolution; deep learning model compression; edge-based model partition; domain adaptation;
Bin GUO, Yungang WU, Hongli WANG, et al. Context-aware adaptation of deep learning models for IoT devices. Sci Sin Inform, 2020, 50(11): 1629-1644, doi: 10.1360/SSI-2020-0067
公平性机器学习中基于分类间隔的歧视样本发现和消除算法
石鑫盛, 李云
中国科学: 信息科学, 2020, 50(8): 1255-1266
摘要 公平性学习是机器学习领域的研究热点,预防歧视的目的在于执行预测任务之前消除不公平训练集对于分类器的影响.为了保证分类公平性和准确性,本文通过发现和消除原始数据集中的歧视样本寻找生成公平数据集的方法,即提出了一种基于分类间隔的加权方法用于处理二分类任务中的歧视现象,并在demographic parity和equalized odds公平性判定准则上实现分类公平.为了不影响分类准确性,本文基于最大间隔原理将样本投影之后选出目标集,对于目标集中的每个样本,通过加权距离度量方法判定该样本是否具有歧视性,并进行修正.通过在3个真实数据集上与已有方法进行实验对比,本文的方法能够获得更好的分类公平性和准确性,并且不局限于特定的公平性判定准则和分类器.
关键词 公平性学习; 分类间隔; 目标集; 加权距离度量; 歧视性; fairness learning; classification margin; target set; weighted distance metric; discriminatory;
Xinsheng SHI, Yun LI. Discriminatory sample identifying and removing algorithms based on margin in fairness machine learning. Sci Sin Inform, 2020, 50(8): 1255-1266, doi: 10.1360/SSI-2019-0112
基于样本稳定性的聚类方法
李飞江, 钱宇华, 王婕婷, 梁吉业, 王文剑
中国科学: 信息科学, 2020, 50(8): 1239-1254
摘要 数据类型和分布的复杂化导致样本间关系的不确定性增强,给有效挖掘数据的潜在类簇结构带来挑战.为降低样本关系不确定性对数据聚类带来的影响,本文将聚类集成中样本稳定性概念扩展至聚类分析中.本文从理论上分析样本稳定的合理性,并提出基于信息熵的样本稳定性度量方法.此外,本文提出一个基于样本稳定性的聚类方法,该方法先将数据分为稳定样本集和不稳定样本集,然后挖掘稳定样本的团簇结构,并将不稳定样本划分至该团簇结构中.最后,本文通过二维人造数据和图像分割场景可视化显示样本稳定性的合理性,并在基准数据集上验证本文所提聚类算法的有效性.
关键词 机器学习; 无监督学习; 聚类分析; 样本稳定性; 稳定性理论; machine learning; unsupervised learning; clustering analysis; sample's stability; stability theory;
Feijiang LI, Yuhua QIAN, Jieting WANG, et al. Clustering method based on sample's stability. Sci Sin Inform, 2020, 50(8): 1239-1254, doi: 10.1360/SSI-2019-0110
基于共享随机效应和特异稀疏效应的混合多任务学习模型
彭毫, 王雎, 王尧
中国科学: 信息科学, 2020, 50(8): 1217-1238
摘要 在多任务学习问题中,随机效应(random effects)可能同时存在于所有子任务中,而每个子任务又存在对应的稀疏效应(sparse effects).这在文本分析尤其在对电影评论的情感分析中,尤为常见.在本文中,我们提出一种用于数据中同时存在共享随机效应和特定稀疏效应的混合多任务学习模型,并命名为MSS (multi-task learning with shared random effects and specific sparse effects)模型.在模型的建立过程中,我们利用Bayes框架,针对不同效应的特点设定不同的先验分布和超参数.在模型的求解过程中,我们使用变分推断克服Bayes推断中的计算难题,使MSS模型在大规模数据分析中具备广泛的适应性.通过全面的模拟数据实验和真实数据实验的分析结果,我们展示了MSS模型在模型预测和变量选择方面同时具备随机效应模型(random effects models)和稀疏回归模型(sparse regression models)的优势,相比已有方法大幅提高泛化性能. MSS模型通过对多任务学习模型中不同效应的区分,能够更加有效的识别模型中的共享随机效应和特异稀疏效应,进而增强模型在模型预测和变量选择方面的性能.
关键词 多任务学习; 随机效应; 稀疏性; 变量选择; Bayes推断; multi-task learning; random effects; sparsity; variable selection; Bayesian inference;
Hao PENG, Ju WANG, Yao WANG. Multi-task learning with shared random effects and specific sparse effects. Sci Sin Inform, 2020, 50(8): 1217-1238, doi: 10.1360/N112018-00304
基于网络嵌入方法的耦合网络节点表示学习
韩忠明, 刘聃, 郑晨烨, 刘雯, 段大高, 董健
中国科学: 信息科学, 2020, 50(8): 1197-1216
摘要 网络节点表示学习是网络数据分析挖掘中的一个基础问题,通过学习网络节点表示向量,可以更加精准地对网络节点进行表征.近年来,随着深度学习的发展,嵌入方法在网络节点表示学习方面得到了广泛应用.同时,网络数据在规模、模态等特征方面也有了很大的变化,研究重点从单网络分析挖掘逐渐演变至耦合网络分析挖掘.本文首先分析了嵌入方法在单网络节点表示学习中的研究现状,对比了现有方法的优劣.然后借鉴单网络中嵌入方法的思想,针对耦合网络提出了耦合网络嵌入模型CWCNE.针对耦合网络的特性,改进了嵌入方法中的游走算法,提出了一种网络间带约束的随机游走策略;同时改进了模型的训练方法,使用网络间迭代训练的方式来学习模型参数.最后使用了社交耦合网络、学术耦合网络、影视耦合网络、诗词耦合网络、著作耦合网络等5组数据集验证了CWCNE的有效性.并在社团划分、实体识别、标签分类等任务上取得了良好的结果.
关键词 网络嵌入; 节点向量; 耦合网络; 表示学习; 社团划分; 主体识别; 标签分类; network embedding; vertex vector; coupling network; representation learning; community detection; entity recognition; label classification;
Zhongming HAN, Dan LIU, Chenye ZHENG, et al. Coupling network vertex representation learning based on network embedding method. Sci Sin Inform, 2020, 50(8): 1197-1216, doi: 10.1360/N112018-00182
大数据分析专题
基于长短时预测一致性的大规模视频语义识别算法
王铮, 翁泽佳, 王锐, 陈静静, 姜育刚
中国科学: 信息科学, 2020, 50(6): 877-891
摘要 片段视频语义识别旨在识别视频中短小片段的语义概念,是视频分析的一项重要任务.由于片段视频的数量巨大且缺乏可参考的网络标签,片段视频的标记十分困难,通常只能对部分片段视频进行标记.如何利用有限的语义标签提高片段视频语义识别的准确率是一项关键挑战.因此本文提出了一种基于长短时预测一致性的视频语义识别算法.该算法通过引入完整视频语义与片段视频语义一致性的约束,对片段视频语义识别结果进行筛选,以此提高片段视频语义识别的准确率.本文提出的算法在大规模视频数据集YouTube-8M的片段视频语义识别任务上达到了82.62%的平均均值准确率(mean average precision, MAP)识别精度,在第三届YouTube-8M比赛中排名第二.
关键词 大规模视频语义识别; 片段视频语义识别; 语义一致性; 特征聚合; 预测可靠性; large-scale video semantic recognition; segment-level semantic recognition; semantic consistency; feature aggregation; reliable prediction;
Zheng WANG, Zejia WENG, Rui WANG, et al. Large-scale video semantic recognition based on consistency of segment-level and video-level predictions. Sci Sin Inform, 2020, 50(6): 877-891, doi: 10.1360/SSI-2020-0014
大数据分析专题
基于视觉—文本关系对齐的跨模态视频片段检索
陈卓, 杜昊, 吴雨菲, 徐童, 陈恩红
中国科学: 信息科学, 2020, 50(6): 862-876
摘要 近年来,视频数据资源的日益丰富催生了一系列对于视频片段精细检索的需求.在这样的背景下,对于跨模态视频片段检索的研究逐渐兴起,其旨在根据输入的查询文本,输出一段视频中符合文本描述的片段.现有的研究工作主要关注于查询文本与视频片段的全局或局部的特征表达,而忽略了查询文本与视频片段中所蕴含的语义关系在跨模态检索中的匹配.例如,给定查询文本"一个人在打篮球"时,现有检索系统将根据整个查询文本和的视频的特征,或者关注于文本与视频中所表现的实体(如"人","篮球")来计算合适的视频片段,而缺乏对于"人打篮球"这类语义关系的考虑.因此,它们将难以辨别语义关系上的不同,从而限制了检索质量的提升.为了解决这个问题,本文提出跨模态关系对齐的图卷积框架CrossGraphAlign,通过分别构建文本关系图(textural relationship graph)与视觉关系图(visual relationship graph)来建模查询文本与视频片段中的语义关系,再通过跨模态对齐的图卷积网络来评估文本关系与视觉关系的相似度,从而帮助构建更加精准的视频片段检索系统.在公开的跨模态视频片段检索数据集TACoS和ActivityNet Captions上的实验结果表明,本文提出的方法可以有效地利用语义关系来提升跨模态视频片段检索的召回率.
关键词 关系对齐; 语言关系; 视觉关系; 图卷积网络; 跨模态视频片段检索; relationship alignment; textual relationship; visual relationship; graph convolutional network; cross-modal video moment retrieval;
Joya CHEN, Hao DU, Yufei WU, et al. Cross-modal video moment retrieval based on visual-textual relationship alignment. Sci Sin Inform, 2020, 50(6): 862-876, doi: 10.1360/SSI-2019-0292
大数据分析专题
一种高可读低冗余实体摘要的生成方法
刘庆霞, 程龚, 瞿裕忠
中国科学: 信息科学, 2020, 50(6): 845-861
摘要 随着万维网的发展,知识图谱数据大量增长,并在面向智能应用的研究中受到广泛关注.知识图谱用RDF (resource description framework)三元组描述实体相关的事实.在知识图谱中,关于一个实体的描述可能包含大量三元组,在一些需要直接呈现实体信息的应用中,为了避免用户信息过载,并适应有限的呈现空间,就需要进行实体摘要.实体摘要任务是从实体描述的众多三元组中选出最有代表性的子集作为摘要,以呈现给用户阅读.本文提出一种新的实体摘要方法 ESSTER以生成具备高可读性和低冗余性的实体摘要.该方法结合三元组的结构与文本特征,基于结构特性度量知识图谱中三元组的重要性,基于N元语法和文本语料度量三元组的可读性,基于逻辑推理、数值比较和文本相似判断三元组间的冗余关系.综合这3种技术要素,将实体摘要问题建模为组合优化问题进行求解.本文在两个由人工标注的公开数据集上与6种现有方法进行了对比实验,结果表明本文提出的方法效果达到了当前最佳水平.
关键词 知识图谱; 实体摘要; 冗余性; 可读性; 组合优化; knowledge graph; entity summarization; redundancy; readability; combinatorial optimization;
Qingxia LIU, Gong CHENG, Yuzhong QU. Entity summarization with high readability and low redundancy. Sci Sin Inform, 2020, 50(6): 845-861, doi: 10.1360/SSI-2019-0291
大数据分析专题
基于邻域视角的关联关系挖掘方法
成红红, 钱宇华, 胡治国, 梁吉业
中国科学: 信息科学, 2020, 50(6): 824-844
摘要 识别海量变量间潜在的复杂关联关系,判断不同形式关联关系的强弱,是大数据关联关系挖掘的重要任务之一.然而,数据分布的不确定性、关联关系的多样性,使得基于分布假设的关联关系度量和基于数据驱动的非参数度量方法的适用性、准确性难以保证.因此,设计一种对关联关系形式无偏的有效关联度量方法变得至关重要.本文从大数据背景下潜在关联关系应被公平排序的需求出发,回顾了目前关联度量的公理化条件,给出了大数据关联关系度量可能需满足的性质;讨论了两类基于邻域视角的度量方法存在的不足;提出了本文基于k-NN粒的关联度量方法,称为最大邻域系数.人造数据集和真实数据集实验从不同角度验证了本文所提方法的有效性和优越性.最后指出了实验中发现的有趣现象和有待解决的理论问题,以引起对该领域更深入的思考和研究.
关键词 大数据; 复杂关联关系挖掘; 关联度量; 数据驱动; 粒计算; k-NN粒; big data; complex associations mining; association measure; data-driven; granular computing; k-NN granule;
Honghong CHENG, Yuhua QIAN, Zhiguo HU, et al. Association mining method based on neighborhood perspective. Sci Sin Inform, 2020, 50(6): 824-844, doi: 10.1360/SSI-2020-0009
大数据分析专题
一种保持语义关系的词向量复用方法
李新春, 詹德川
中国科学: 信息科学, 2020, 50(6): 813-823
摘要 在基于深度网络的自然语言处理任务中,嵌入表示层用词向量刻画词的语义信息,可以有效地提升模型性能.词向量可以和当前任务一起端到端地进行学习,但是从模型参数数量的角度来看,词向量的训练很容易在小语料库上过拟合.为了解决这个问题,通常会使用在大语料库上预训练得到的词向量.首先,本文总结了几种常见的复用预训练词向量的方法.其次,由于当前任务的变化,会有一些新词出现,这些新词的词向量不能通过预训练的词向量获得,因此本文提出了一种保持语义关系的词向量复用算法(SrpWer). SrpWer首先对当前数据集中词语之间的关系进行建模,然后结合预训练的词向量生成新词对应的词向量.实验结果验证了SrpWer的有效性.
关键词 自然语言处理; 词向量; 模型复用; 新词; 深度学习; natural language processing; word embeddings; model reuse; new words; deep learning;
Xinchun LI, Dechuan ZHAN. A semantic relation preserved word embedding reuse method. Sci Sin Inform, 2020, 50(6): 813-823, doi: 10.1360/SSI-2019-0284
大数据分析专题
基于众包学习的交互式特征选择方法
陈长建, 姜流, 雷娜, 刘世霞
中国科学: 信息科学, 2020, 50(6): 794-812
摘要 集成特征选择算法将多种特征选择方法结果结合在一起,旨在得到更加有效的特征子集.然而这些算法通常假设每种特征选择方法是平等的,没有考虑不同特征选择方法性能的差异性,导致少数方法选择出的有效特征被忽略.为解决这一问题,本文提出一种可以有效地结合不同特征选择方法优势,并利用专家的知识逐步改善所选特征的交互式特征选择方法.该方法包括一个基于众包学习的集成特征选择算法和一个基于该算法开发的可视分析系统.基于众包学习的集成特征选择算法利用众包学习模型对不同特征选择方法的性能进行建模,计算每种方法的可靠性,并在此基础上将这些方法的结果有机融合.可视分析系统提供了丰富的排序方式,帮助专家理解单个特征选择方法的特征选择结果和特征在分类任务中所起的作用,从而让专家交互迭代地改善现有特征子集.在4个真实世界数据集上的数值实验表明,相比于现有的集成特征选择算法,本文提出的算法能够带来0.63%~2.85%分类准确率的提升.此外,在文本和图像数据集上进行的两个案例分析表明,本文提出的可视分析系统能够进一步带来0.28%~5.24%的分类准确率提升.
关键词 集成特征选择; 众包学习; 可视分析; 交互式可视化; 排序可视化; ensemble feature selection; learning-from-crowds; visual analysis; interactive visualization; ranking visualization;
Changjian CHEN, Liu JIANG, Na LEI, et al. An interactive feature selection method based on learning-from-crowds. Sci Sin Inform, 2020, 50(6): 794-812, doi: 10.1360/SSI-2019-0208
大数据分析专题
元自步学习
束俊, 孟德宇, 徐宗本
中国科学: 信息科学, 2020, 50(6): 781-793
摘要 自步学习是近年来机器学习领域提出的一种启发于人和动物"由易到难"学习过程的学习机制.尽管自步学习已取得可喜的理论与应用进展,但是当前的自步学习算法仍存在超参数选择的瓶颈问题.针对该问题当前主要采用一些启发式的手工设计方法或者交叉验证方法,然而此类方法效率很低,缺乏理论性指导,难以推广应用到广泛的实践问题中.针对这一挑战性问题,本文提出一种基于元学习机理的自步学习算法,该方法能使自步学习中涉及的超参数以数据驱动的方式自动习得,从而大大减弱了自步学习的这一核心问题.特别地,我们针对3种典型的自步学习实现格式,将所提元学习策略实质性嵌入,通过回归和分类实验验证了所提算法的准确性和泛化性,特别验证了相比于传统超参设置方法的显著优越性.
关键词 自步学习; 元学习; 样本加权; 噪声标记下学习; 超参数选择; self-paced learning; meta learning; sample re-weighting; learning with noisy labels; hyper-parameter tuning;
Jun SHU, Deyu MENG, Zongben XU. Meta self-paced learning. Sci Sin Inform, 2020, 50(6): 781-793, doi: 10.1360/SSI-2020-0005
基于模型分解的小样本学习
叶翰嘉, 詹德川
中国科学: 信息科学, 2020, 50(5): 662-674
摘要 机器学习依赖大量样本的统计信息进行模型的训练,从而能对未知样本进行精准的预测.搜集样本及标记需要耗费大量的资源,因而如何基于少量样本(few-shot learning)进行模型的训练至关重要.有效的模型先验(prior)能够降低模型训练对样本的需求.本文基于元学习(meta learning)框架,从相关的、类别不同的数据中学习模型先验,并将这种先验应用于新类别的少样本任务.与此同时,本文提出"模型组合先验"(MCP, model composition prior)方法,通过目标函数的最优条件对模型结构进行分解,并分别估计模型的各个组成部分,得到有效的分类器.这种分解方式具有较高的可解释性,能够指导在不同小样本任务中"共享"与"独立"的成分,从而指导元学习的具体实现.在人造数据中,本文方法能够恢复出小样本任务之间的关联性;在图像数据上, MCP方法能取得比当前主流方法更优异的效果.
关键词 小样本学习; 元学习; 模型先验; 模型分解; few-shot learning; meta-learning; model prior; model composition;
Han-Jia YE, De-Chuan ZHAN. Few-shot learning via model composition. Sci Sin Inform, 2020, 50(5): 662-674, doi: 10.1360/N112018-00332
信息系统在复杂应用中的科学与技术专刊
基于最大平均熵率的大数据关联聚类算法
张俪文, 王涛, 罗坚, 杨树森, 徐宗本
中国科学: 信息科学, 2019, 49(12): 1572-1585
摘要 聚类是数据挖掘和机器学习中的基本任务之一.传统聚类方法由于其设计中对簇结构假设的限制,导致算法在不符合其假设的数据集上,尤其是大型高维数据集上的聚类效果较差.本文引入了最大平均熵率的概念,设计了一种基于图的关联聚类算法.该算法将关联聚类问题分解为多个独立的单类优化问题,并利用邻域消除了关联聚类对大数据的限制.算法实现通过启发式邻域搜索和类生成简化了对最优邻域和关联聚类的求解过程,并且设计了适应分布式计算平台的图迭代方法.与其他聚类算法相比,该算法在提高计算效率的同时,对簇结构假设相对灵活,可适用于多种分布数据.在聚类实验中,算法的f1-measure和purity指数均好于其他6种聚类算法,而且对于高维大数据集,算法的运行时间远远低于其他聚类算法.
关键词 聚类; 相关聚类; 熵率; 图聚类; 大数据; clustering; correlation clustering; entropy-rate; graph-based clustering; big data;
Liwen ZHANG, Tao WANG, Jian LUO, et al. Maximum average entropy-rate based correlation clustering for big data. Sci Sin Inform, 2019, 49(12): 1572-1585, doi: 10.1360/SSI-2019-0117
基于层次特征融合哈希的近似重复视频检索方法
聂秀山, 林培光, 杨明哲, 尹义龙
中国科学: 信息科学, 2018, 48(12): 1697-1708
摘要 近年来,由于互联网上视频数量的爆炸式增长,基于视频哈希(Hash)的近似重复视频检索已经吸引了越来越多的研究者关注.在现有方法中,视频的视觉特征,包括单一特征以及多特征融合的方法被广泛应用于近似重复视频检索算法中.而低层视觉特征在表达高层语义方面存在不足,使得近似重复视频检索的性能变低.针对这一问题,本文提出了一种基于层次特征融合的视频哈希方法,用于近似重复视频检索.该方法首先从视频中提取低层人工定义特征,然后利用卷积神经网络提取中间层深度特征以及高层语义特征,最后把不同层级的特征融合起来,利用层次特征和样本之间的全局结构关系以及各特征之间的互补性,学习得到视频哈希,进而进行近似重复视频检索.该方法在CC-WEB-VIDEO数据库上进行了实验,实验结果证明本文方法与现有的方法相比在性能上有较大提升.
关键词 近似重复视频检索; 视频哈希; 层次特征; 特征融合; 监督学习; near-duplicate video retrieval; video hashing; hierarchical feature; feature fusion; supervised learning;
Xiushan NIE, Peiguang LIN, Mingzhe YANG, et al. Hierarchical feature fusion hashing for near-duplicate video retrieval. Sci Sin Inform, 2018, 48(12): 1697-1708, doi: 10.1360/N112018-00136
基于客户端的个性化邮件再过滤系统
徐丹丹, 陈松灿
中国科学: 信息科学, 2018, 48(12): 1681-1696
摘要 电子邮件是一种必不可少的通讯工具,但是众多的垃圾邮件会严重影响用户的工作和生活,甚至还会造成财产损失.由于兴趣、爱好的不同,用户对垃圾邮件的定义可能存在巨大差异,因此实现个性化垃圾邮件过滤成为目前邮件过滤领域研究的重要课题.当出现邮件错滤情况,用户不得不手动修改,这给用户体验带来了极大不便.为了有效解决上述问题,并实现个性化邮件过滤及错滤邮件自动修改等功能,本文结合规则和统计方法提出了一种基于客户端的个性化邮件再过滤系统.大部分现有的垃圾邮件过滤器仅对邮件数据流进行在线过滤,而未考虑不同邮箱的邮件类先验存在差异和类不平衡问题,本过滤系统首先对进入收件箱和垃圾箱的邮件进行分别处理,然后基于多任务学习原理设计了两个互学习的过滤器分别用于收件箱和垃圾箱的邮件再过滤,并对错滤邮件进行自动修改.同时,为保证在随时间变化的用户兴趣点和邮件数据分布情况下过滤器的性能,设计了结合重要性加权的多窗口学习框架,从而有效实现了过滤器的动态自适应.最后,在TREC 2006c和2007p数据集上验证了我们所提出的过滤器拥有显著的过滤效果.
关键词 垃圾邮件过滤; 个性化邮件再过滤; 自动修正; 重要性加权; 多任务学习; 多窗口学习框架; spam filtering; personalized mail re-filtering; automatic correction; importance weights; multi-task learning; multi-window learning framework;
Dandan XU, Songcan CHEN. A personalized mail re-filtering system based on the client. Sci Sin Inform, 2018, 48(12): 1681-1696, doi: 10.1360/N112018-00138
一种基于多示例多标记学习的新标记学习方法
朱越, 姜远, 周志华
中国科学: 信息科学, 2018, 48(12): 1670-1680
摘要 多标记学习是一种应用非常广泛的学习范式,其中,一个对象可能同时与多个标记相关联.传统的多标记学习研究多假设训练数据中观察到的标记分布与测试数据的真实标记分布一致.但在实际应用中,训练数据中可能存在一些从未被标注出的新标记.在预测时,不仅希望能够在目标标记集合(已知标记)上取得好的性能,还要求能够检测出样本是否存在新标记.针对这种多标记新标记学习问题,本文提出了一种端到端的多视图多示例多标记学习方法 EM3NL.该方法基于卷积神经网络产生多示例包,并通过最小化包上观察标记的错分损失和对新标记预测值排序损失的惩罚以及对多视图预测不一致的惩罚同时学习图像,文本两个视图的特征表示以及已知标记和新标记的预测函数.在大规模图片–文本真实数据集上验证了EM3NL在已知标记学习和新标记检测任务上的有效性.
关键词 多标记新标记学习; 多示例多标记学习; 多视图学习; 深度学习; multi-label learning with new labels; multi-instance multi-label learning; multi-view learning; deep learning;
Yue ZHU, Yuan JIANG, Zhi-Hua ZHOU. Multi-instance multi-label new label learning. Sci Sin Inform, 2018, 48(12): 1670-1680, doi: 10.1360/N112018-00143
人工智能优青专刊
脑影像智能分析
张道强, 朱旗, 郝小可, 邵伟, 王明亮, 黄嘉爽, 黄硕
中国科学: 信息科学, 2018, 48(5): 589-602
摘要 近年来,"脑科学计划"吸引了各国政府和公众的广泛关注.脑影像技术是研究脑科学的重要工具之一,然而由于脑影像数据所固有的高维度、多模态、异构和时变等特性,对其进行快速有效分析是当前研究的热点之一.在本文中,首先简要介绍脑影像分析的基本方法,接着回顾作者及其团队近几年在多模态影像数据融合、脑网络构建及其分析、脑影像基因关联分析、脑影像校准等方面的工作,并重点介绍在脑疾病早期诊断以及脑解码领域的应用.
关键词 脑科学计划; 脑影像; 脑疾病诊断; 脑解码; 多模态; brain research project; brain image; brain disease diagnose; brain decoding; multi-modality;
Daoqiang ZHANG, Qi ZHU, Xiaoke HAO, et al. Intelligent analysis of brain images. Sci Sin Inform, 2018, 48(5): 589-602, doi: 10.1360/N112017-00278
人工智能优青专刊
基于约束的神经机器翻译
熊德意, 李军辉, 王星, 张飚
中国科学: 信息科学, 2018, 48(5): 574-588
摘要 神经机器翻译是近几年出现并快速发展的一种深度学习驱动的新型机器翻译模式,目前已成为机器翻译学术和工业界广为接受的主流技术.本文总结了我们在神经机器翻译方面的工作,特别是在各种信息和知识约束条件下提出的一系列神经机器翻译模型和方法,具体包括隐变量约束的变分神经机器翻译模型、单词与短语级统计机器翻译译文推荐与约束模型、源端句法结构约束模型.除此之外,本文也对神经机器翻译未来发展进行了初步思考和展望.
关键词 神经机器翻译; 变分神经机器翻译; 神经机器翻译与统计机器翻译融合; 句法约束的神经机器翻译; neural machine translation; variational neural machine translation; fusion of neural and statistical machine translation; neural machine translation with syntactical constraints;
Deyi XIONG, Junhui LI, Xing WANG, et al. Neural machine translation with constraints. Sci Sin Inform, 2018, 48(5): 574-588, doi: 10.1360/N112017-00222
人工智能优青专刊
基于非平行语料的双语词典构建
张檬, 刘洋, 孙茂松
中国科学: 信息科学, 2018, 48(5): 564-573
摘要 在进行跨语言自然语言处理时,缺少双语资源是非常棘手的问题,而这在语言资源匮乏的场景下是非常普遍的.此时,利用好非平行语料中蕴含的翻译知识变得更为重要.由于语料不平行,从中获取翻译知识意味着小数据、无监督学习,因此极具挑战,而取得的结果通常是双语词典的形式.这既是人工智能领域重要的学术问题,也在语言资源匮乏场景有着巨大的应用价值.本文针对前人研究中存在的问题,介绍一系列工作,从各个角度探索如何更好地利用非平行语料构建双语词典.
关键词 双语词典构建; 非平行语料; 双语词向量; 跨语言自然语言处理; 人工智能; bilingual lexicon induction; non-parallel corpora; bilingual word embeddings; cross-lingual natural language processing; artificial intelligence;
Meng ZHANG, Yang LIU, Maosong SUN. Bilingual lexicon induction from non-parallel corpora. Sci Sin Inform, 2018, 48(5): 564-573, doi: 10.1360/N112017-00256
人工智能优青专刊
非对称行人重识别: 跨摄像机持续行人追踪
郑伟诗, 吴岸聪
中国科学: 信息科学, 2018, 48(5): 545-563
摘要 行人重识别是实现跨摄像机场景大范围追踪行人的关键技术,利用该技术可以把行人的碎片化多场景轨迹连接起来.本文首先回顾了行人重识别的发展,列举了目前行人重识别研究的主要难点和挑战.然后进一步介绍了作者所在研究团队针对行人重识别发展的非对称度量学习理论,及基于非对称度量理论和思想所开展的面向开放性行人重识别的非对称行人重识别建模.与现有用于行人重识别的度量学习算法相比,现有算法通常忽略了摄像机特征变化的特性,而非对称度量的优点是可以学习具备建模不同视域特点非一致性能力的特征变换.非对称建模除了应用在一般的行人重识别问题上,还可以应用在跨模态行人重识别、低分辨率行人重识别、基于属性与图像匹配的行人重识别、无监督行人重识别和不完整行人重识别等问题上.最后,本文讨论了行人重识别未来的发展.
关键词 视频监控; 行人重识别; 行人跨视域追踪; 度量学习; 非对称; visual surveillance; person re-identification; cross-view person tracking; distance metric learning; asymmetric modelling;
Weishi ZHENG, Ancong WU. Asymmetric person re-identification: cross-view person tracking in a large camera network. Sci Sin Inform, 2018, 48(5): 545-563, doi: 10.1360/N112018-00017
人工智能优青专刊
基于深度学习的场景文字检测与识别
白翔, 杨明锟, 石葆光, 廖明辉
中国科学: 信息科学, 2018, 48(5): 531-544
摘要 场景文字检测与识别是一种通用文字识别技术,已成为近年来计算机视觉与文档分析领域的热点研究方向.其被广泛应用于地理定位、车牌识别、无人驾驶等领域.相对于传统的文档文字检测和识别,场景文字在字体、尺度、排布、背景等方面变化更加剧烈,深度学习技术也由于卓越的性能成为该领域的主流方法.本文主要回顾了作者基于深度学习在此领域取得的代表性成果,并对此领域未来研究趋势进行了展望.
关键词 深度学习; 场景文字; 文字检测; 文字识别; 计算机视觉; deep learning; scene text; text detection; text recognition; computer vision;
Xiang BAI, Mingkun YANG, Baoguang SHI, et al. Deep learning for scene text detection and recognition. Sci Sin Inform, 2018, 48(5): 531-544, doi: 10.1360/N112018-00003
人工智能优青专刊
标记分布学习与标记增强
耿新, 徐宁
中国科学: 信息科学, 2018, 48(5): 521-530
摘要 本文主要介绍了标记分布学习和标记增强的相关概念及算法.标记分布学习是一种新型机器学习范式,传统的单标记和多标记学习都可以看做是该范式的特例.标记分布学习将不同标记对示例的重要程度用标记分布来显式刻画,已经在多个应用领域中取得很好的效果.然而,现有的多数数据集中却仅具有简单的逻辑标记而非完整的标记分布,因此无法直接应用标记分布学习.为解决这一问题,可以通过挖掘训练集中蕴含的标记重要性信息,恢复出每个示例的标记分布.我们将原始逻辑标记提升为标记分布的过程定义为标记增强.本文给出了标记分布学习和标记增强的形式化定义,介绍了典型标记分布学习和标记增强算法,并对这些算法进行了分析讨论.
关键词 标记分布; 标记分布学习; 标记增强; 多标记学习; 标记多义性; label distribution; label distribution learning; label enhancement; multi-label learning; learning with ambiguity;
Xin GENG, Ning XU. Label distribution learning and label enhancement. Sci Sin Inform, 2018, 48(5): 521-530, doi: 10.1360/N112018-00029
人工智能优青专刊
基于概念器的深度神经网络模型
钱光武, 张蕾, 王炎
中国科学: 信息科学, 2018, 48(5): 511-520
摘要 近年来,深度神经网络,亦被称为深度学习,在机器学习方法主导的各个领域都取得了重大的突破.虽然经过训练的深度神经网络具有卓越的性能,但是整个训练过程却十分耗时,即使借助高性能计算设备,也需要数日甚至数周的训练时间.概念器作为回音状态网络的延续和发展,可以理解为描述神经动态活动模式的过滤器,是一个强大的时序数据处理工具.为了解决上述问题,基于对原始概念器模型的改进,本文在深度神经网络的非迭代方法和迁移学习两个方面分别做了一些工作.具体来说,(1)提出了针对非时序数据的概念器分类器,并在此基础上提出了一种非迭代方法前馈卷积概念器神经网络,通过在MNIST变集数据集上的实验测试了前馈卷积概念器神经网络的分类性能,不仅达到了同类方法的最高水平,而且极大地降低了训练时间;(2)提出了一种基于概念器的快速概念器分类器,在数据集Caltech-101和Caltech-256上,测试了快速概念器分类器结合预训练且不再微调的深度神经网络的表现,不仅在性能上超越了同类方法的最高水平,而且训练时间平均减少到原有的1/60.
关键词 概念器; 图像分类; 深度神经网络; 迁移学习; 非迭代方法; conceptor; image classification; deep neural networks; transfer learning; non-iterative methods;
Guangwu QIAN, Lei ZHANG, Yan WANG. Conceptor-based deep neural networks. Sci Sin Inform, 2018, 48(5): 511-520, doi: 10.1360/N112017-00261
无组织恶意攻击检测问题的研究
庞明, 周志华
中国科学: 信息科学, 2018, 48(2): 177-186
摘要 推荐系统在我们的生活中被广泛应用,对人们的生活起着越来越重要的影响.然而,协同过滤作为一种常见的推荐技术,很容易受到伪造虚假用户评分信息的恶意攻击的影响.为了保证推荐的质量,很多恶意攻击检测的方法被提出用于检测恶意攻击.现有的攻击检测方法大多是针对有组织大规模攻击的检测,即攻击者根据同一种策略,伪造大量的虚假用户评分信息用于提升或贬低一个目标物品.本文研究了一种不同的攻击类型:无组织恶意攻击,即攻击者们在没有组织的情况下,分别伪造少量的虚假用户评分信息来提升或贬低同一个目标物品.无组织恶意攻击出现在很多真实的应用中,对推荐系统的鲁棒性造成严重影响,而针对该攻击类型的研究还很初步.实验结果表明现有攻击检测方法不能够有效地检测无组织恶意攻击.本文分析了现有的多种攻击检测方法无效的原因,进而通过分析无组织恶意攻击的特性,总结出无组织恶意攻击检测的关键.
关键词 攻击检测; 推荐系统; 协同过滤; 无组织恶意攻击; 鲁棒性; attack detection; recommender systems; collaborative filtering; unorganized malicious attacks; robustness;
Ming PANG, Zhi-Hua ZHOU. Unorganized malicious attacks detection. Sci Sin Inform, 2018, 48(2): 177-186, doi: 10.1360/N112017-00112
调查传播算法收敛的一个充分条件
王晓峰, 许道云, 姜久雷, 唐延辉
中国科学: 信息科学, 2017, 47(12): 1646-1661
粒子群优化算法位置更新方程的统一及简化
胡建, 胡旺, 殷锋
中国科学: 信息科学, 2016, 46(11): 1676-1692
一种基于从众和声粒子群算法的并行软硬件划分方法
鄢小虎, 何发智, 陈壹林
中国科学: 信息科学, 2016, 46(9): 1321-1338
基于分解策略的多目标演化子集选择算法
钱超, 周志华
中国科学: 信息科学, 2016, 46(9): 1276-1287
基于多源共享因子的多张量填充
张骁, 胡清华, 廖士中
中国科学: 信息科学, 2016, 46(7): 819-833
基于MAP多子空间增量学习的目标跟踪算法
李康, 何发智, 陈晓
中国科学: 信息科学, 2016, 46(4): 476-495
基于有向混合图的蛋白质新功能预测
傅广垣, 余国先, 王峻, 张自力
中国科学: 信息科学, 2016, 46(4): 461-475
多阶段协同求解卫星舱耦合布局优化问题的双邻域人工蜂群算法
黄振东, 肖人彬
中国科学: 信息科学, 2016, 46(2): 193-211
空间结构化欧拉核及其应用
刘爽, 陈松灿
中国科学: 信息科学, 2016, 46(2): 179-192
基于积分算子空间显式描述的框架核选择方法
刘勇, 廖士中
中国科学: 信息科学, 2016, 46(2): 165-178
工业物联网数据管理中的系统负载均衡最优化问题及其求解
张凌哲, 朱妤晴, 安彦哲, 訾源, 王建民
中国科学: 信息科学, 2024, 54(10): 2343-2367
摘要 工业物联网数据管理与数字中国基础设施建设紧密相关,是支撑提取工业大数据价值的基础.由于工业物联网数据源于设备,工业物联网数据管理系统面临着数据量、数据到达速度、负载多样性等更严峻的大数据挑战.为了应对这些挑战,工业物联网数据管理系统必须进行负载均衡,以充分利用可扩展的计算资源、提升系统性能.现有的负载均衡方法未能充分利用工业物联网数据典型的时序特性,无法应对工业物联网数据管理的上述挑战.本文针对工业物联网数据的时序特性,以读写差异化均衡为约束,建模了负载均衡最优化问题,以匹配工业物联网数据的读写分离特性;提出了负载均衡方案TsLBOpt,集成了简化系统架构的非侵入式负载统计与估算方法,利用分片细分与自适应复制以扩充解空间的整数规划最优化求解方法,以及基于贪心策略最小化数据迁移代价的数据重分布方法.TsLBOpt在清华大学获日内瓦国际发明展金奖的开源时序数据管理系统IginX中进行了实现,并基于多容器构建的集群系统开展了大量实验,结果表明,本文提出的TsLBOpt相比常用的哈希方法、经典的启发式热数据迁移法、前沿工作DynaHash分别可提升系统整体性能至2倍、10倍、4倍以上,且可有效应用于资源异构、组件异构的异构集群系统中.
关键词 工业物联网; 物联网数据管理; 负载均衡; 性能最优化; 时序数据; industrial Internet-of-Things; IoT data management; load balancing; performance optimization; time series data
Lingzhe ZHANG, Yuqing ZHU, Yanzhe AN, et al. The optimization problem of system load balancing and its solution for industrial Internet-of-Things data management. Sci Sin Inform, 2024, 54(10): 2343-2367, doi: 10.1360/SSI-2023-0211
基于上下文增强的多级注意力会话推荐模型
曾碧卿, 池俊龙, 陈嘉涛, 谢梁琦
中国科学: 信息科学, 2024, 54(9): 2116-2135
摘要 会话推荐的目标是仅根据用户在匿名会话中有限的交互行为,来预测用户的下一次点击行为.最近几年,许多基于图神经网络的会话推荐方法取得了可喜的结果.然而,这些方法仍然存在不足之处.一方面,基于图神经网络的方法只考虑物品之间的转换模式,忽略了会话中的序列模式.另一方面,现有的大多数方法都只关注当前会话内部的信息,忽略了来自邻居会话的外部协作信息,即上下文模式.为了解决上述问题,本文提出了一种新颖的基于上下文增强的多级注意力会话推荐模型(CEMA),通过多级注意力机制分别在物品级和会话级这两个粒度上学习物品特征和建模用户偏好,以增强模型的个性化推荐能力. CEMA模型利用多层GraphSAGE来学习物品之间复杂的转换模式,以捕获用户的局部偏好.特别地,在CEMA模型中设计了一种物品级注意力机制,通过门控注意力单元计算会话中不同物品的重要性,以识别用户真正感兴趣的物品,避免噪声物品的干扰.这有助于准确地捕获会话的序列模式,以建模用户的全局偏好.此外,所提出的方法还设计了一种会话级注意力机制,通过简单的软注意力高效地计算不同会话之间的相似度,以聚焦于那些与当前会话最相似的邻居会话,并从中提取上下文模式,以帮助预测用户的下一次点击.本文在3个公开的基准数据集上进行了一系列实验,实验结果表明CEMA的推荐性能超过了现有最好的方法,充分验证了CEMA的有效性和优越性.
关键词 会话推荐; 多级注意力机制; 图神经网络; 序列模式; 上下文模式; session-based recommendation; multi-level attention mechanism; graph neural network; sequential patterns; contextual patterns
Biqing ZENG, Junlong CHI, Jiatao CHEN, et al. Context enhanced multi-level attention model for session-based recommendation. Sci Sin Inform, 2024, 54(9): 2116-2135, doi: 10.1360/SSI-2023-0104
基于时空正则化流的动态链路预测
尹彦婷, 吴雅婧, 杨雪冰, 张文生, 袁晓洁
中国科学: 信息科学, 2024, 54(7): 1692-1708
摘要 动态图作为图的一个重要分支,对节点间关系的动态变化过程具有良好的表达能力.利用动态图对实际关系网络进行建模,并动态预测未来时刻节点间的链路关系成为当前研究热点.然而,由于弱关系现象的存在,加权网络中的动态链路预测面临着重大挑战.针对这一问题,本文提出了一种基于正则化流的方法 DynWFlow (dynamic weight flow).该方法能够从生成角度出发,自适应地评价节点间链路信息的重要性,从而精准地进行链路特征的抽取,有效地解决了动态链路预测问题.特别地,对于弱关系情况,提出利用邻居节点集权重的相似程度来评估不同链接关系的重要程度,实现对节点间隐含关系的进一步捕获.在多个领域大量真实数据的实验结果表明,所提出的基于正则化流的动态链路预测方法 DynWFlow的性能明显优于其他预测算法.
关键词 动态链路预测; 正则化流; 动态图; 时空表示; 图嵌入; dynamic link prediction; normalizing flow; dynamic graphs; spatial-temporal representation; graph embedding
Yanting YIN, Yajing WU, Xuebing YANG, et al. Temporal link prediction on dynamic graphs based on spatial-temporal normalizing flow. Sci Sin Inform, 2024, 54(7): 1692-1708, doi: 10.1360/SSI-2022-0460
基于水平可视图多元联合模体熵的多维EEG情感脑电信号识别
杨小冬, 马志怡, 任彦霖, 陈梅辉, 何爱军, 王俊
中国科学: 信息科学, 2023, 53(12): 2406-2422
摘要 目前,许多基于深度学习和神经网络的算法被应用于脑电(electroencephalogram, EEG)信号情感识别.然而,现有研究大多采用提取单维脑电信号特征的方法.随着多传感技术的更新,更具全面性和系统性的多维信号特征提取需求出现.本文尝试将复杂网络研究应用到多维情感脑电识别中,提出一种基于水平可视图多元联合模体熵的情感识别算法,该方法可以有效避免人工选取特征对实验结果的影响,保持原始序列的非线性动力学特征.首先利用水平可视图算法将多维情感脑电信号分别转换为多路可视图网络,提取模体熵特征识别情感脑电研究中的关键频带和关键通道.在此基础上,将水平可视图网络两两联合,提取多元水平联合模体熵向量,作为输入参数对情感脑电信号进行识别.由于情感脑电序列长度会对识别效果产生影响,我们将脑电信号切割成大小不一的窗口,对比不同窗口大小对分类准确率的影响.实验结果表明,当切割窗口大小为10 s时,多元水平联合模体熵对情感脑电信号的识别效果最佳,对积极脑电/消极脑电、积极脑电/中性脑电、消极脑电/中性脑电的分类准确率分别达到95.07%, 97.73%, 90.26%,优于其他二维连接参数.同时,三分类的准确率为93.67%,本文算法无论在识别复杂度和准确率上,与已有算法相比均有较大提高.
关键词 EEG; 多路水平可视图; 多元联合模体熵; 情感识别; 多维分析; multiplex horizontal visibility graph; multivariate joint motif entropy; emotional recognition; multivariate analysis
Xiaodong YANG, Zhiyi MA, Yanlin REN, et al. Multivariate emotional EEG signal recognition based on multivariate joint motif entropy of a horizontal visibility graph. Sci Sin Inform, 2023, 53(12): 2406-2422, doi: 10.1360/SSI-2022-0454
基于图神经网络的环状RNA生物标志物筛选预测算法
李扬, 胡学钢, 王磊, 李培培, 尤著宏
中国科学: 信息科学, 2023, 53(11): 2214-2229
摘要 越来越多的证据表明,环状RNA (circular RNA, circRNA)在人类复杂疾病发病机制和许多重要生物学过程中发挥不可或缺的作用.确定环状RNA与疾病之间关联对于复杂人类疾病的诊断和治疗具有重要的潜在价值.然而,传统的湿实验方式通常是盲目、低效、耗时且昂贵的,往往还伴随着高的假阳性率.因此,迫切需要有效和可行的计算方法来大规模预测潜在的环状RNA–疾病关联.本文通过结合图神经网络的高阶图卷积网络算法与随机蕨分类器对环状RNA与疾病之间的关联关系进行预测.该方法能够从环状RNA和疾病多种属性信息构建的多源相似性网络中,有效抽取具有高阶混合邻域信息的高级特征,并对其进行准确分类.在5折交叉验证实验中,该方法在CircR2Disease数据集上取得了93.75%的AUC得分.此外,在案例研究中,该模型的预测结果得到了生物湿实验的支持,预测得分前15的环状RNA–疾病关联中的13个在最近发表文献中得以证实.这些优异的结果表明,所提模型是预测环状RNA–疾病关联的有效工具,并且可以为生物湿实验提供理论依据和高可信的环状RNA候选生物标志物.
关键词 环状RNA; 图神经网络; 环状RNA–疾病关联; 高阶图卷积网络; 随机蕨; circRNA; graph neural network; circRNA-disease association; high-order graph convolutional network; random ferns
Yang LI, Xuegang HU, Lei WANG, et al. Prediction algorithm for screening circRNA biomarker based on graph neural network. Sci Sin Inform, 2023, 53(11): 2214-2229, doi: 10.1360/SSI-2023-0070
基于单细胞数据的癌症协同驱动模块识别方法
陈希, 王峻, 余国先, 崔立真, 郭茂祖
中国科学: 信息科学, 2023, 53(2): 250-265
摘要 从大规模生物组学数据中准确识别导致癌症发生的协同驱动模块是生物信息学研究领域重大课题之一.现有研究方法通常只基于批量组学数据进行识别,忽视了细胞水平上的癌症异质性,易受噪声影响.针对上述问题,本文提出了一种基于单细胞数据和先验知识指导的协同驱动模块识别方法CDMFinder.该方法首先利用基因在不同亚型及正常细胞表达数据间存在的特异性共表达信息,融合基因交互网络,优化形成分子功能关联网络,在深入挖掘基因间功能关联的同时有效降低网络复杂度;再基于重叠马尔可夫(Markov)聚类从该网络中挖掘功能簇,并提出基于融合权重和贪心策略的驱动模块识别方法,从功能簇中获得驱动模块集合;最后,融合功能交互网络与突变共现定义模块距离函数,识别获取协同驱动模块. CDMFinder充分融合评估了表达、突变、差异分析等多种因素,展现了优良的识别性能.在乳腺癌和胶质母细胞瘤多组学数据上的实验结果表明,本文方法能够识别出超过对比方法 1.35倍的驱动基因,识别到的协同驱动模块在功能/通路水平富集度上超过现有算法1.5倍.
关键词 单细胞数据; 协同驱动模块; 分子功能关联网络; 马尔可夫聚类; 多组学数据融合; single-cell data; cooperative driver module; molecular functional association network; Markov clustering; multi-omics data fusion;
Xi CHEN, Jun WANG, Guoxian YU, et al. Cooperative driver module identification based on single cell data. Sci Sin Inform, 2023, 53(2): 250-265, doi: 10.1360/SSI-2022-0057
基于自注意力机制生成对抗网络的超分辨率磁共振图像重建
蒋明峰, 支明豪, 李杨, 李铁强, 张鞠成
中国科学: 信息科学, 2021, 51(6): 959-970
摘要 高分辨率的磁共振图像可以提供细粒度的解剖信息,但是获取数据需要较长的扫描时间.本文提出了一种基于自注意力机制生成对抗网络的超分辨率磁共振图像重构方法 (SA-SR-GAN),利用生成对抗网络从低分辨率磁共振图像生成高分辨率磁共振图像,将自注意力机制集成到超分辨率生成对抗网络框架中,用于计算输入特征的权重参数,同时引入了谱归一化处理,使判别器网络训练过程更加稳定.本文使用40组3D磁共振图像(每组图像包含256个切片)训练网络,并用10组图像进行测试.实验结果表明,所提出的超分辨率自注意力生成对抗网络方法生成的超分辨率的磁共振图像的PSNR和SSIM值高于同类比较方法.
关键词 磁共振图像; 超分辨率; 生成对抗网络; 自注意力; 谱归一化
Mingfeng JIANG, Minghao ZHI, Yang LI, et al. Super-resolution reconstruction of MR image with self-attention based generate adversarial network algorithm. Sci Sin Inform, 2021, 51(6): 959-970, doi: 10.1360/SSI-2020-0100
基于互样本熵脑网络的脊髓电刺激下微意识状态患者脑功能评估
梁振虎, 任娜, 王勇, 李佳妮, 白洋, 李小俚, 何江弘
中国科学: 信息科学, 2021, 51(6): 940-958
摘要 脊髓电刺激作为一种有效的意识促醒手段已经在临床上得到了较为广泛的应用,但是其内在机制仍不完全明确.本文将正常人静息态脑电作为对照组,利用样本熵对微意识状态患者的脊髓电刺激前后的脑电信号进行计算,并分析了基于互样本熵构造的脑网络在刺激前后的变化.结果表明,脊髓电刺激提高了微意识状态患者额叶和中央区内的脑电信号复杂度;还提高了患者在额叶内、中央区内以及额叶与其他脑区间的高频段(α~γ, 8~45 Hz)的耦合模式复杂度,表明通道间信息交互作用的显著增强;同时,患者高频段脑网络平均聚类系数增加,平均特征路径长度减少,小世界特性显著提升(在α,β,和γ均为p <0.001).相对于健康对照组,这些指标变化的方向趋向于正常人静息态的脑功能.样本熵和互样本熵在脊髓电刺激后与健康对照组在某些脑区内或脑区间上无显著差异(比如,β和γ频段的样本熵值在额叶和中央区(p> 0.05)),但是高频段的脑网络参数仍有显著差异(比如,高频段小世界网络特征p <0.001).因此,我们认为这些变化是脊髓电刺激对大脑产生了一个"短时程效应".我们推测脊髓电刺激对脑功能的重塑有一定的促进作用.本研究对脊髓电刺激的内在机理提供了新的解释,同时也为微意识状态患者的脑功能评估提供了新的思路.
关键词 微意识状态; 脑电; 脊髓电刺激; 互样本熵; 脑网络
Zhenhu LIANG, Na REN, Yong WANG, et al. Brain function evaluation in the minimally conscious state using cross-sample entropy based on brain network measure under the spinal cord stimulation. Sci Sin Inform, 2021, 51(6): 940-958, doi: 10.1360/SSI-2020-0010
基于多数据融合的circRNA-疾病关联关系预测
雷秀娟, 张文祥, 刘恋
中国科学: 信息科学, 2021, 51(6): 927-939
摘要 环状RNA (circluar RNA, circRNA)在基因表达、剪切和转录的过程中扮演着重要角色.越来越多的证据表明, circRNA与疾病的产生与发展存在着重要的联系.本文提出了一种基于多数据融合的非负矩阵分解算法(EDNMF)预测circRNA–疾病关联关系.该方法首先对circRNA–疾病关联关系进行预处理,解决了circRNA–疾病关联关系过少对算法产生的负面影响的问题.然后, EDNMF算法将circRNA表达谱和癌症相似性数据转化为约束条件,基于预处理后的circRNA–疾病关联关系采用改进的非负矩阵分解算法得到最终的打分值,从而预测circRNA–疾病关联关系.五折和十折交叉验证结果表明, EDNMF算法相比其他算法能更有效地预测circRNA–疾病关联关系.此外,采用EDNMF算法预测新的circRNA–结肠直肠癌关联关系打分排名前10的结果中,大部分结果已经得到了佐证,表明了该算法可以有效地预测未知的circRNA–疾病关联关系.
关键词 circRNA; circRNA 表达谱; circRNA-疾病关联关系; 非负矩阵分解; 疾病相似性
Xiujuan LEI, Wenxiang ZHANG, Lian LIU. Prediction of circRNA-disease associations based on multiple biological data. Sci Sin Inform, 2021, 51(6): 927-939, doi: 10.1360/SSI-2019-0142
基于组织特异性和直接邻居相似度方法预测疾病-药物关系
鱼亮, 赵晋
中国科学: 信息科学, 2019, 49(9): 1175-1185
摘要 复杂疾病的致病机理一直是人类健康领域面临的重大难题之一,通过传统的方法进行新药开发,需要大量的时间与金钱,已经满足不了人们的需求.近几年来寻找已知药物新的治疗效果,即药物重定位,已经成为治疗更多疾病的一个有效途径.目前组织特异性的研究已经取得一些成果,但是传统的药物重定位方法很少考虑疾病的组织特异性.本文提出基于组织特异性和直接邻居相似度方法预测药物的新适应症,同时深入探讨考虑疾病的组织特异性对药物重定位研究的影响.首先研究组织特异性的发展及其特点,并提出基于组织特异性数据,应用直接邻居的相似度进行药物重定位研究.从数据库DrugBank中提取11405条已知药物–靶标关系,并从人类孟德尔遗传数据库中获得5种癌症(乳腺癌、结肠癌、肝癌、肺癌、卵巢癌)及其致病基因数据,利用5种癌症对应的组织特异性相互作用网络作为背景网络,基于直接邻居距离度量方法构建25个组织特异性药物–疾病二部网络,实验结果通过CTD (comparative toxicogenomics database)标准数据库进行验证.结果表明,基于组织特异性和直接邻居相似度度量标准会提高药物重定位研究的准确性,为新药的体内和体外实验提供可靠候选集,这也为药物重定位的研究提供了新的思路.
关键词 药物重定位; 组织特异性; 药物靶标; 致病基因; 直接邻居度量; drug repositioning; tissue specificity; drug targets; disease genes; direct neighborhood measurement;
Liang YU, Jin ZHAO. Prediction of disease—drug relationships based on tissue specificity and direct neighbor similarity. Sci Sin Inform, 2019, 49(9): 1175-1185, doi: 10.1360/N112018-00324
基于0-1矩阵分解的蛋白质功能预测
赵颖闻, 王峻, 郭茂祖, 张自力, 余国先
中国科学: 信息科学, 2019, 49(9): 1159-1174
摘要 准确地标注蛋白质功能是功能基因组学的核心任务之一.蛋白质功能标注信息存在大量缺失且功能标签空间巨大.近期一些标签压缩方法被提出并应用于蛋白质功能预测,但是这些方法获取的压缩标签可解释性差,且面临着多标记学习中的阈值划分难题.为解决这些问题,本文提出一种基于0-1矩阵分解的蛋白质功能预测方法 (zero-one matrix factorization, ZOMF). ZOMF首先将蛋白质–功能标签关联矩阵分解成两个低秩0-1矩阵,挖掘蛋白质和功能标签间的内在关联.其次它利用蛋白质互作网和基因本体结构信息分别针对上述两个低秩矩阵定义了平滑正则项,约束指导低秩矩阵的优化.最后它利用优化获取的低秩矩阵重构关联矩阵,进而实现蛋白质功能预测.通过在酵母菌、拟南芥、老鼠和人类数据集上的实验表明, ZOMF比已有的相关算法能够更准确地预测蛋白质功能,它无需对重构的关联矩阵进行阈值划分,压缩的0-1标签可解释性更直观.
关键词 蛋白质功能预测; 矩阵分解; 蛋白质互作网; 基因本体; 阈值划分; protein function prediction; matrix factorization; protein-protein interaction network; gene ontology; thresholding segmentation;
Yingwen ZHAO, Jun WANG, Maozu GUO, et al. Protein function prediction based on zero-one matrix factorization. Sci Sin Inform, 2019, 49(9): 1159-1174, doi: 10.1360/N112018-00331
基于通用迭代收缩阈值算法的多光谱生物发光断层成像
余景景, 李启越, 贺小伟
中国科学: 信息科学, 2019, 49(6): 726-738
摘要 生物发光断层成像(bioluminescence tomography, BLT)是一种高灵敏非侵入式光学分子成像模态,但近红外光在生物组织中传输的复杂性及表面测量信息的有限性,对BLT光源重建算法提出了较高要求.本文提出了一种基于通用迭代收缩阈值(general iterative shrinkage and threshold,GIST)的BLT重建算法,采用非凸平滑剪切绝对偏差(smoothly clipped absolute deviation, SCAD)惩罚项,并通过迭代求解对非凸惩罚项有解析解的邻近算子问题来获得优化结果.此外,重建中也结合了多光谱测量和收缩可行域策略以降低逆问题的不适定性.为评估该算法的光源定位及多光源辨识能力,本文设计了多组仿真和物理仿体实验,并将GIST与几个典型稀疏重建算法进行了对比.实验结果表明GIST算法在不同光源深度和间隔距离的实验中在中心定位误差方面有较大优势.
关键词 多光谱生物发光断层成像; 通用迭代收缩阈值算法; 稀疏重建; 逆问题; 平滑剪切绝对偏差; multispectral bioluminescence tomography; general iterative shrinkage and threshold algorithm; sparse reconstruction; inverse problem; smoothly clipped absolute deviation;
Jingjing YU, Qiyue LI, Xiaowei HE. Multispectral bioluminescence tomography-based general iterative shrinkage and threshold algorithm. Sci Sin Inform, 2019, 49(6): 726-738, doi: 10.1360/N112017-00195
基于降维的蛋白质不相关功能预测
余国先, 傅广垣, 王峻, 郭茂祖
中国科学: 信息科学, 2017, 47(10): 1349-1368
磷酸化基序精确置换检验p-value的计算方法
吴军, 段琼, 张琳, 何增有
中国科学: 信息科学, 2017, 47(10): 1334-1348
基于稀疏特征竞争和形状相似性的超声图像序列分割方法
倪波, 蔡贤涛, 邓丹君, 袁涌
中国科学: 信息科学, 2017, 47(6): 752-770
基于视频流谱特征空间的深度伪造检测
肖景博, 殷琪林, 卢伟, 罗向阳, 郭世泽
中国科学: 信息科学, 2024, 54(11): 2572-2588
摘要 随着深度伪造技术的快速发展,深度伪造视频在每一帧上表现得极为真实,现有检测方法难以有效识别出深度伪造视频.针对这一问题,本文首次提出了一种基于视频流谱特征空间的深度伪造检测方法.该方法基于流谱理论构建了一个视频流谱特征空间,通过视频流谱基底模型将视频流从视频特征隐空间映射到视频流谱特征空间,精准刻画视频流中不一致性信息,获取可分离度更高的视频流谱不一致性特征,从而实现深度伪造视频的检测.具体而言,首先提出了一种视频流谱特征空间的构建方法,通过对视频特征隐空间进行基底映射,得到一个近似同构的视频流谱特征描述空间,在视频流谱特征空间中融合视频流不同视角的高维表征,实现对视频流的精准刻画与分析;然后设计了一个视频不一致性流谱映射模型,通过视频流谱变换算子,从时序角度将视频流的空域信息聚合映射到视频流谱特征空间,建模深度伪造视频的不一致性信息,构建数据可分离度更高的视频表征.实验结果表明,所提方法在Celeb-DF数据集上达到99.23%的准确率,在DFDC数据集上达到95.24%的准确率.
关键词 深度伪造检测; 流谱理论; 视频流谱特征空间; 视频流谱基底模型; 时序不一致性; deepfake detection; flow spectrum theory; video flow spectrum feature space; video flow spectrum basis model; temporal inconsistency
Jingbo XIAO, Qilin YIN, Wei LU, et al. Deepfake detection based on video flow spectrum feature space. Sci Sin Inform, 2024, 54(11): 2572-2588, doi: 10.1360/SSI-2024-0114
一种结构范数正则化的可微神经结构搜索算法
曾宪华, 吴杰, 夏耀光, 向一心
中国科学: 信息科学, 2024, 54(9): 2181-2199
摘要 可微神经结构搜索(differentiable neural architecture search, DNAS)作为近年来神经结构搜索的主流方法之一,通过结合基于梯度优化的搜索策略能够有效地搜索网络结构.然而,存在结构搜索稳定性差和模型复杂度高的问题.为了解决这两个问题,本文提出了一种结构范数正则化的可微神经结构搜索算法,提高了结构搜索的稳定性;设计了一种冗余边剪枝算法修剪网络结构中的冗余边,降低了最终模型的复杂度.本文在CIFAR10, CIFAR100, miniImageNet和胎儿心脏标准平面分类(fetal heart standard plane, FHSP)等4个数据集上进行了算法性能对比实验,与一系列当前最新的可微神经结构搜索算法相比,取得了最优的综合性能.
关键词 深度学习; 可微神经结构搜索; 剪枝; 正则化; 高效搜索网络结构; deep learning; differentiable neural architecture search; pruning; regularization; efficiently search network structures
Xianhua ZENG, Jie WU, Yaoguang XIA, et al. A differentiable neural architecture search algorithm with architecture norm regularization. Sci Sin Inform, 2024, 54(9): 2181-2199, doi: 10.1360/SSI-2023-0372
属性知识自反绎下的半监督表示学习
沈阳, 孙旭豪, 徐赫洋, 魏秀参
中国科学: 信息科学, 2024, 54(6): 1386-1399
摘要 机器学习结合逻辑推理的方法可以大幅提升模型的鲁棒性与可解释性.近年来,已有工作从给定的具体知识库出发,通过反绎学习的范式或是其衍生范式来促进机器学习中模型的更新过程.然而,在表示学习任务中,即便存在这样的知识库,其往往也是不完备或含有噪声的.且在真实环境下,即便领域专家也无法精准定量地描述不同对象的属性表示信息.因此,本文针对半监督表示学习任务,提出了一种可根据少量有标记样本构建弱领域属性知识库并结合无标记数据与基于启发式规则扩张领域知识库推理的反绎学习方法.该方法可有效解决表示学习任务下缺少强领域知识与真实环境下高质量标注数据较少这两个问题.在人工合成的数据集与真实环境下的数据集中的实验对比结果均验证了我们提出的方法的有效性.
关键词 人工智能; 机器学习; 反绎学习; 半监督学习; 特征表示; 细粒度属性; artificial intelligence; machine learning; abductive learning; semi-supervised learning; feature representation; fine-grained attributes
Yang SHEN, Xuhao SUN, Heyang XU, et al. Attribute-aware knowledge based self-abductive for semi-supervised representation learning. Sci Sin Inform, 2024, 54(6): 1386-1399, doi: 10.1360/SSI-2023-0252
面向连续手语识别的自适应关键帧选择
闵越聪, 陈熙霖
中国科学: 信息科学, 2024, 54(4): 893-910
摘要 基于视觉的连续手语识别旨在从图像序列中识别出对应的手语词序列,可以为手语使用者提供一种便利的辅助工具.现有的连续手语识别方法大多需要从图像序列中,逐帧提取视觉和时序特征,而相邻帧中存在的相似视觉信息带来了大量的冗余计算.本文通过分析帧率对连续手语识别算法的影响,发现降低帧率可以显著地提升计算效率,但也会带来一定的性能损失.为了在降低帧率的同时保留更多手语关键信息,本文提出了自适应动态池化层(adaptive dynamic temporal pooling, ADTP),ADTP基于序列特征的自相似性对序列进行动态下采样.在此基础上,本文进一步提出了一种两阶段的训练方式,以更充分地利用原始帧率中的时空信息.具体而言,该训练方式在第一阶段只训练基于原始帧率的手语识别模型,并以此模型为教师网络,通过知识蒸馏的方式引导第二阶段含ADTP模块的模型训练.实验结果表明,本文所提的方法在损失少量性能的情况下,可以大幅度减少识别所需的计算量.此外,本文所提出的ADTP也可用于手语视频结构分析,生成简略直观的手语视频摘要.
关键词 连续手语识别; 时间序列分析; 视觉语言; 知识蒸馏; 计算效率; continuous sign language recognition; time series analysis; visual languages; knowledge distillation; computational efficiency
Yuecong MIN, Xilin CHEN. Adaptive keyframe selection for continuous sign language recognition. Sci Sin Inform, 2024, 54(4): 893-910, doi: 10.1360/SSI-2022-0467
多模可信交互:从多模态信息融合到人-机器人-数字人三位一体式交互模型
王国庆, 裴云强, 杨阳, 徐行, 汪政, 申恒涛
中国科学: 信息科学, 2024, 54(4): 872-892
摘要 信任在人–机器人–数字人协作中扮演着关键角色,因为它不仅影响了人–机器人–数字人的效率,同时也存在风险和益处.然而,当前的人–机器人–数字人信任研究存在“失衡”现象,即大部分研究集中于“以人为中心”的信任关系而忽略了智能体(机器人和数字人)对人的信任.为了填补人–机器人–数字人信任研究领域的这一空白,在使用多模态信号来建立人–机器人–数字人交互中的适度单向信任基础上,构建跨虚实世界的“三位一体”经历交融共享生态.本文旨在探讨多模态线索和增强现实在建立人–机器人–数字人之间可信关系方面的现有研究、可行性和未来发展方向.最后,本文展望了该模式在社会组织形态及社会事件态势感知和管控中的应用前景,并指出了未来需要解决的问题.本文的研究有助于理解多模态线索和增强现实在人–机器人–数字人交互中的作用,并为“三位一体”趋势的实现提供思路和解决方案.
关键词 增强现实; 多模态交互; 人-机器人-数字人交互; 信任; augmented reality; multimodal interaction; human-robot-digital human interaction; trust
Guoqing WANG, Yunqiang PEI, Yang YANG, et al. Multimodal trustworthy interaction: from multimodal information fusion to a trinitarian human-robot-digital human interaction model. Sci Sin Inform, 2024, 54(4): 872-892, doi: 10.1360/SSI-2023-0133
基于时空层级查询的指代视频目标分割
兰猛, 张乐飞, 杜博, 张良培
中国科学: 信息科学, 2024, 54(3): 674-691
摘要 本文针对当前指代视频目标分割方法缺乏目标时空一致性建模和目标时空表征学习不足等问题,进行了深入的研究,提出了基于时空层级查询的指代视频目标分割方法 (STHQ).本文将指代视频目标分割看作基于查询的序列预测问题,并提出两级查询机制进行目标的时空一致性建模和时空特征学习.在第1阶段,本文提出了帧级空间信息提取模块,该模块使用语言特征作为查询独立地和视频序列中的每一帧在空间维度进行信息交互,生成包含目标空间信息的实例嵌入;在第2阶段,本文提出时空信息聚合模块,该模块使用视频级的可学习查询嵌入和第1阶段生成的实例嵌入在时空维度进行信息交互,生成具有时空表征信息的视频级实例嵌入;最后,视频级实例嵌入线性变换为条件卷积参数,并和视频序列中的每一帧进行卷积操作,生成目标的掩码预测序列.在该领域的3个基准数据集上的实验结果表明,本文提出的STHQ方法超越了现有的方法,实现了最佳的性能.
关键词 指代视频目标分割; 时空一致性建模; 时空特征学习; 跨模态特征交互; Transformer; referring video object segmentation; spatio-temporal consistency modeling; spatio-temporal feature learning; cross-modal feature interaction
Meng LAN, Lefei ZHANG, Bo DU, et al. Spatio-temporal hierarchical query for referring video object segmentation. Sci Sin Inform, 2024, 54(3): 674-691, doi: 10.1360/SSI-2023-0030
分心感知的伪装物体分割
梅海洋, 杨鑫, 周运铎, 季葛鹏, 魏小鹏, 范登平
中国科学: 信息科学, 2024, 54(3): 653-673
摘要 本文致力于设计一个有效且高效的伪装物体分割(camouflaged object segmentation, COS)模型.为此,本文开发了一个生物启发的框架,称为金字塔定位和聚焦网络(pyramid positioning and focus network, PFNet+),其模仿了自然界中的捕食过程.具体地,本文的PFNet+包含3个关键模块,即上下文增强模块(context enrichment, CEn)、金字塔定位模块(pyramid positioning module, PPM)和聚焦模块(focus module, FM). CEn通过整合上下文信息来增强骨干特征的表征能力,从而提供更有辨别性的骨干特征. PPM模仿捕食中的检测过程,以金字塔的方式从全局的角度定位潜在的目标物体.然后FM执行捕食中的识别过程,通过在歧义区域的聚焦逐步细化初始的预测结果.值得注意的是,在FM中,本文开发了一个新颖的分心挖掘策略,用于分心区域的发现和去除,以提高预测的性能.大量的实验证明本文的PFNet+能够实时运行(56 fps),在4个标准度量指标下, PFNet+在3个具有挑战性的数据集上都显著优于现有的20个最新模型,在其他视觉任务(如息肉分割)上的实验进一步证明了PFNet+的泛化能力.
关键词 伪装物体; 分心; 上下文增强; 上下文探索; 金字塔; 分割; camouflaged object; distraction; context enrichment; context exploration; pyramid; segmentation
Haiyang MEI, Xin YANG, Yunduo ZHOU, et al. Distraction-aware camouflaged object segmentation. Sci Sin Inform, 2024, 54(3): 653-673, doi: 10.1360/SSI-2022-0138
基于薄板样条插值的弯曲笔触神经绘画与风格化方法
唐波昊, 胡腾, 杜瑜桢, 易冉, 马利庄
中国科学: 信息科学, 2024, 54(2): 301-315
摘要 近年来,图像生成技术取得了令人瞩目的发展,目前的图像生成方法大多以像素填充的方式生成图像,缺乏艺术家逐笔绘制的过程,使其在局部笔触细节与纹理上与真实艺术作品有所不同.神经绘画致力于模仿人类艺术家以画笔为单位,逐笔绘制的作画过程.现有的神经绘画方法大多使用贝塞尔曲线或者笔触模板进行仿射变换来模拟真实笔触.然而,贝塞尔曲线纹理的缺乏以及仿射变换的线性性质,导致生成的笔触在纹理或者形状上存在较大的限制.为了更好地模拟真实笔触的纹理与形状,本文提出了新的基于薄板样条插值的弯曲笔触参数模型,通过对真实笔触模板先后进行弯曲与仿射变换,可以生成更加真实、多样的笔触图像.此外,本文提出了层次化的笔触优化方法,将整幅图像分解为由大到小的多个笔触,能够有效提升模型对图像整体架构与局部细节的绘画能力.最后,本文将提出的方法拓展至风格迁移中,实现了较好的风格迁移效果.定性与定量的实验表明,本文所提出的新的笔触模型与优化方法在神经绘画及风格化任务中都超越了已有的最佳模型.
关键词 神经绘画; 薄板样条插值; 弯曲笔触; 层次优化; 风格迁移; neural painting; thin plate spline; curved stroke; layer optimization; style transfer
Bohao TANG, Teng HU, Yuzhen DU, et al. Curved-stroke-based neural painting and stylization through thin plate spline interpolation. Sci Sin Inform, 2024, 54(2): 301-315, doi: 10.1360/SSI-2023-0194
城区场景建筑物单体分割与结构重建耦合研究
董梦成, 谢科, 黄惠
中国科学: 信息科学, 2024, 54(2): 281-300
摘要 随着无人机以及激光雷达在测绘领域的大规模应用,大量的城市场景稠密三维网格模型被生产出来,对其进行建筑物单体分割与结构化重建是计算机图形学领域极具挑战性的研究问题.本文对此提出了一种城区场景建筑物单体分割与结构化重建耦合处理的方法.首先,本文基于马尔可夫(Markov)随机场从场景中提取建筑物轮廓;然后,基于提取出的建筑物轮廓以及人造建筑竖直方向的规则性,引入了一种新的建筑物结构化模型——多层轮廓模型;最后,设计了一个自顶向下的城区场景建筑物单体分割与结构化重建耦合处理的并行系统,该系统能够高效地处理大规模城区场景.实验结果表明,本文方法生成的结构化模型最高实现了厘米级的精度.
关键词 建筑物单体分割; 结构重建; 耦合处理; 城市场景理解; 马尔可夫随机场; building instance segmentation; structural reconstruction; coupled processing; urban scene understanding; Markov random field
Mengcheng DONG, Ke XIE, Hui HUANG. Coupled study on instance segmentation and structural reconstruction of buildings in 3D urban scenes. Sci Sin Inform, 2024, 54(2): 281-300, doi: 10.1360/SSI-2023-0221
学习成对样本运动显著性的细粒度人体骨架动作识别
李红艳, 涂志刚, 谢伟, 张嘉旭
中国科学: 信息科学, 2023, 53(12): 2440-2457
摘要 基于骨架数据的细粒度人体动作识别是一项重要的研究课题,但未被充分解决.由于骨架数据缺乏视觉表观信息,相似类别的人体动作很难被现有的深度网络模型识别.在这项工作中,我们提出了一个新型的运动显著性探测器(motion salience prober, MSP),并引入了配对学习(motion salience prober-incorporated pairwise-learning, MSP-PL)框架,以实现细粒度的骨架动作识别.我们的MSP-PL框架在构造成对的相似骨架运动样本基础上(查询样本与探测样本),利用运动显著性学习机制,促进编码器学习精细化的运动特征.其核心模块MSP可以在我们设计的探测样本和损失函数的帮助下,增强查询样本的显著性运动特征,并消除冗余的噪声.本文设计了3种探测样本构造策略来生成查询–探测样本对,辅助模型识别查询样本的动作,并测试了它们对模型性能的影响.在NTU-RGB+D120数据集与Kinetics-Skeleton数据集上的大量实验表明,我们的MSP-PL框架是通用的,大多数骨架特征编码器可以无缝嵌入其中,并显著提高其准确性. 5个主流的编码器对精细化动作的平均分类准确率提高了2.4%以上.此外,我们的MSP-PL框架在与最新的编码器相结合时,在骨架动作识别方面达到了最先进的性能.
关键词 骨架动作识别; 细粒度动作识别; 视觉注意力; 运动显著性学习; 对比学习; skeleton action recognition; ne-grained action recognition; visual attention; motion salience learning; contrastive learning
Hongyan LI, Zhigang TU, Wei XIE, et al. Fine-grained skeleton action recognition with pairwise motion salience learning. Sci Sin Inform, 2023, 53(12): 2440-2457, doi: 10.1360/SSI-2023-0047
基于纹理与几何解耦的说话人视频连续情感编辑模型
吕天, 温玉辉, 孙志尧, 刘永进
中国科学: 信息科学, 2023, 53(12): 2423-2439
摘要 说话人视频的情感编辑是计算机视觉和图形学当前研究热点之一,其目的是将一段中性情感的人物说话视频转为带有目标情感的说话视频.已有的方法难以同时兼顾高清晰度情感编辑、人脸三维属性的保持以及模型对不同目标人物的适用性.为同时满足上述要求,本文提出基于Basel人脸模型(Basel face model, BFM)条件的几何编辑网络作为几何情感编辑模块,保证了几何编辑在不同目标人物场景下的通用性;提出了基于人物分类器的纹理情感编辑模块,使得精细纹理的编辑可以迁移到多人任务之中,突破了以往情感编辑模型仅适用特定目标人物或适用多人模型生成质量不高的局限性.本文提出的模型可以实现连续控制情感编辑强度的效果.实验结果表明,本文提出的通用情感编辑模型在多人任务上的清晰度、人物保真度、情感编辑质量等各项指标均优于已有可适用于多人情感编辑的方法,并且在训练集中未出现的目标人物上也能实现自然的情感编辑,甚至在未见的人脸位姿的说话视频中也能获得合理的结果.
关键词 情感编辑; 三维重建; 深度学习; 计算机视觉; 神经网络; emotional editing; 3D reconstruction; deep learning; computer vision; neural network
Tian LV, Yu-Hui WEN, Zhiyao SUN, et al. A continuous emotional editing model for talking head videos based on decoupling texture and geometry. Sci Sin Inform, 2023, 53(12): 2423-2439, doi: 10.1360/SSI-2022-0444
基于特征对齐和高斯表征的视觉有向目标检测
杨学, 严骏驰
中国科学: 信息科学, 2023, 53(11): 2250-2265
摘要 有向目标检测是计算机视觉中的一个研究热点,在遥感、场景文字等领域具有广泛应用.大长宽比、密集排列以及任意方向等问题是该领域目标检测面临的主要挑战.本文提出了一种基于单阶段检测方法的级联有向检测器R~3DetGauss,采用一种从粗到细的渐进式回归方法快速准确地定位目标.考虑到级联检测器中存在的特征不对齐的问题,本文设计了一个特征精修模块(feature refinement module, FRM),能够获得更准确的特征,从而提高检测性能. FRM通过逐像素特征插值将当前精修后的边界框的位置信息重新编码到对应的特征点,进而实现特征的重构和对齐.本文还采用了具有尺度不变性的归一化高斯Wasserstein距离作为回归损失来进一步提高估计边界框的质量.此外,本文基于该距离提出了长宽比感知的自适应样本采样策略,提高了样本分配的质量.在多个公开的图像数据集上的大量实验结果表明,所提出的R~3DetGauss检测器在多种数据集上均能够进一步提升精度,并最终达到当前先进检测水平.相关代码在国产深度学习Jittor框架、PyTorch和TensorFlow中均进行了开源发布.
关键词 有向目标检测; 计算机视觉; 特征精修模块; 分布距离; 标签分配; 回归损失; oriented object detection; computer vision; feature refinement module; distribution distance; label assignment; regression loss
Xue YANG, Junchi YAN. Visual oriented object detection via feature alignment and Gaussian parameterization. Sci Sin Inform, 2023, 53(11): 2250-2265, doi: 10.1360/SSI-2022-0410
非约束环境下的轻量级实时多人三维动作捕捉
杨文武, 李跃, 邢帅, 蔡佳航, 王勋
中国科学: 信息科学, 2023, 53(11): 2230-2249
摘要 非接触式的多人三维动作捕捉技术在影视动画、游戏、虚实互动、体育运动和生物医学分析等领域有着广泛的应用.现有的国内外相关论文多数聚焦在算法创新,而缺少整体视角下的系统分析与构建.为此,本文提出了一种非约束环境下的轻量级多人三维动作捕捉系统,该系统便于组装,仅需少量的(4~6个)普通相机或摄像头,并且适用于一般的室内外环境,对场景中的背景和人物对象的着装没有特殊要求.首先,为了提升三维人体动作捕捉的精度,设计并实现了一个鲁棒的基于多视图的多人三维姿态估计算法,它充分利用了多视角的信息互补,并引入了一个跨帧连贯性约束来过滤异常的二维人体关节点检测结果以抑制其对三维人体姿态估计的影响.其次,围绕多视图数据的实时采集与传输及其有效处理,构建了一套轻量级的硬件系统,同时提出了一种数据流向可控的模块化并行处理机制,最终实现了一个灵活、易维护扩充且高效的软硬件系统框架.最后,基于多个公开数据集与自采数据集,通过大量实验,充分验证了本文所提出算法与系统的准确性、高效性和鲁棒性.
关键词 动作捕捉; 非接触式动捕; 实时动捕; 多人三维姿态估计; 跨视角姿态关联; motion capture; markerless motion capture; realtime motion capture; multi-person 3D pose estimation; cross-view pose association
Wenwu YANG, Yue LI, Shuai XING, et al. Lightweight multi-person motion capture system in the wild. Sci Sin Inform, 2023, 53(11): 2230-2249, doi: 10.1360/SSI-2022-0397
基于局部-全局建模与视觉相似引导的光流估计方法
舒铭奕, 张聪炫, 陈震, 葛利跃, 胡卫明, 王子旭
中国科学: 信息科学, 2023, 53(10): 1945-1964
摘要 光流估计是计算机视觉的核心任务.近年来,基于卷积神经网络的光流估计方法已取得很大成功,然而由于现有模型的卷积感受野有限,难以建模远距离的依赖关系,导致在大位移和局部歧义性区域的光流估计效果较差.此外,现有方法在光流上采样过程采用的插值操作会导致误差的传播放大,进而引起光流估计的运动边缘模糊等问题.针对以上问题,本文提出了一种基于局部–全局建模与视觉相似引导上采样的光流估计方法.首先,引入一个高效且简单的自注意力机制加强光流计算网络的局部和全局建模能力.通过提取更具有表达力的图像特征,降低因大位移和局部歧义性导致的光流估计误差问题.其次,基于物体视觉特征越相似,运动也越相似的假设,构建视觉相似引导的光流上采样网络模型.将特征的视觉相似性转化为运动的相似性进而指导光流上采样过程,提高了运动边界区域光流估计的精度.最后,分别采用MPI-Sintel和KITTI数据库测试图像集对本文方法和最先进的深度学习光流计算方法进行综合对比分析.实验结果表明,本文方法在所有对比方法中取得了最优的光流计算结果,尤其在大位移和运动边界区域显著提升了光流计算的精度.
关键词 光流估计; 卷积神经网络; 自注意力; 上采样; 视觉相似引导; optical flow estimation; convolutional neural networks; self-attention; upsampling; visual similarity guidance
Mingyi SHU, Congxuan ZHANG, Zhen CHEN, et al. Optical flow estimation based on local-global modeling and visual similarity guidance. Sci Sin Inform, 2023, 53(10): 1945-1964, doi: 10.1360/SSI-2022-0340
基于对齐遗忘机制的信息不平衡图像翻译
舒叶芷, 夏萌霏, 李强, 张国鑫, 万鹏飞, 郑文, 刘永进
中国科学: 信息科学, 2023, 53(8): 1593-1607
摘要 作为图像处理领域的热点技术,图像翻译可将图像由源域迁移至目标域,实现图像风格的转换.然而,在诸如真实人脸与卡通人脸、街道实景与街景分割图等图像翻译应用中,源域与目标域间往往存在巨大差距,域间的冗余信息和不一致特征会增加转换的难度,降低转换质量.本文提出对齐遗忘机制并设计多个损失函数,通过构建简易高效的信息不平衡图像翻译算法框架,实现了域编码与域解码.具体地,在将源域和目标域信息对齐映射至共享语义空间后,本文在对齐遗忘机制中使用互信息(mutual information)删除域间不一致特征,同时保留相同特征.实验结果表明,本文方法可有效剔除冗余信息,提高域间信息一致性.此外,本文在多个代表性信息不平衡图像数据集上验证了新算法较已有算法的优越性.
关键词 图像处理; 图像翻译; 生成对抗网络; 不平衡信息; 注意力机制; image processing; image-to-image translation; generative adversarial networks; imbalanced information; attention mechanism;
Yezhi SHU, Mengfei XIA, Qiang LI, et al. Aligned forgetting mechanism for imbalanced image-to-image translation. Sci Sin Inform, 2023, 53(8): 1593-1607, doi: 10.1360/SSI-2022-0092
面向事件相机的轻量化脉冲识别网络
刘昭辛, 吴金建, 石光明, 赵庆行
中国科学: 信息科学, 2023, 53(7): 1333-1347
摘要 事件相机是一种用脉冲表达信息的仿生成像传感器,具有高时域分辨率、高动态范围、低功耗和高速率等优势.由于事件驱动特性,传统人工神经网络(artificial neural networks, ANN)无法直接处理事件相机输出的脉冲信号.而脉冲神经网络(spiking neural network, SNN)作为一种神经形态计算方法,具有高时域分辨率及事件驱动的特性,这与事件相机高度契合.但是,深层脉冲神经网络需要消耗大量存储空间以及神经元计算资源,严重限制了其在边缘计算场景的部署.本文基于特征维度映射原理,提出面向嵌入式系统的轻量化脉冲神经网络,降低存储需求、提高运行效率并提高网络性能.首先,通过分析网络参数量与网络拟合功能间的关系,明确了约束脉冲神经网络能力的参数瓶颈问题.随后,基于低维特征提取–融合策略提出一种通用轻量化特征提取结构SpikeFire,该模块在保证感受野和特征维度等基本性质不变的前提下大幅减少了网络参数.此外,模拟脑神经元复杂连接特性,模块中采用跳层连接,这既增加多尺度信息提取又有助于深层次网络的优化.最后,将本文所提轻量化网络部署在嵌入式硬件中,开发出了事件驱动的成像识别一体化系统.实验表明,无论是在公开数据集还是自建真实场景和极端成像场景中,所提方法在保证识别性能的前提下大幅减少了参数量并提高运行速度.
关键词 脉冲神经网络; 事件相机; 轻量化网络; 特征融合; 嵌入式硬件; spiking neural network; event camera; lightweight network; feature fusion; embedded hardware;
Zhaoxin LIU, Jinjian WU, Guangming SHI, et al. Towards event camera signal recognition using a lightweight spiking neural network. Sci Sin Inform, 2023, 53(7): 1333-1347, doi: 10.1360/SSI-2022-0063
基于经验增强的自主场景探索
夏熙, 吴关, 刘利刚
中国科学: 信息科学, 2023, 53(7): 1314-1332
摘要 自主地探索未知室内场景并同时构建地图,是机器人完成许多应用任务的必备前提.基于深度强化学习的方法通过与环境交互的方式,让机器人学会利用室内场景的结构规律,因而有希望获得更加高效和鲁棒的探索策略.现有的方法通常直接控制机器人的运动,导致较长的决策序列,并需要大量的训练样本;或者间接指定长期目标点,却难以保证其可以到达,因而也阻碍了训练的进行.针对这些问题,提出了一种基于经验增强的自主场景探索方法以加速策略的训练并生成更加高效的探索目标.首先引入off-policy的强化学习算法和经验回放缓存机制;然后利用全局探索策略指定长期目标点;接着利用增量启发式寻路算法生成前往目标点的无碰撞路径;在此基础上对每一条探索路径分段并评估子路径的奖励,从而改进已有经验;最后利用时序差分误差对经验进行过滤,并加入经验回放缓存中.该方法能从原本失败的经验中推导出正确的行为,并生成易于到达的长期目标点.实验结果表明,本文方法不仅能明显加速全局探索策略的训练,还能提升训练后系统的整体性能.
关键词 自主场景探索; 深度强化学习; 经验增强; 路径规划; autonomous scene exploration; deep reinforcement learning; experience enhancement; path planning;
Xi XIA, Guan WU, Ligang LIU. Autonomous scene exploration using experience enhancement. Sci Sin Inform, 2023, 53(7): 1314-1332, doi: 10.1360/SSI-2022-0318
局部关系泛化表征的小样本增量学习
赵一凡, 李甲, 田永鸿
中国科学: 信息科学, 2023, 53(6): 1132-1146
摘要 小样本学习作为计算机视觉的新兴研究热点,旨在通过少量的已知样本实现对全新概念的快速识别和理解.现有的小样本学习技术只针对给定的新类别物体进行分类和识别,忽略了旧有基础类别的表示和区分.针对小样本增量学习问题中的类间可区分性差、增量类别难泛化两大研究难点,本文引入局部关系学习的思想,提出局部关系泛化表征的模型学习方法.为确保增量过程中的类别可区分性,本文首先使用局部空间关联约束增量表征能力,在此基础上,使用特征重映射方法将查询向量与支撑集映射在同一度量空间,有效确保了微小差异的可区分性.同时,为缓解增量过程中样本不足导致的归纳偏置问题,本文提出空间泛化式原型生成算法,利用分布特性快速生成虚拟原型,促进样本的有效表征.在此基础上,本文利用元学习训练方法,提出了局部泛化联合的增量学习框架,通过联合基础类别的局部表征和增量类别的快速泛化约束,有效缓解了灾难性遗忘和表征不足的困难,实验证明本方法在经典小样本增量任务中取得了当前最好的性能表现.
关键词 小样本学习; 增量学习; 局部关系; 泛化表征; 元学习; few-shot learning; incremental learning; local relationship; generalized representation; meta learning;
Yifan ZHAO, Jia LI, Yonghong TIAN. Generalized representation of local relationships for few-shot incremental learning. Sci Sin Inform, 2023, 53(6): 1132-1146, doi: 10.1360/SSI-2022-0231
基于采样和加权损失函数的模型窃取攻击方法
王熠旭, 李杰, 刘弘, 王言, 徐明亮, 吴永坚, 纪荣嵘
中国科学: 信息科学, 2023, 53(5): 931-945
摘要 模型窃取攻击旨在获得一个和目标受害模型功能相似的替代模型.现有的方法主要采用数据生成或数据选择方法和交叉熵损失函数去获得一个较好的攻击效果.据此,本文着重研究了攻击过程中这两个极为重要的模块:数据采样和损失函数.同时,本文提出了一个新颖的模型窃取攻击方法S&W,其包含了一种新的采样策略和一个精心设计的加权损失函数.首先,新的采样策略更加关注于从受害者模型中获得更多信息的重要样本.与此同时,本文通过引入k-Center算法达到选择样本的多样性的目的.其次,受到经典Focal损失函数的启发,本文设计了一种新的加权损失函数.该损失函数主要关注于受害者模型和替代模型对于相同输入所给出的输出之间的差异,从而促使替代模型模拟受害者模型.在4个常用的数据集上,我们通过实验证明了本文提出的方法的有效性.相比于之前最好的方法,本文方法最高有5.03%的性能提升.
关键词 计算机视觉; 模型窃取攻击; 对抗攻击; 主动学习; 知识蒸馏; computer vision; model stealing attack; adversarial attack; active learning; knowledge distillation;
Yixu WANG, Jie LI, Hong LIU, et al. Model stealing attack based on sampling and weighting. Sci Sin Inform, 2023, 53(5): 931-945, doi: 10.1360/SSI-2022-0029
多尺度稳定场GAN的图像修复模型
叶学义, 曾懋胜, 孙伟杰, 王凌宇, 赵知劲
中国科学: 信息科学, 2023, 53(4): 682-698
摘要 近年来生成对抗网络(generative adversarial network, GAN)已经展示了它在图像修复任务中修复大面积缺失区域并生成合理语义结果的潜力,但现有方法经常忽略缺失区域的语义一致性和特征连续性,并对不同尺度特征的感知能力不足,因此提出一种基于多尺度稳定场GAN的图像修复模型.该模型的生成单元汲取了U-Net的特点,将稳定场算子嵌入到跳跃连接中以填充编码器特征图中的缺失区域,保持了缺失区域的语义一致性和特征连续性;然后通过多尺度融合计算逐步加强经稳定场算子填充缺失区域的特征图的传递,使得跳跃连接传递的信息不再来自单一的特征图,让模型能够感知高层特征的语义信息.在人脸和自然场景等数据集上的实验结果表明,该模型优于其他的经典图像修复方法.
关键词 图像修复; 生成对抗网络; GAN; 稳定场; 多尺度融合; 深度学习; image inpainting; generative adversarial network; stable field; multi-scale fusion; deep learning;
Xueyi YE, Maosheng ZENG, Weijie SUN, et al. Image inpainting based on multi-scale stable-field GAN. Sci Sin Inform, 2023, 53(4): 682-698, doi: 10.1360/SSI-2022-0065
基于Transformer的高光谱图像超分辨率重建
王龙光, 郭裕兰, 林再平, 王应谦, 安玮
中国科学: 信息科学, 2023, 53(3): 500-516
摘要 高光谱图像超分辨率重建旨在融合高分辨率多光谱图像与低分辨率高光谱图像以得到高分辨率高光谱图像.如何实现二者中空域信息和谱域信息的有效融合是高光谱图像超分辨率重建的关键.受高光谱图像的端元表示模型启发,本文在神经网络中显式地对端元进行建模,并利用其作为纽带实现空域信息和谱域信息的融合.具体来说,本文提出了一个基于Transformer的高光谱图像超分辨率重建网络,利用Transformer结构从低分辨率高光谱图像提取端元信息,并将端元信息融合到高分辨率多光谱图像中,进而完成高分辨率高光谱图像的重建.实验结果表明, Transformer结构的全局感受野增强了网络的长程建模能力,提高了端元提取精度,进而提升了超分辨率重建性能.与已有方法相比,本文所提方法在室内/遥感高光谱数据集上均取得了更优的性能.
关键词 高光谱图像; 图像超分辨率重建; 图像融合; Transformer网络; 端元特征; hyperspectral image; image super-resolution; image fusion; transformer network; endmember feature;
Longguang WANG, Yulan GUO, Zaiping LIN, et al. Deep hyperspectral image super-resolution with transformers. Sci Sin Inform, 2023, 53(3): 500-516, doi: 10.1360/SSI-2021-0181
基于姿态与双流神经架构搜索的行人动作识别
龚申健, 张姗姗, 郭煜, 杨健, 陶冶
中国科学: 信息科学, 2023, 53(3): 485-499
摘要 行人是城市交通场景下的弱势群体,为了避免碰撞,有必要准确地预测他们的动作行为.为此,本文首次提出城市交通场景中行人动作识别这一问题并提出了有针对性的解决方案.首先,我们创建了一个新的行人动作识别数据集(PARD)作为实验的数据基础,并给出了一个有效的基准模型MFVGG,该模型能够以较低的计算成本达到与之前先进人体动作识别方法相当的性能.为了更针对性地解决问题,本文在两个方面对基准模型进行了改进.首先,利用姿态先验来丰富特征表示,构造双流网络融合双分支编码特征.其次,本文引入双流神经架构搜索得到对于这项任务的最优层级网络架构.实验表明,提出的方法的性能超过了一般人体动作识别相关的先进算法.数据集以及代码公布在https://github.com/Yankeegsj/PARD.
关键词 深度学习; 计算机视觉; 动作识别; 网络架构搜索; 姿态估计; deep learning; computer vision; action recognition; neural architecture search; pose estimation;
Shenjian GONG, Shanshan ZHANG, Yu GUO, et al. Pose-guided pedestrian action recognition with two-stream neural architecture searching. Sci Sin Inform, 2023, 53(3): 485-499, doi: 10.1360/SSI-2021-0198
基于雾扰动的图像分类对抗性攻击方法
高瑞均, 郭青, 余洪凯, 冯伟
中国科学: 信息科学, 2023, 53(2): 309-324
摘要 对抗性攻击是研究深度神经网络脆弱性的前沿技术.然而现有工作大多关注基于加性噪声扰动的攻击,无法代表现实世界中的扰动因素,阻碍了对抗性攻击的实际应用.雾作为现实世界中广泛存在的自然现象,对图像造成显著影响,不可避免地对深度模型构成潜在威胁.本文首次尝试从对抗性攻击的角度研究雾对深度神经网络的影响,并提出两种基于雾扰动的对抗性攻击方法:基于优化的雾扰动对抗性攻击OAdvHaze,在深度神经网络的指引下优化大气散射模型参数,以合成有雾图像,该方法具有较高的攻击成功率.预测式雾扰动对抗性攻击PAdvHaze,采用深度神经网络直接预测雾合成参数,提高了对抗性攻击的速度.本文在ILSVRC 2012和NIPS 2017两个公开数据集上验证了所提出方法的有效性, OAdvHaze和PAdvHaze取得了与最先进攻击方法相当的攻击成功率和可迁移性.该工作将有助于评估和提高深度神经网络对现实世界中潜在雾扰动的鲁棒性.
关键词 对抗性攻击; 图像分类; 雾合成; 深度学习; 图像处理; adversarial attack; image classification; haze synthesis; deep learning; image processing;
Ruijun GAO, Qing GUO, Hongkai YU, et al. Adversarial attack method against image classification based on haze perturbation. Sci Sin Inform, 2023, 53(2): 309-324, doi: 10.1360/SSI-2021-0362
三维时频变换视角的智能微观三维形貌重建方法
闫涛, 钱宇华, 李飞江, 闫泓任, 王婕婷, 梁吉业, 郑珂银, 吴鹏, 陈路, 胡治国, 乔志伟, 张江峰, 翟小鹏
中国科学: 信息科学, 2023, 53(2): 282-308
摘要 基于图像聚焦信息的三维形貌重建方法通常对微观物体的景深图像序列采用统一的聚焦评价标准,这类重建方法往往会忽视图像序列之间的联系,难以修正图像纹理稀疏或低对比度导致的连续帧深度误差.鉴于三维数据特有的多维度信息关联特性,本文将微观物体的不同景深图像序列视为三维数据,在重建过程中引入全部图像序列之间的关联关系,从三维数据时频变换的视角构造了以多视角分析、稳定性聚类、选择性融合逻辑耦合的微观三维形貌重建框架.首先从理论上分析三维数据相较于传统二维图像处理重建问题的优势,通过构造三维时频变换实现三维数据到不同尺度、区域和方向深度图像之间的映射;然后从增强深度图像特征的角度构建基于多模态纹理特征的局部稳定性聚类算法,实现同质性较好深度图像的自适应选择;最后提出选择性深度图像融合的策略,通过构造层筛过滤平衡树对滤除离散噪声后的多层深度图像进行融合,实现微观物体高精度的三维形貌重建.模拟数据与真实场景数据均验证了本文方法的有效性.三维时频变换视角的智能微观三维重建方法为基于图像聚焦信息的三维形貌重建提供一个崭新的研究视角,在精密制造、亚微米级工业测量等领域具有重要的理论意义和应用价值.
关键词 三维重建; 无监督学习; 稳定性聚类; 深度图像; 时频变换; 3D shape reconstruction; unsupervised learning; locally stable clustering; depth image; time-frequency transformation;
Tao YAN, Yuhua QIAN, Feijiang LI, et al. Intelligent microscopic 3D shape reconstruction method based on 3D time-frequency transformation. Sci Sin Inform, 2023, 53(2): 282-308, doi: 10.1360/SSI-2021-0386
面向多设备协同场景的实时视频流分析系统
杨铮, 董亮, 蔡新军
中国科学: 信息科学, 2023, 53(1): 46-65
摘要 实时视频流分析在智能监控、智能制造、自动驾驶等场景中具有重要价值,然而其存在计算负载高、带宽需求大和延迟要求严格等特点,难以通过传统的本地计算模式或者云计算模式进行部署.近年兴起的边缘计算范式,将复杂的计算任务从终端设备上传到物理临近的边缘服务器上,能够有效解决设备层面的部署问题.然而,例如无人机编队飞行、车队自动驾驶和多机器人协同等不断涌现的多设备协同场景,新增了系统层面的综合性能要求,包括智能分析的实时准确率、设备之间的性能一致性和系统容纳的设备数量上限.当前的边缘计算范式对多设备协同场景的优化尚显不足,未能有效解决设备之间对上传带宽和服务器算力的竞争问题,所以难以满足这类场景的要求.本文设计了MASSIVE系统,能够在多设备协同场景中,全面提升实时视频分析的综合性能.首先, MASSIVE系统提出了适合多设备协同场景中度量视频流分析系统综合性能的评价体系.其次, MASSIVE系统设计了帕累托改进调度器来计算帕累托最优的系统调度策略,使得系统在3个维度上同时取得了相比已有系统更好的性能表现.最后, MASSIVE设计了虚拟流量整形器来保证各个设备在无线网络中按照调度策略上传视频流数据.实验结果表明, MASSIVE在多种典型的视频分析任务中,相比于当前的代表性系统,至少达到了122.7%的实时准确率、1.8倍的系统容量和更好的系统一致性,并达到了帕累托最优.
关键词 实时视频流分析; 边缘计算; 多设备协同; 多目标优化; 帕累托最优; real-time video analysis; edge computing; multi-agent cooperation; multi-objective optimization; Pareto optimal state;
Zheng YANG, Liang DONG, Xinjun CAI. Toward cooperative multi-agent video streaming perception. Sci Sin Inform, 2023, 53(1): 46-65, doi: 10.1360/SSI-2021-0179
基于正交回归和特征加权的脑电情感特征选择方法
徐雪远, 刘建红, 李子遇, 翟广涛, 邬霞
中国科学: 信息科学, 2023, 53(1): 33-45
摘要 颅内容积传导效应导致大量脑电特征之间具有高度相关性,而这些高度相关的脑电特征无法为情感识别提供额外的有用信息,并且会降低基于脑电信号的情感识别效率.为了去除冗余信息和挑选有判别力的脑电特征,本文提出了一种基于正交回归和特征加权的脑电情感特征选择方法.与传统特征选择方法相比,该方法利用正交回归在脑电特征映射空间中保留更多的判别信息,更加适合于非线性和非平稳脑电信号的分析处理.为了验证所提出方法的性能,我们采集了由视频诱发的多通道脑电情感数据,并将所提出方法与4种常用的脑电特征选择方法进行了比较.实验结果证明了本文所提出方法能有效降低脑电特征集内冗余信息,并挑选出具有判别力的脑电特征子集.此外,通过分析由该方法所挑选的脑电特征类型,我们发现中心频率特征是最具判别力的脑电情感特征.该发现将为未来脑电情感特征提取研究提供新的思路.
关键词 脑电; 特征选择; 情感识别; 正交回归; 特征加权; electroencephalogram; feature selection; emotion recognition; orthogonal regression; feature weighting;
Xueyuan XU, Jianhong LIU, Ziyu LI, et al. EEG emotional feature selection method based on orthogonal regression and feature weighting. Sci Sin Inform, 2023, 53(1): 33-45, doi: 10.1360/SSI-2021-0276
附加偏见预测器辅助的均衡化场景图生成
王文彬, 王瑞平, 陈熙霖
中国科学: 信息科学, 2022, 52(11): 2075-2092
摘要 场景图是以场景中的物体为结点、以物体之间的关系为边构成的图结构,在视觉与语言交互理解和推理相关任务中具有广泛的应用前景.近年来,场景图自动生成逐渐受到关注,但生成结果中对于关系的描述受到长尾分布带来的偏见的影响,偏向于样本量较大的头部关系.然而头部关系往往过于空泛,描述不够准确,容易造成误解.由于这种关系价值不高,生成的场景图近似于退化为场景中物体信息的堆叠,不利于其他应用在图结构上进行结构化推理.为了使场景图生成器在这种不均衡的数据条件下,能够更均衡地学习,给出更加多样化的特别是尾部的更准确的关系,本文提出一种附加偏见预测器(additional biased predictor, ABP)辅助的均衡化学习方法.该方法利用一条有偏见的关系预测分支,令场景图生成器抑制自身对头部关系的偏好,并更加注重尾部关系的学习.场景图生成器需要为指定的一对物体预测关系,这是一种实例级的关系预测,与之相比,有偏分支以更简洁的方式预测出图像中的关系信息,即不指定任何一对物体,直接预测出图像中存在的关系,这是一种区域级的关系预测.为此,本文利用已有的实例级的关系标注,设计算法自动构造区域级的关系标注,以此来训练该有偏分支,使其具有区域级关系预测的能力.在不同场景图生成器上应用ABP方法,并在多个公开数据集(Visual Genome, VRD和OpenImages等)上进行实验,结果表明, ABP方法具有通用性,应用ABP方法训练得到的场景图生成器能够预测出更加多样化的、更准确的关系,进而生成更有价值、更实用的场景图.
关键词 场景图生成; 长尾分布; 附加偏见预测器; 均衡化学习; 区域级关系; scene graph generation; long-tailed distribution; additional biased predictor; balanced learning; region-level relationship;
Wenbin WANG, Ruiping WANG, Xilin CHEN. Balanced scene graph generation assisted by an additional biased predictor. Sci Sin Inform, 2022, 52(11): 2075-2092, doi: 10.1360/SSI-2022-0105
基于全局结构差异与局部注意力的变化检测
梅杰, 程明明
中国科学: 信息科学, 2022, 52(11): 2058-2074
摘要 检测由自然灾害造成的不同变化,对于有效地指导人道主义援助和灾难响应行动来说至关重要.但是灾害发生的地区通常面积大、地面环境复杂,导致检测其变化具有较大的挑战性.现有的评估方法通常依靠人工来进行判别,不适用于多种灾害的检测.本文提出了一种新颖的变化检测模型(change transformer, CHTR),基于双时序遥感图像来同时进行建筑分割和多级变化检测两个任务.本文结合卷积神经网络擅长学习局部细节特征和Transformer可以建模长程依赖关系的优势,采用混合卷积神经网络和Transformer的架构作为编码器.考虑到自然灾害通常会对复杂环境中的建筑物造成不同程度的破坏,本文提出了一种全局差异模块,以捕获全局变化模式,提高对双时序图像之间变化的整体认识.进一步设计了一种局部门控注意力模块,以学习多级别变化之间的局部依赖性,增强对不同变化的判别能力.在目前最大的建筑物损毁评估数据集(xBD)上进行的大量实验表明,本文提出的方法在建筑分割和变化检测两个任务上都取得了更好的结果.
关键词 建筑物分割; 变化检测; 遥感图像; 全局和局部结构; Transformer; building segmentation; change detection; satellite imagery; global-local architecture; transformer;
Jie MEI, Ming-Ming CHENG. Damage assessment with global differences and local attention. Sci Sin Inform, 2022, 52(11): 2058-2074, doi: 10.1360/SSI-2021-0384
基于自判别循环生成对抗网络的人脸图像翻译
王清和, 曹兵, 朱鹏飞, 王楠楠, 胡清华, 高新波
中国科学: 信息科学, 2022, 52(8): 1447-1462
摘要 人脸跨域翻译是将人脸图像从一个图像域映射到另一个图像域的过程,常见的人脸图像翻译任务包括人脸照片–素描、人脸照片–线条画跨域翻译等,可以广泛应用于现实场景,如协助刑侦、电影制作、数字娱乐.但是成对的人脸图像数据有限,且不同域之间的颜色、纹理差异较大,导致人脸图像跨域翻译仍面临着巨大挑战.现有的方法通常会产生模糊、伪影、结构失真等问题,导致较差的视觉效果.为解决这一问题,我们提出了一个自判别循环生成对抗网络,其中,生成器部分采用编码器–解码器结构,生成器对应的判别器为翻译方向相反的编码器,通过自判别的形式,使编码器(即判别器)巧妙地融合了“真/假”语义判别能力与对像素改变的敏感性,从而增强了模型的稳健性和泛化能力.其次,我们提出了一个新颖的全向像素梯度损失函数,设计的卷积核计算了每个像素周围每个方向的梯度来提取图像的梯度信息,通过约束生成图像与对应真实图像的梯度信息保持一致,从而激励模型有效地学习像素间连续变化的模式,并且该损失函数可以灵活地应用于其他生成模型以提升性能.大量的实验表明本文提出的框架能够在公开的成对的人脸照片–素描数据集(CUFS, CUFSF)以及人脸照片–线条画数据集(APDrawing)上取得优异的结果.此外,通过泛化能力验证实验,我们进一步展示了模型在真实场景数据上的强泛化能力,以及自判别循环生成对抗网络结构在非成对人脸数据集上的出色性能.
关键词 人脸图像翻译; 自判别循环生成对抗网络; 梯度损失; 照片–素描; 照片–线条画; face image translation; self-discriminative cycle generative adversarial network; gradient loss; photo-sketch; photo-APDrawing;
Qinghe WANG, Bing CAO, Pengfei ZHU, et al. Self-discriminative cycle generative adversarial networks for face image translation. Sci Sin Inform, 2022, 52(8): 1447-1462, doi: 10.1360/SSI-2021-0321
基于精细化多模态关联的自然语言句子在视频中的时序定位方法
袁艺天, 王鑫, 朱文武
中国科学: 信息科学, 2022, 52(8): 1417-1446
摘要 通信技术和移动互联网的发展使多媒体数据逐渐渗透人们的生活,而视频作为其中一种最具表现力的内容表达方式,近年来受到了工业界和学术界的广泛关注.针对视频数据中背景信息较为冗余,所需分析浏览时间长的特点,本文介绍了自然语言句子在视频中的时序定位任务,即在视频中定位与给定自然语言句子语义相关的视频片段,这样人们可以通过提供明确简洁的文本描述在视频中迅速找寻所关注的特定内容,从而提高用户的视频浏览体验和搜索效率.传统方法往往以多模态匹配的框架来解决句子在视频中的时序定位问题,忽略了自然语言句子中的关键定位线索,更忽视了自然语言句子对于关联视频内部相关内容的重要指导作用,因而其时序定位准确率十分有限.为解决上述难题,本文提出了多模态共同注意力机制挖掘自然语言句子中与时序定位相关的重要语义细节,精细地构建句子中各单词和视频内容之间的语义关系.在此基础上,我们还提出了语义条件动态归一化机制,指导视频中与句子语义相关的局部视频内容紧密耦合,形成明确的视频片段边界,最后辅以细粒度的边界调整模块,进而获得更为精准和灵活的时序定位结果.在公开数据集上的实验验证了本文所提出的机制和方法的有效性.最后,本文还从引入视频中的音频信号、考虑弱监督环境下的时序定位问题,以及构建无偏见时序定位数据集这3个方面对自然语言句子在视频中的时序定位问题进行了未来研究方向的展望.
关键词 时序定位; 语义关联; 多模态共同注意力机制; 时序卷积网络; 语义条件动态归一化机制; temporal sentence grounding in videos; semantic correlation; multimodal co-attention mechanism; temporal convolutional network; semantic conditioned dynamic normalization;
Yitian YUAN, Xin WANG, Wenwu ZHU. Temporal sentence grounding in videos with fine-grained multimodal correlation. Sci Sin Inform, 2022, 52(8): 1417-1446, doi: 10.1360/SSI-2021-0138
混合曲线曲面的CG-LSPIA拟合算法
蒋旖旎, 蔺宏伟
中国科学: 信息科学, 2022, 52(7): 1251-1271
摘要 混合曲线曲面的拟合常应用于计算机辅助设计与制造中,但传统的数据拟合方法缺乏明显的几何意义.最小二乘渐进迭代逼近算法(progressive-iterative approximation for least square fitting, LSPIA)能通过迭代地调整控制点得到原始数据点的最小二乘拟合结果,具有明显的几何意义,但收敛速度较慢.为解决这个问题,本文提出一种基于共轭梯度法的最小二乘渐进迭代逼近算法(conjugate-gradient progressive-iterative approximation for least square fitting, CG-LSPIA).该算法首先计算共轭曲线曲面,再更新混合曲线曲面,在没有数值误差的情况下,迭代至多n步即可生成给定数据点的最小二乘拟合曲线曲面.此外,本文给出了CG-LSPIA算法收敛性证明.最后,以B样条曲线曲面为例,与LSPIA算法进行了比较,实验表明该算法有效,并且减少了达到相同拟合误差限所需的迭代次数与时间.
关键词 渐进迭代逼近; 最小二乘拟合; 共轭梯度法; 数据拟合; 几何设计; progressive-iterative approximation algorithm; least square fitting; conjugate-gradient method; data fitting; geometric design;
Yini JIANG, Hongwei LIN. Conjugate-gradient progressive-iterative approximation for least square fitting of curves and surfaces. Sci Sin Inform, 2022, 52(7): 1251-1271, doi: 10.1360/SSI-2020-0403
“千里阵云”的主观物象空间特征测量
律睿慜, 张陶洁, 梅莉琳
中国科学: 信息科学, 2022, 52(7): 1221-1250
摘要 书法笔画能够产生丰富的主观意象,中国传统绘画也有类似的审美现象.于是,在古代的书画论著中,有大量关于笔画观感的记载,往往是将笔画引出的各种丰富拟物化意象进行描述.目前由于书法通常被归入艺术学研究的范畴,书法理论研究中还极少引入数理建模和科学实验的方法,因此对于笔画的意象空间还鲜有采取测量及实证的科学方法,还未能对其建立数理模型.本文设计了两项实验,用以探索书法笔画的意象空间.在第一项实验中,引入实验美学中常用的审美测量方法,选取了书法家写的15个“一”字作为测试样品,并选用21种拟物化感知维度,设计了视觉模拟量表,招募了252名普通群众对它们进行意象感受评测实验.然后,对数据进行主成分分析,展现出笔画“一”的意象空间的特征:其一,它的前二维占据主导,主轴对应于书法理论中探讨最多的“质与妍”的风格倾向问题、副主轴对应于“真与草”的书风倾向问题;其二,它的第三、四维的分布情况也不可忽略,其具体的意义有待进一步解释;其三,不同形态的笔画分布于该空间的不同位置,不同的感知维度对应于从空间原点出发的不同方向.基于第一项实验,设计了可视化方案,直观展现该意向空间中占主导的前二维的结构特征.第二项实验让测试者对实验一中的15个笔画样品评价其两两之间的主观差异.该实验结果经多维缩放分析,与实验一的结果互为支撑.不仅验证了书法理论中有关书风和书体的观点,还为关于“笔法”的审美感知实证研究提供了一种可拓展的数理模型和实验框架.
关键词 书法; 笔法; 笔画; 意象; 实验美学; 主成分分析; 多维尺度分析; 数据可视化; calligraphy; brushstrokes; calligraphic stroke; synesthesia; empirical aesthetics; principle component analysis; multidimensional scaling; data visualization;
Ruimin LYU, Taojie ZHANG, Lilin MEI. Experimental framework to study the subjective materialized image space of horizontal calligraphy strokes. Sci Sin Inform, 2022, 52(7): 1221-1250, doi: 10.1360/SSI-2020-0344
基于生成对抗网络和域一致性的MRI运动伪影校正方法
曾宪华, 纪聪辉, 董倩
中国科学: 信息科学, 2022, 52(5): 822-836
摘要 在临床诊断中,磁共振成像(magnetic resonance imaging, MRI)运动伪影是一个常见的问题,运动伪影的存在会影响医生的诊断,虽然重新采集MRI可以避免这一问题,但这会提高医院和患者的经济成本和时间成本,因此,运动伪影的校正具备实用研究价值.现有的研究主要关注于空域的运动伪影校正或者K空间的运动伪影校正,缺乏对K空间和空域之间数据一致性的保持.为了解决这一问题,本文基于生成对抗网络提出了保持K空间和空域之间数据一致性的MRI运动伪影校正模型.该模型通过频域生成器对K空间数据进行初步校正,然后通过空域生成器对空域中的数据进行精细校正,在优化阶段则采用域间数据一致性损失来保持K空间和空域之间的数据一致性.在公开脑部MRI数据集ADNI, ABIDE, OASIS和Brain上的实验结果表明,本文提出的模型相较于其他方法分别在PSNR, SSIM以及RMSE上最高提升了3.4%, 3.07%和15.57%.
关键词 运动伪影校正; 生成对抗网络; 数据一致性; 深度学习; 医学图像; motion artifact correction; generative adversarial network; data consistency; deep learning; medical image;
一种基于点标注的弱监督目标检测方法
姚洁茹, 韩军伟, 张鼎文
中国科学: 信息科学, 2022, 52(3): 461-482
摘要 近年来,弱监督目标检测在计算机视觉和机器学习领域获得了广泛的关注.点标注是弱标注的形式之一,它依赖人工标注,为图像中的每一个物体赋予一个标注点.尽管在过去的几年中,出现了许多基于深度学习的弱监督目标检测算法,但当前基于点标注的弱监督目标检测的探索仍处于空白.考虑到点标注可以为弱监督目标检测提供丰富的、与感兴趣物体相关的位置、类别、数量等信息,本文提出了一个基于点标注的弱监督目标检测算法.该算法通过探索标注点与目标、类别间、实例间的依赖关系弥补弱监督学习中监督信息的不足,提高弱监督目标检测性能.在该算法中,本文提出了3个网络分支用以充分挖掘标注点信息,改善弱监督目标检测学习过程:空间图分支(spatial graph branch,SGB)利用点标注与目标空间上的局部相关性,探索标注点与标注点空间上下文间关系;多语义分支(multi-semantics branch, MSB)利用类别间在语义上的共现概率,构建语义拓扑结构,探索标签间的全局语义关系;实例计数分支(count-guided instance branch, CIB)利用不同实例间在空间上的局部无关性和特征差异,推断每个目标的伪监督信息,实现实例级监督.用点标注训练弱监督目标检测算法,在节省人工标注成本的同时提供更多丰富的监督信息,从本质上提高弱监督目标检测性能.在PASCAL VOC 2007和PASCAL VOC 2012数据集上的实验结果表明,本文算法与基准模型相比,在均值平均精度上分别提高了7.9%和10.2%,在定位准确度上分别提高了9.7%和11.7%.
关键词 弱监督学习; 目标检测; 点标注; 依赖关系; 关系推理; weakly supervised learning; object detection; point annotation; dependency relationship; relationship reasoning;
Jieru YAO, Junwei HAN, Dingwen ZHANG. A weakly supervised object detection approach using point annotation. Sci Sin Inform, 2022, 52(3): 461-482, doi: 10.1360/SSI-2021-0089
基于多尺度特征融合的人脸照片-素描合成
梁昌城, 王楠楠, 朱明瑞, 杨曦, 李洁, 高新波
中国科学: 信息科学, 2022, 52(2): 334-347
摘要 从真实的人脸照片合成面部素描及其逆过程具有广泛的用途,例如数字娱乐与协助刑事案件的侦查.但是,由于照片与素描在纹理上的显著差异,它们之间的互相转换仍是一个具有挑战性的问题.最近基于生成对抗网络的方法已在图像间转换问题,特别是照片到素描的转换方面展现出令人鼓舞的结果,但它们大多会在面部关键组件产生不同的形变或者模糊,使得合成图像的真实性受影响.为了应对这一挑战,我们提出了一种新颖的基于多尺度特征融合的人脸照片–素描合成算法,来提高合成图像的结构完整性与纹理逼真度.首先使用编码器提取输入图像的多尺度编码特征,然后将最底层编码特征经过空洞卷积模块后传入解码器进行解码.解码过程中将不同尺度的解码特征与对应尺度的编码特征在通道维度上拼接,从而获得多尺度编解码融合特征.最后在解码器的输出端将不同尺度的编解码融合特征进一步融合,并通过一层卷积层产生最终合成结果.通过这种同时将编码–解码过程中不同尺度的特征在通道维度进行拼接的方式,能够保持较好的图像结构以及纹理细节,生成逼真的面部素描/照片图像.我们在多个具有挑战性的数据集中验证了所提方法的有效性.定量和定性评估表明,本文模型在生成具有高视觉质量的人脸素描(或照片)方面优于其他最新技术.
关键词 人脸照片–素描合成; 图像翻译; 生成对抗网络; 多尺度特征融合; 空洞卷积; face photo sketch synthesis; image-to-image translation; generative adversarial network; multi-scale feature fusion; dilated convolution;
Changcheng LIANG, Nannan WANG, Mingrui ZHU, et al. Face photo-sketch synthesis based on multi-scale feature fusion. Sci Sin Inform, 2022, 52(2): 334-347, doi: 10.1360/SSI-2021-0085
基于田字格变换的自监督汉字字体生成
曾锦山, 陈琪, 王明文
中国科学: 信息科学, 2022, 52(1): 145-159
摘要 近年来,汉字自动生成因其在艺术字体生成、个性化字体设计,以及书法作品生成等问题中的广泛应用而引起了大量关注.当前主流的汉字字体自动生成方法主要基于非配对数据和深度生成模型如生成对抗网络等.然而,这些主流的深度汉字字体生成方法通常忽略了汉字本身的结构信息,导致在提取特征时缺乏相应指导,且在训练过程中容易出现模式坍塌现象,从而在生成汉字质量方面亟待进一步提高.针对该问题,本文受汉字田字格书写的启发,提出一种基于田字格变换的自监督方法来指导网络模型提取更高质量的特征,进而提升汉字生成效果,需要特别指出的是所设计的田字格几何变换无需改变现有模型网络且不增加任何人工成本,因此潜在可嵌入许多已有深度汉字字体生成模型.所提自监督学习方法的有效性在一系列实验中得到验证.实验结果表明,在嵌入所提的自监督学习任务后,当前流行的基于CycleGAN的深度汉字生成模型在生成效果和训练稳定性等方面都有较大提升,并且模式坍塌现象得到改善.与现有其他深度汉字字体生成方法相比,所提基于田字格几何变换的自监督方法提高了生成汉字质量,并且在生成汉字内容准确率、FID值、L1损失和IOU这4个评价指标上均有一定提升.
关键词 汉字字体生成; 自监督学习; 生成对抗网络; 深度学习; 田字格变换; Chinese font generation; self-supervised learning; generative adversarial network; deep learning; square-block transformation;
Jinshan ZENG, Qi CHEN, Mingwen WANG. Self-supervised Chinese font generation based on square-block transformation. Sci Sin Inform, 2022, 52(1): 145-159, doi: 10.1360/SSI-2021-0056
BeautyGAN+: 基于全新PMT数据集的美妆转移混合监督学习算法
白玉, 颜波, 谭伟敏
中国科学: 信息科学, 2022, 52(1): 129-144
摘要 作为改变人脸图像外观的重要方式之一,美妆转移任务在近年来获得了越来越多的关注.美妆转移网络可以将任意参考图像的妆容转移到任意人脸图像上,在节约时间和空间成本的同时帮助人们找到适合自己的妆容,并获得妆容得到美化的图像.美妆转移网络BeautyGAN成功展示了无监督方法妆容迁移的较好效果,然而此类无监督学习策略缺乏可以提供良好妆容细节的监督标签,导致实验结果中出现了背景变色、边缘不自然、容易受光照影响等问题.用素颜–美妆配对标签进一步约束BeautyGAN模型训练可以解决上述问题,但当前学术界缺乏此类精细标注的配对数据集.针对以上问题,本文提出了BeautyGAN+方法,贡献了一个用户详细标注的素颜–美妆配对数据集,即PMT数据集,在BeautyGAN的无监督基础上加入有监督损失进行训练,最终通过实验发现结合无监督(迁移性好)和有监督(细节修复好)的训练策略可以提供更好的迁移效果.实验结果中的图像结果和用户调研(14位)均表明本文方法显著提升了美妆转移效果,解决了美妆转移工作长期缺乏配对数据集及转移结果存在多种偏差的难题.
关键词 深度学习; 美妆转移技术; 生成式对抗网络; 有监督学习; 美妆数据集; deep learning; makeup transfer; generative adversarial network(GAN); supervised learning; makeup dataset;
Yu BAI, Bo YAN, Weimin TAN. BeautyGAN+: mixed-supervised makeup transfer learning algorithm based on new PMT dataset. Sci Sin Inform, 2022, 52(1): 129-144, doi: 10.1360/SSI-2021-0093
面向预防性保护的文物本体智能原位监测系统
冯伟, 张乾, 田飞鹏, 王小伟, 柴勃隆, 孙济洲, 苏伯民
中国科学: 信息科学, 2021, 51(12): 2102-2118
摘要 预防性保护是国际广泛认可并努力持续追求的先进保护理念,代表了文物保护的发展方向.预防性保护通过精细监测病征,识别病因,精准控制相关致病因素,从而达到有效抑制文物本体劣化的目的.整个过程,监测是起点和根本.目前,国内外对环境风险源感知已有很多技术和数据的积累.然而,由于文物本体劣化具有发展缓慢、变化细微、赋存环境多样等特点,目前国内外尚缺乏面向真实赋存环境下文物本体细微变化的快速、精准、可靠的监测方法,严重阻碍了文物预防性保护的发展和推广.本文聚焦该问题,首次提出了基于相机位姿主动式重现的原位监测思路,并在此基础上设计研发了功能完善、适用面广的文物本体智能原位监测系统.通过物理真实地重现相机六自由度位姿,实现了基于图像导引的文物本体真实细微变化的准确检测.目前该系统已成功在敦煌莫高窟、故宫、颐和园等10多个文化遗产地的多种保护业务中推广应用.
关键词 预防性保护; 成像条件原位重现; 相机重定位; 细微变化检测; 主动视觉; 原位监测; preventive conservation; imaging condition reproduction; camera relocalization; fine-grained change detection; active vision; in-situ inspection;
Wei FENG, Qian ZHANG, Fei-Peng TIAN, et al. An intelligent in-situ visual inspection system for preventive conservation of cultural heritages. Sci Sin Inform, 2021, 51(12): 2102-2118, doi: 10.1360/SSI-2021-0052
基于三维深度神经网络的大规模神经元形态表征与检索方法
常令琛, 李钟毓, 樊夏玥, 商增谊, 景海婷
中国科学: 信息科学, 2021, 51(12): 2089-2101
摘要 高效准确的相似神经元检索方法是神经元形态分析的重要支撑.随着高精度显微成像、神经元示踪、人工智能等技术的发展,近些年出现了若干基于机器学习的神经元形态计算与分析方法,这些研究主要包括对传统神经元形态度量指标的统计分析,以及将神经元形态二维投影与深度学习结合的神经元量化表征方法,在神经元的特征提取、分类、相似检索等任务中均取得了不错的效果.不过随着越来越多的三维神经元数据被重建出来,以上方法都无法满足当前背景下对大规模神经元形态数据的细粒度表征、检索与分类需求.为此,本文提出了基于三维深度神经网络的大规模神经元形态表征与检索方法.首先,为了将神经元的三维空间拓扑结构转换成适用于深度神经网络的形式,我们设计了神经元空间形态的体素转换方法,将原始的神经元重构文件转换成三维体素的形式,极大地保留了神经元的三维空间拓扑结构.随后,考虑到当前神经元数据缺乏精细的分类标准,本文设计了基于三维卷积自动编码器的神经元形态表征算法,应用深度神经网络无监督地学习神经元体素数据的结构特点,得到神经元形态的量化表征,并以此设计端到端的相似神经元快速检索算法.最后通过实验验证本文所提出的方法,在9万余神经元数据中检索形态相似的神经元,实验结果显著优于其他基于神经元量化表征的检索方法.实验表明,本文方法可以更高效准确地检索相似神经元,为神经元的形态学分析、神经元单细胞分类等相关研究的关键问题提供支持.
关键词 神经元形态学; 深度神经网络; 三维体素; 特征表达; neuron morphology; deep neural networks; 3D voxels; feature representation;
Lingchen CHANG, Zhongyu LI, Xiayue FAN, et al. Large-scale neuron morphological representation and retrieval based on a threedimensional deep neural network. Sci Sin Inform, 2021, 51(12): 2089-2101, doi: 10.1360/SSI-2020-0393
融合梯度信息和邻域点云分布的3D线特征提取与配准
缪永伟, 戴颖婷, 王海鹏, 刘复昌, 王金荣
中国科学: 信息科学, 2021, 51(12): 2069-2088
摘要 针对传统点云场景重建中由于场景区域缺乏纹理、场景物体遮挡等导致重建结果不准确的局限性,借助场景包含的几何特性和线结构信息,有效利用RGB-D数据的梯度信息和邻域点云分布信息,本文提出了一种针对点云场景的3D线特征提取、匹配和配准方法.首先,通过场景RGB图的梯度信息确定梯度方向相似的3D直线段支持域.然后,借助场景深度图呈现的邻域几何特性,根据当前点与其邻近点之间的分布关系判断点云中的直线型边界线点云和直线型折边线点云并拟合得到场景3D线特征.其次,以点云场景提取的3D线特征为轴线,构造等厚度同轴圆柱区域作为3D线段支持域,并统计支持域中各层圆柱壁内点云梯度作为描述符实现3D线特征匹配.最后,利用基于线–线的迭代最近线配准算法,迭代计算得到帧间场景的旋转与平移,从而实现帧间点云场景的高效配准.实验结果表明,与已有的点云场景线特征提取及点特征配准方法比较,本文直接基于线特征的方法配准效率高、计算量小、配准精准,方法具有较强的鲁棒性.
关键词 点云场景; 3D线特征; 线特征提取; 线特征配准; 三维重建; point cloud scenes; 3D lines; line feature extraction; line registration; 3D reconstruction;
Yongwei MIAO, Yingting DAI, Haipeng WANG, et al. Extraction and registration of 3D lines by fusing gradient information and neighboring point cloud distribution. Sci Sin Inform, 2021, 51(12): 2069-2088, doi: 10.1360/SSI-2021-0009
二值图像超分辨率重建网络
姜馨蕊, 王楠楠, 辛经纬, 李柯宇, 杨曦, 高新波
中国科学: 信息科学, 2021, 51(10): 1690-1705
摘要 近年来,深层卷积神经网络在图像超分辨率重建任务中取得了巨大成功,然而复杂的深度神经网络会消耗大量存储空间以及计算资源,严重限制了其在资源有限的移动端设备上的部署.因此降低模型的资源消耗将有助于扩展深度超分辨率网络的实际应用范围.二值神经网络占用存储空间小、计算效率高,激励我们将二值化算法应用于目前的深度超分辨率重建领域,满足现有移动设备对于超分辨率的实际应用需求.因此,本文关注于二值图像超分辨率重建网络的研究.为此,我们首先总结了现有二值化方法,并针对其技术细节和算法特点进行了详细介绍.随后,我们探索了目前二值化方法在超分辨率领域的实际应用效果,并面向图像超分辨率重建任务提出一种新的二值化算法,主要通过提高网络前向过程表达能力和减少网络反向过程训练损失提升二值超分辨率网络的性能.实验表明,无论对比现有基于分类任务的二值化算法还是对比基于超分辨率任务的二值化算法,我们的方法均可以取得最优的性能.
关键词 二值卷积神经网络; 图像超分辨率重建; 二值化; 量化; 模型压缩; binary neural network; single image super-resolution; binarization; quantization; model compression;
Xinrui JIANG, Nannan WANG, Jingwei XIN, et al. Binary neural networks for image super-resolution. Sci Sin Inform, 2021, 51(10): 1690-1705, doi: 10.1360/SSI-2020-0346
基于深度学习的数字病理扫描系统单次曝光自动对焦方法
李强, 刘贤明, 韩凯歌, 江俊君, 季向阳
中国科学: 信息科学, 2021, 51(10): 1675-1689
摘要 全切片数字成像(whole slide imaging, WSI)是病理切片数字化的核心技术,其自动对焦的速度和精度决定了WSI系统的性能.然而,传统的自动对焦方法需要拍摄多张离焦子图像创建图像堆栈,或者需要复杂的硬件调制光学系统,从而限制了WSI在实际场景中的应用.本文设计了基于深度学习的数字病理扫描系统单次曝光自动对焦方法,对子图像逐个进行网络虚拟自动对焦,将单张离焦子图像通过网络直接生成准焦子图像.本方法仅需要在任意离焦距离下的单次曝光拍照即可,从原理上避免了重复的对焦运动和相机曝光过程.实验结果表明,本方法具有高通量、高速度、低成本、实用性强、可线下处理等优点.
关键词 数字病理扫描系统; 自动对焦; 深度学习; 光学显微镜; 计算成像; digital pathological systems; autofocusing; deep learning; optical microscopes; computational imaging;
Qiang LI, Xianming LIU, Kaige HAN, et al. Whole slide imaging via one-shot deep autofocusing. Sci Sin Inform, 2021, 51(10): 1675-1689, doi: 10.1360/SSI-2020-0349
基于前景与透明度联合求解的多层次仿射类抠像与合成方法
姚桂林, 张必英, 张艳荣, 苏晓东
中国科学: 信息科学, 2021, 51(10): 1658-1674
摘要 数字图像抠像与合成问题是虚拟现实中的经典问题.抠像问题需要根据抠像公式,从输入图像准确地提取出前景物体的透明度(α)和前景物体的颜色值,而合成问题仅使用抠像结果与新背景图像进行结合,使其成为新的合成图像.然而,目前很多抠像算法仅局限于抠像部分的α值的计算,忽略了用于后续合成步骤的前景颜色的计算.这实际上仅限于理论研究,脱离了抠像问题的合成应用层面.同时,其他一些兼顾计算前景颜色算法的效果仍然不理想,而且也仍然缺乏合成图像数据集和对合成图像的比较.本文充分利用仿射类方法中搜索范围灵活可变的优势,采用实体像素与混合像素进行分级处理的3层次结构,联合求解出最终的α值和前景颜色.其中,每个层次均利用前向层次的先验,结合仿射类方法的像素相关性以及颜色拟合性约束,采用闭合形式进行求解.在实验中,本文不仅针对α层面进行比较,而且在数字抠像领域中首次引入针对合成图像层面的比较.在合成层面中,本文针对输入图像及各型号的三分模板(Trimap),均引入了白色背景和相应的自然图像背景.同时各方法的真实的α值和前景颜色不仅与这些背景进行了常规合成,而且也进行了一种单纯α层面的合成.实验结果表明,在数值评价结果和视觉效果方面,本文方法的最终α结果与上述各种合成效果均优于目前已有的抠像与合成方法及一些新生成的方法.
关键词 图像抠像; 图像合成; 仿射类抠像; 闭合形式解; 实体像素与混合像素; image matting; image compositing; affinity-based matting; closed form solution; opaque and mixed pixels;
Guilin YAO, Biying ZHANG, Yanrong ZHANG, et al. A multi-level affinity-based matting and compositing method based on a joint solution of foreground and transparency. Sci Sin Inform, 2021, 51(10): 1658-1674, doi: 10.1360/SSI-2020-0121
认知规律启发的物体分割评价标准及损失函数
范登平, 季葛鹏, 秦雪彬, 程明明
中国科学: 信息科学, 2021, 51(9): 1475-1489
摘要 物体分割技术是计算机视觉中的研究热点,在多个领域都有广泛的应用.本文从人类视觉系统对场景中的全局信息和局部细节非常敏感的角度出发,设计了一种新颖、高效且易于计算的增强匹配标准(E_ξ)来评估物体分割模型的性能. E_ξ将局部像素值与全局平均值有机结合,以便评估分割结果与标准结果在图像级和像素级的相似度.在国际主流的4个公开数据集上的大量实验表明, E_ξ在多个方面,如应用关联度、随机偏好度、噪声偏好度、感知度上相比现有广泛采纳的评价标准(IoU和F_β)均有大幅相对提升.通过利用加权二值交叉熵损失函数、本文的增强匹配损失函数以及加权交并比损失函数,本文进一步设计了一套组合损失函数(Hybrid-E_(loss))来促进网络学习到像素级、对象级和图像级的分割特征.定性和定量的结果表明,在3个不同领域的分割任务中使用这一组合损失函数能够进一步提高物体分割的精度.
关键词 物体分割技术; 评价标准; 视觉感知; 增强匹配标准; 损失函数; object segmentation; metric; cognitive vision; enhanced-alignment measure; loss function;
Deng-Ping FAN, Ge-Peng JI, Xuebin QIN, et al. Cognitive vision inspired object segmentation metric and loss function. Sci Sin Inform, 2021, 51(9): 1475-1489, doi: 10.1360/SSI-2020-0370
可视身份深度伪造与检测
彭春蕾, 高新波, 王楠楠, 李洁
中国科学: 信息科学, 2021, 51(9): 1451-1474
摘要 随着深度学习技术在视频和图像生成领域的广泛应用,视频和图像中的可视身份伪造,特别是人脸伪造结果的逼真程度越来越高,对于身份伪造数据的检测在国家安全和社会稳定等方面均具有重要的研究和应用价值,近年来已成为研究的热点问题.本文从有目标身份伪造和无目标身份伪造两个方面归纳和介绍了可视身份深度伪造的研究方法,并从基于空域线索、时域线索的面向已知伪造类型检测方法、面向未知伪造类型的泛化能力研究,以及面向对抗样本攻击的可信伪造检测研究等多个方面阐述了伪造检测的关键技术,并在总结现有数据集和代表性算法的性能分析基础上,进一步讨论了可视身份深度伪造与检测的关键问题和面临的挑战.
关键词 深度伪造; 人脸替换; 人脸编辑; 表情重演; 人脸生成; 伪造检测; deepfake; face swap; face manipulation; expression reenactment; face generation; forgery detection;
Chunlei PENG, Xinbo GAO, Nannan WANG, et al. Deep visual identity forgery and detection. Sci Sin Inform, 2021, 51(9): 1451-1474, doi: 10.1360/SSI-2020-0064
大场景多对象的深度社交分组网络
李坤, 李万鹏, 孙晓琨, 方璐
中国科学: 信息科学, 2021, 51(8): 1287-1301
摘要 在计算机视觉中,群体分析越来越受到人们的关注,对图像中复杂人群进行分组是群体分析领域的基础技术需求.现有的人群社交分组方法只针对固定人数的小范围场景,不能处理真实世界中的大场景图像.本文提出首个面向十亿像素大场景图像的基于深度学习的细粒度人群社交分组框架,由一种图引导的全局到局部的划分策略与一个学习隐函数表示社交对交互模式的深度社交分组网络组成.该框架可在大范围场景图像上实现准确的人群分组.本文方法同样适用于小场景图像,在小场景图像数据集上的实验结果表明,本文提出的框架相比于现有方法取得了显著的性能提升.相关代码与训练数据即将开源.
关键词 群体; 大场景图像; 深度学习; 社交分组; 图引导; group; large-scene image; deep learning; social grouping; graph-guided;
Kun LI, Wanpeng LI, Xiaokun SUN, et al. Deep social grouping network for large scenes with multiple subjects. Sci Sin Inform, 2021, 51(8): 1287-1301, doi: 10.1360/SSI-2021-0024
基于边缘和距离约束的有理多项式图像放大
张帆, 王桦, 范辉, 张彩明
中国科学: 信息科学, 2021, 51(8): 1270-1286
摘要 曲面拟合是最有效的图像放大方法之一,其关键是构造对图像拟合的曲面.图像细节和边缘等特征对图像的视觉效果起着关键作用,因此,构造拟合曲面的关键之一是保持图像细节和边缘.基于样条和多项式方法构造的拟合曲面不能有效地保持图像的边缘信息,从而使放大图像在边缘处锯齿状明显.本文提出了以边缘和距离为特征约束的图像放大新算法.算法以边缘和距离为约束,在每个像素的邻近区域上构造一张对邻域上像素点拟合的二次多项式曲面片,并在每个四边形网格上构造一张二次多项式中间曲面片.在每个四边形网格上由五张曲面片加权平均生成有理多项式曲面片.该曲面片具有二次多项式逼近精度,产生的图像具有较好的视觉效果.通过构造误差曲面片对二次多项式曲面片进行修正,提高了放大图像的精度和视觉效果.新算法把二次多项式的常数项、一次和二次项采用不同方法分别计算,为构造带约束的多项式函数提供了新技术.实验结果表明,相比于其他算法,本文算法不仅有较高的逼近精度,而且放大图像的视觉效果也较好.
关键词 二次多项式; 边缘和距离约束; 逼近曲面; 逼近精度; 图像放大; quadratic polynomial; edge and distance constraints; approximation surface; approximation accuracy; image magnification;
Fan ZHANG, Hua WANG, Hui FAN, et al. Rational polynomial image magnification based on edge and distance constraints. Sci Sin Inform, 2021, 51(8): 1270-1286, doi: 10.1360/SSI-2020-0364
基于稀疏表示的G1圆弧样条自动逼近方法
徐琳琳
中国科学: 信息科学, 2021, 51(8): 1255-1269
摘要 圆弧样条普遍用于数控机床的刀具轨迹设计中,希望用尽可能少的圆弧段逼近曲线.现有方法大多是启发式的,圆弧样条曲率的分段常值性质还没有引起足够的重视.本文基于这个内在的稀疏性质,提出基于稀疏表示的G~1圆弧样条自动逼近方法,主要分两步:稀疏优化问题自动检测圆弧间连接点的全局初始化和重新调整连接点位置保证G~1连续性的局部修正.实验结果显示新方法对对称性比较敏感,部分尖锐特征、自交数据也可以逼近得很好,充分说明了新方法的优越性.
关键词 圆弧样条; 稀疏表示; 逼近; G~1连续; arc spline; sparse representation; approximation; G~1 continuity;
Linlin XU. Automatic G1 arc spline approximation via sparse representation. Sci Sin Inform, 2021, 51(8): 1255-1269, doi: 10.1360/SSI-2020-0360
互联网图像驱动的语义分割自主学习
侯淇彬, 韩凌昊, 刘姜江, 程明明
中国科学: 信息科学, 2021, 51(7): 1084-1099
摘要 针对目标任务收集新类别的海量标注数据通常需要大量时间和人力成本,并已成为语义分割技术投入实际产业应用过程的主要瓶颈.本文旨在以"网络监督"的方式,在仅利用用户提供的目标类别关键词以及相应自动搜索到的网络数据的条件下实现语义分割模型的自主学习.该任务的核心挑战在于网络爬取的图像中存在一定量的类别噪声,从而影响自主学习的可靠性.为了解决类别噪声问题,本文设计了一种新颖的噪声擦除模型.该模型通过每次从小批次样本的置信注意力区域中以跨样本的方式学习语义信息来擦除训练图像中与搜索关键词无关的区域.基于该模型,本文同时提出了一种能够用于训练语义分割模型的高质量伪标注生成方法.在国际主流的公开数据集(PASCAL VOC2012)上的大量实验表明,基于该方法的语义分割模型在利用网络监督与弱监督的条件下均取得了良好结果 (mIoU=62.0%以及66.1%).
关键词 语义分割; 网络搜索; 类别噪声; 噪声擦除网络; 网络监督
Qibin HOU, Ling-Hao HAN, Jiang-Jiang LIU, et al. Autonomous learning of semantic segmentation from Internet images. Sci Sin Inform, 2021, 51(7): 1084-1099, doi: 10.1360/SSI-2020-0146
五次间接PH曲线的几何特征
李毓君, 方林聪
中国科学: 信息科学, 2021, 51(5): 808-821
摘要 针对五次间接PH曲线的判别问题,本文结合高斯消元法与几何方法给出Bézier控制多边形满足的充分必要条件.间接PH曲线通过一个二次有理参数变换后,其等距线是有理形式的.间接PH曲线的代数充分必要条件本质是其一阶导数的因式分解满足特定条件,是一种积的形式.考虑到Bézier曲线的表示是Bernstein多项式形式,是一种和的形式.通过这两种形式的相容性引出待求解的非线性方程组并讨论求解问题,最后将所得结果应用在控制多边形上,得到五次间接PH曲线的几何特征.
关键词 Bézier曲线; 等距曲线; 几何特征; 有理参数化; Bézier curves; offsets; geometric characteristic; rational parameterization;
Yujun LI, Lincong FANG. Geometric characteristics of quintic indirect-PH curves. Sci Sin Inform, 2021, 51(5): 808-821, doi: 10.1360/SSI-2019-0219
面向光流估计的高效加速器架构设计
刘博生, 陈晓明, 韩银和, 常亮
中国科学: 信息科学, 2021, 51(5): 795-807
摘要 光流(optical flow)为同一对象在视频中运动到下一帧的移动量.从视频中估计光流已广泛应用于各类移动智能系统,如运动估计和机器人导航.最近的研究表明,卷积神经网络(convolutional neural network, CNN)能提供可靠的光流估计结果.然而,现有的硬件加速器无法支持面向光流估计的CNN复杂计算.具体而言,这些类型的CNN不仅包括常规的卷积(convolution)和反卷积(deconvolution)运算,还包括双线性插值(bilinear interpolation)和/或关联(correlation)运算.双线性插值和关联操作主要探索两个连续图像帧之间的关联关系.为解决这一问题,本项工作提出面向光流的CNN硬件加速设计方案(称为Swan-AOE),即通过支持卷积、反卷积、双线性插值和关联操作解决这类神经网络的硬件加速计算问题. Swan-AOE包括可配置的硬件计算架构和自适应的调度策略,通过提供灵活的并行调度实现最优化吞吐量计算.此外, Swan-AOE还进行设计空间探索,探索可用片上缓存资源在提高能耗–面积效率的潜在能力.实验结果表明,与基准加速器相比,所提出的设计能有效提升性能、能效和面积效率.
关键词 加速器; 光流估计; 能效; 卷积神经网络; accelerator; optical flow estimation; energy efficiency; convolutional neural networks;
Bosheng LIU, Xiaoming CHEN, Yinhe HAN, et al. Efficient accelerator architecture for optical flow estimation. Sci Sin Inform, 2021, 51(5): 795-807, doi: 10.1360/SSI-2020-0323
面向群体行为识别的注意力池化机制
李定, 张文生
中国科学: 信息科学, 2021, 51(3): 399-412
摘要 视频行为识别近年来逐渐成为计算机视觉领域学者的研究热点,按照识别对象进行划分,视频行为识别任务可分为个体行为识别与群体行为识别.本文聚焦于群体行为识别,识别与分析视频场景中整体人群的行为.已有的群体行为识别方法大多采用多层时序网络模型,学习得到表征时序变化的个体行为特征并对其进行聚合形成群体行为特征.但是,在个体特征聚合过程中,以往方法未能有效考虑个体对群体行为贡献程度的差异性,影响识别性能.为此,本文提出一种针对个体行为特征聚合的注意力池化机制,并依此建立了新型群体行为识别模型,以自底向上的方式同时实现个体行为与群体行为分层识别.首先利用卷积神经网络提取视频中人体图像区块的个体静态特征,并将其作为多层递归神经网络时序模型的输入,从而得到个体动态特征.随后通过注意力池化机制对个体特征完成聚合,得到相应的群体行为特征;最后依托个体、群体行为特征同时完成个体行为与群体行为的识别.未验证所提方法的有效性,本文依托广泛使用的The Volleyball Dataset数据集上开展了一系列实验验证.结果显示,本文所提出的模型取得了较好的分类准确率,分类性能优于当前先进模型.
关键词 群体行为识别; 表示学习; 注意力机制; 深度学习; group activity recognition; representation learning; attention mechanism; deep learning;
Ding LI, Wensheng ZHANG. Attentive pooling for group activity recognition. Sci Sin Inform, 2021, 51(3): 399-412, doi: 10.1360/SSI-2020-0235
基于多视角聚类分析的汉字字体审美偏好挖掘
张艳, 谢源, 洪辰, 曲延云, 李睿, 张俊松, 李翠华
中国科学: 信息科学, 2021, 51(3): 383-398
摘要 在神经美学研究中已经证明,中文字体审美偏好的情绪刺激可以通过观察3种偏好(喜欢、不喜欢和中性)之间的事件相关电位(event related potential, ERP)波动获得.本文通过引入一种核化张量奇异值分解的多视角聚类方法分别构建了基于脑电图(electroencephalogram, EEG)和ERP的审美偏好识别模型,通过这些模型首次确认了该结论.本文方法将来自不同频段的数据视为描述中文字体审美偏好的不同视角,通过张量多秩最小化的约束探索所有视角特征的一致性和关联性,并通过之后的聚类获取审美偏好的识别结果.采用多视角无监督聚类方法得到的识别精度达到97.1%.此外,通过输入–扰动关联方法将电极的振幅与不同种类的审美偏好相关联,可视化关键频段组合以及电极之间的关系,分别取出与喜欢、不喜欢、中性最相关的3个电极,包含次相关的6个电极,包含第三相关的9个电极,包含第四相关的12个电极,分别形成4种不同组合的脑电特征.通过比较实验,验证了相对于62个电极信号,上述4种组合方式在字体美学分类上更具有优势,并且最相关的3个电极的组合特征对审美偏好最具判别性.实验结果表明,基于多视角聚类的方法能够解决神经信号与审美偏好的相关分析,并能挖掘出与字体审美偏好最相关的电极.
关键词 中文字体; 审美评价; 计算美学; 事件相关电位; 核化张量奇异值分解; 数据挖掘; Chinese typeface; esthetic evaluation; computational esthetics; event-related potentials; kernelized tensor-SVD; data mining;
Yan ZHANG, Yuan XIE, Chen HONG, et al. Esthetic preference mining of Chinese typefaces using multiview cluster analysis. Sci Sin Inform, 2021, 51(3): 383-398, doi: 10.1360/SSI-2020-0234
基于隐空间约束生成对抗网络的活体检测
陈成伟, 院旺, 陈攀, 丁守鸿, 谢源, 宋海川, 马利庄
中国科学: 信息科学, 2021, 51(3): 367-382
摘要 近年来,人脸识别技术飞速发展,其主要应用于门禁系统和公共安防系统.然而现有的人脸识别系统容易受到仿冒攻击(也称为呈现攻击),例如尝试使用用户的脸部照片、视频或者伪造的3D人脸去攻击人脸识别系统.这些攻击手段给人脸识别系统带来了极具挑战性的安全问题.因此活体检测技术的研究十分重要,其可以使人脸识别系统免于攻击假脸的安全威胁.目前,大部分活体检测的方法将活体检测任务视作有监督的二分类问题,进而努力充分提取真实人脸和攻击人脸的特征,在单个数据集内部训练和测试可以达到很高的准确率,但是在交叉数据集之间训练和测试往往效果不佳.本文将活体检测任务定义为异常检测任务,并基于此来解决之前活体检测方法存在的泛化能力差的问题.因此本文提出了一种新颖的基于隐空间约束的深度对抗网络,它通过半监督学习的方式进行对抗训练,在此过程中模型不仅仅可以获得正常样本在隐空间中的分布,还可以通过一种惩罚的方式对隐空间中正常样本的特征进行约束,这将带来更加有效和鲁棒的活体检测效果.测试过程中,攻击人脸样本将被视作离群的样本,它们相对于正常样例在隐空间中的表达具有更高的重构差.实验表明提出的模型相较于前沿的半监督异常检测方法具备明显的优势,并且在活体检测跨数据集和单数据集内达到了可比的效果或者目前最好的效果.
关键词 对抗网络; 活体检测; 弱监督学习; 异常检测; 人脸仿冒攻击; adversarial networks; live face detection; semi-supervised learning; anomaly detection; face spoofing attacks;
Chengwei CHEN, Wang YUAN, Pan CHEN, et al. Latent regularized generative adversarial network for face spoofing detection. Sci Sin Inform, 2021, 51(3): 367-382, doi: 10.1360/SSI-2020-0236
三维标架场可控去旋方法
方贤忠, 金耀, 黄劲, 鲍虎军
中国科学: 信息科学, 2021, 51(2): 263-278
摘要 六面体网格因其良好的数值性能成为有限元分析等领域中重要的一种离散化方法,而基于标架场导引的重网格化是实现可控六面体网格剖分的重要技术.现有的标架场生成技术由于所获得的标架场往往存在拓扑矛盾,难以运用于纯六面体网格的生成,但较易用于六面体主导混合网格的生成.然而,这种六面体主导网格的质量容易受到标架场旋度的影响.针对这一问题,本文提出了一种三维标架场保向且长度可控去旋方法.该方法通过分析三维向量场的旋度,构造针对四面体网格的离散旋度能量,并将其推广至三维标架场的旋度能量.为保持原标架场方向并控制其长度,引入了表达三维标架场3个子向量场长度伸缩量的标量场,并将新标架场表示为标量场和原标架场的合成,最后通过极小化合成场的旋度得到优化后的标架场.实验结果表明,通过约束标量场的变化范围,能在保持其方向不变的情况下,有效地控制去旋程度;将该标架场运用于已有重网格化方法,可得到方向和密度可控的六面体主导的混合网格.此外,该方法只需求解一个带界约束的二次凸规划问题,鲁棒性强且易于计算.
关键词 三维标架场; 去旋; 长度可控; 六面体主导网格; 3D frame field; curl correction; length-controllable; hexahedral dominant mesh;
Xianzhong FANG, Yao JIN, Jin HUANG, et al. Controllable curl-correction of 3D frame fields. Sci Sin Inform, 2021, 51(2): 263-278, doi: 10.1360/SSI-2019-0277
基于强化学习的舰载机保障作业实时调度方法
李亚飞, 吴庆顺, 徐明亮, 吕培, 姜晓恒, 朱睿杰, 周兵
中国科学: 信息科学, 2021, 51(2): 247-262
摘要 衡量航母作战性能的重要指标是舰载机出动架次率,而影响舰载机出动架次率的关键因素是舰载机保障作业调度效率.舰载机保障作业调度是指在有限时间、空间和资源约束的前提下合理安排舰载机所需保障作业顺序并高效完成舰载机的作业保障.现有基于最优化方法 (动态规划、线性规划等)和启发式方法 (如遗传算法、粒子群等)的求解策略仅适用于保障作业可预知情况下的作业调度,很难满足高动态作战场景下的实时保障作业调度需求.基于此,本文提出了一种新的基于DQN (deep Q-network)的舰载机保障作业实时调度方法,将舰载机保障作业调度问题建模成部分可观测马尔科夫决策过程(partially observable Markov decision processes)问题,利用全局与长期收益对保障作业调度过程进行优化,并通过离线学习和在线调配的学习决策框架进行解决.经过仿真实验验证,该方法能显著提高舰载机保障作业调度效率并满足实时决策环境的需要.
关键词 舰载机; 保障作业; 实时调度; 强化学习; 仿真验证; carrier-borne aircraft; support operations; real-time scheduling; reinforcement learning; simulations;
Yafei LI, Qingshun WU, Mingliang XU, et al. Real-time scheduling for carrier-borne aircraft support operations: a reinforcement learning approach. Sci Sin Inform, 2021, 51(2): 247-262, doi: 10.1360/SSI-2020-0316
基于设备性能的Web3D动态实时光影云渲染系统
刘畅, 刘小军, 贾金原, 徐识溥, 张乾, 黄晨曦, 黄欣
中国科学: 信息科学, 2021, 51(2): 231-246
摘要 本文面向多种硬件平台提出了一套Web3D实时动态光影的协同式渲染系统,该系统把Web前端的硬件性能作为整个云渲染系统中光影渲染任务分配的关键因素.对于Web前端性能较强的硬件设备,系统分配复杂度较高的光影渲染任务给前端,相应的云后端的渲染负担则有所降低;反之,系统则分配复杂度较低的光影渲染任务给前端,相应的云后端承担大部分的渲染任务.在上述机制的引导下,该系统的前后端部署了4类关键的实时光影渲染算法,最终通过对算法运行帧率、算法所在设备的运行效率以及光影渲染结果等多种数据的分析,验证了部署的合理性.
关键词 云渲染; Web3D; 实时绘制; 动态光影; 全局光照; cloud rendering; Web3D; real-time rendering; dynamic lighting and shadow; global illumination;
Chang LIU, Xiaojun LIU, Jinyuan JIA, et al. A Web3D cloud rendering system for dynamic real-time lighting and shadow based on device power. Sci Sin Inform, 2021, 51(2): 231-246, doi: 10.1360/SSI-2020-0334
用于图像增强的仿生自适应忆阻细胞神经网络
郑雅文, 胡小方, 周跃, 罗丽, 段书凯
中国科学: 信息科学, 2020, 50(12): 1850-1866
摘要 细胞神经网络(cellular neural network, CNN)具有简单的局部互联结构和高速并行处理能力,是构造人工视网膜的基础模型,可被应用于机器视觉中图像处理时的图像增强等方面.然而,现有的此类图像增强方法尚存在一些不足,例如,在处理实际复杂图像时,采用固定模板难以取得理想效果;而且,未能模拟人类视觉系统的全局和局部自适应调节特性,缺乏仿生考虑.因此,本文融合自适应三高斯(tri-Gaussian)理论和纳米信息器件忆阻器,提出了一种用于图像增强的新型仿生自适应忆阻细胞神经网络.其中,基于忆阻器的可编程性、非易失性、突触可塑性等优点,构建忆阻细胞神经网络架构.基于神经元感受野三高斯模型,利用高斯核函数和细胞神经网络的图像处理特征,提出对应的仿生自适应图像增强模板设计算法.最后,分别以灰度和彩色图像为例进行了图像增强实验和对比分析,结果表明,提出的仿生自适应忆阻细胞神经网络能够显著提高图像的全局亮度、局部对比度和清晰度.本研究可为细胞神经网络提供自适应模板设计及实现方案,提升细胞神经网络的仿生特性和硬件实现的可行性,并为图像增强等智能图像处理提供新思路.
关键词 细胞神经网络; 图像增强; 自适应三高斯模型; 仿生图像处理; 忆阻器; cellular neural networks(CNN); image enhancement; adaptive tri-Gaussian model; biomimetic image processing; memristors;
Yawen ZHENG, Xiaofang HU, Yue ZHOU, et al. Biomimetic adaptive memristive cellular neural network for image enhancement. Sci Sin Inform, 2020, 50(12): 1850-1866, doi: 10.1360/SSI-2019-0167
全天候自然场景下的人脸佩戴口罩识别技术
张修宝, 林子原, 田万鑫, 王艳, 沈海峰, 叶杰平
中国科学: 信息科学, 2020, 50(7): 1110-1120
摘要 日常生活中,面对经呼吸道传播的传染性疾病或厂矿生产过程中产生的扬尘沙土,人们佩戴口罩进行防护可保护身体健康和生命安全.人脸佩戴口罩的自动化识别可以有效监督人们佩戴口罩,是抑制疾病快速传播和保护身体健康的重要技术手段.对于生活和生产中的口罩佩戴识别的需求,本文提出了基于深度学习的人脸检测和口罩佩戴识别相结合的方法.该方法在人脸检测中利用特征融合金字塔,结合空间和通道注意力学习,以及分割分支进行神经网络弱监督学习.另外针对检测后的人脸子图像,采用图像分类的方法实现快速识别,并加入注意力学习机制,增强模型对口罩区域特征的学习.利用近20万的公开和企业自有数据,并采用数据增强等方法,在全天候自然场景下取得了99.50%的识别准确率.该技术已广泛应用于滴滴出行实际业务中,日均处理百万数量级的请求.该服务已对外开放,关键算法已开源,从而使其发挥更大的应用价值和社会价值.
关键词 口罩佩戴识别; 人脸检测; 人脸属性识别; 特征金字塔; 注意力学习; mask-wearing recognition; face detection; face attribute recognition; feature pyramid; attention;
Xiubao ZHANG, Ziyuan LIN, Wanxin TIAN, et al. Mask-wearing recognition in the wild. Sci Sin Inform, 2020, 50(7): 1110-1120, doi: 10.1360/SSI-2020-0046
基于生成对抗网络的点云形状保结构补全
缪永伟, 刘家宗, 陈佳慧, 舒振宇
中国科学: 信息科学, 2020, 50(5): 675-691
摘要 针对三维点云形状修复补全中难以保持形状精细结构信息的问题,借助于生成对抗网络框架,本文提出了一种自动修复补全三维点云形状的神经网络结构.该网络由生成器和判别器构成.神经网络的生成器采用编码器–解码器结构,以缺失的三维点云形状作为输入,首先通过输入变换和特征变换对齐输入点云数据的采样点位置与特征信息;然后借助权共享多层感知器对各采样点提取局部形状特征并利用最大池化层与多层感知器编码提取出采样点的特征码字;其次将采样点特征码字加上网格坐标数据,解码器使用2个连续的三层感知器折叠操作将网格数据转变成点云形状的缺失补全数据;最后将缺失补全数据与点云输入数据合并,得到完整的三维点云形状.神经网络的判别器则接收真实的完整点云形状数据和生成器生成的完整点云形状数据,并利用与生成器相同的编码器结构判别出点云形状数据的真假并反馈以不断优化生成器,最终使生成器生成足以"以假乱真"的点云形状数据样本.实验表明,针对形状缺失的稠密点云和稀疏点云数据,本文方法在修复补全形状缺失部分的同时能有效保持输入点云形状的精细结构信息.
关键词 生成对抗网络; 编码器–解码器结构; 点云数据; 形状补全; 折叠操作; generative adversarial network(GAN); encoder-decoder structure; point cloud; shape completion; folding operation;
Yongwei MIAO, Jiazong LIU, Jiahui CHEN, et al. Structure-preserving shape completion of 3D point clouds with generative adversarial network. Sci Sin Inform, 2020, 50(5): 675-691, doi: 10.1360/SSI-2019-0096
一种基于时间序列特征的可解释步态识别方法
施沫寒, 王志海
中国科学: 信息科学, 2020, 50(3): 438-460
摘要 步态特征识别是生物特征识别的一种,在大量实际场景中有广泛的应用.目前,基于深度学习的方法在步态识别任务中表现出较好的准确率.但是,在对机器学习的研究中,人们不仅希望得到精确的预测,还希望算法对识别结果进行解释,以便人们理解实际问题中的关键.深度神经网络的黑盒属性使得解释其识别依据非常困难.在已有的步态识别文献中,关注可解释性的研究尚处于空白状态.另外,深度神经网络需要大量数据来学习模型参数,在问题规模较小时难以有效地在未见数据上泛化.本文探索了一种兼具准确性和可解释性的步态识别方法.将步态特征表示为多维时间序列,使用一种基于Shapelet的时间序列分类方法进行步态识别. Shapelet是时间序列中最具有辨别性的子序列,基于Shapelet的时间序列分类方法能够提供较好的可解释性,同时可以提供较高的准确率.我们在CASIA-B数据集上进行了实验,和几种较新的深度学习方法进行了比较.实验表明,本文提出的方法在较小规模的数据集上能够提供与深度神经网络接近的准确率.与此同时,还能详细具体地解释模型的决策依据,即哪些特征在视频哪几帧的表现对某个个体而言最具辨别性.
关键词 步态识别; 时间序列; Shapelet; 随机森林; 可解释性; gait recognition; time series; Shapelet; random forest; interpretability;
Mohan SHI, Zhihai WANG. An interpretable gait recognition method based on time series features. Sci Sin Inform, 2020, 50(3): 438-460, doi: 10.1360/N112018-00326
基于细节增强和平行特征刺激脉冲耦合神经网络的医学图像融合算法
王国芬, 黄永东
中国科学: 信息科学, 2020, 50(2): 239-260
摘要 医学图像融合的目的是将多幅多模态医学图像的信息整合到一幅图像上,此图像有助于临床诊断,帮助医生精确观察细微病变,缩短病人的治疗周期.本文提出了一种新的解剖图像和功能图像的融合算法,选取了局部拉普拉斯滤波(local Laplacianfiltering, LLF)作为融合过程的分解工具,该工具在增强细节的同时保护边缘,保证解剖图像的细节信息不被功能图像的颜色信息遮盖.首先,利用LLF将原图像分解为近似图和一系列细节图.其次,对于近似图,结合区域能量和边缘能量提出一个改进的局部能量取大的融合规则;对于细节图,采用参数自适应的简化脉冲耦合神经网络(parameteradaptive simplified pulse coupled-neural network, PA-SPCNN)模型进行细节图融合,选取改进的拉普拉斯和(novel sum-modified-Laplacian, NSML)与彩色显著特征信息(color saliency feature, CSF)分别作为解剖图像和功能图像所对应的PA-SPCNN模型的外部刺激输入.最后,使用逆LLF变换获得融合图像.仿真实验表明本文所提算法在主观评价和客观评估方面与已有算法相比具有一定优势.
关键词 图像处理; 图像融合; 医学图像处理; 局部拉普拉斯滤波; 脉冲耦合神经网络; 拉普拉斯和; 彩色显著特征; 边缘能量; image processing; image fusion; medical image processing; local Laplacian filtering; pulse-coupledneural-network; novel sum-modified-Laplacian; color saliency feature; edge energy;
Guofen WANG, Yongdong HUANG. Medical-image-fusion algorithm based on a detail-enhanced and pulse-coupled neural-network model stimulated by parallel features. Sci Sin Inform, 2020, 50(2): 239-260, doi: 10.1360/N112018-00295
学习时空一致性相关滤波的视觉跟踪
朱建章, 王栋, 卢湖川
中国科学: 信息科学, 2020, 50(1): 128-150
摘要 判别相关滤波跟踪算法通过对中心目标块(唯一准确正样本)循环移位获取训练集,依赖潜在样本周期延拓假设,使得模型训练和检测可以通过快速傅里叶变换高效完成,然而整个学习过程没有对真正的背景信息进行建模.背景感知相关滤波(BACF)跟踪算法利用一个二进制掩码矩阵通过密集采样的方法获取真正的正、负样本对目标外观进行建模,然而BACF算法在学习相关滤波器时并没有考虑滤波器的时间一致性和空间一致性信息,当目标出现外观突变时,学习到的相关滤波器将会偏向背景而发生漂移.为了解决学习到的相关滤波器适应连续帧之间的外观突变问题,本文在基准BACF算法框架下引入时间一致性约束项和空间一致性约束项,提出了学习时空一致性相关滤波(TSCF)跟踪算法.时间一致性约束项在时间序列意义上起到平滑多通道相关滤波的作用;空间一致性约束项在空间分布意义上平滑多通道相关滤波,使得学习到的相关滤波能量分布更加均匀.本文的TSCF模型有闭式解,采用共轭梯度下降法迭代逼近模型的最优解,且优化过程利用循环矩阵性质转化到傅里叶域快速求解,有效降低计算大型矩阵的代价.本文的TSCF算法跟踪结果在TB100公开数据库上显示,距离精度较基准BACF算法提升了5.5%,成功率曲线图线下面积(AUC)提升了4.3%,纯手工特征跟踪性能在TB100数据库上100个视频的跟踪距离精度达到0.879, AUC为0.664,结果展示本文的TSCF算法在遇到诸如短时间遮挡和面内旋转或面外旋转等挑战性问题时具有一定的鲁棒性和有效性.
关键词 视觉跟踪; 相关滤波; 时空一致性; 正则化; 共轭梯度下降; visual tracking; correlation filter; temporal-spatial consistency; regularization; conjugate gradient descent;
Jianzhang ZHU, Dong WANG, Huchuan LU. Learning temporal-spatial consistency correlation filter for visual tracking. Sci Sin Inform, 2020, 50(1): 128-150, doi: 10.1360/N112018-00232
基于语义特征提取的砂岩薄片图像颗粒分割方法
姜枫, 顾庆, 郝慧珍, 李娜, 胡修棉
中国科学: 信息科学, 2020, 50(1): 109-127
摘要 砂岩薄片鉴定是矿物学和采矿工程中的一个重要步骤,其基础是将砂岩薄片图像包含的矿物颗粒分割到独立区域.不同于一般图像分割问题,砂岩薄片图像中包含大量矿物颗粒,且相邻颗粒之间边界模糊,通用的图像分割方法难以适用.本文利用多角度砂岩薄片图像,使用卷积神经网络和模糊聚类技术,提出一种3阶段颗粒分割方法.第1阶段,将输入的多角度砂岩图像预分割成超像素集合.第2阶段,根据砂岩矿物特点构建卷积神经网络RockNet,先使用带标签的砂岩矿物颗粒图像库训练RockNet,然后将之用于提取超像素语义特征.第3阶段,提出区域合并方法 FCoG,该方法融合多特征用于聚类和合并超像素,并生成最终的矿物颗粒.对采集自多个地区和不同地质年代的砂岩薄片图像数据集进行实验,结果表明本文方法的有效性,其性能明显优于其他分割方法.
关键词 砂岩薄片图像; 图像分割; 神经网络; 模糊聚类; 特征提取; sandstone thin section images; image segmentation; neural networks; fuzzy clustering; feature extraction;
Feng JIANG, Qing GU, Huizhen HAO, et al. Grain segmentation of sandstone thin section images based on semantic feature extraction. Sci Sin Inform, 2020, 50(1): 109-127, doi: 10.1360/N112018-00089
信息系统在复杂应用中的科学与技术专刊
基于深度神经网络的SAR建筑目标三维重建方法
陈健堃, 彭凌霄, 仇晓兰, 丁赤飚, 吴一戎
中国科学: 信息科学, 2019, 49(12): 1606-1625
摘要 建筑物三维重建在城市规划、灾害监测、智慧城市等领域有重要应用,是计算机视觉、摄影测量、遥感等领域研究的重要课题.由于SAR成像机理的特殊性和复杂性,基于SAR图像的建筑物三维重建难度很大,现有方法的适用性和自动化程度都亟待提升.本文构建了基于深度学习与雷达成像机理结合的SAR图像建筑物检测及三维重建整体框架,并提出了基于耦合等效复数卷积神经网络的SAR图像建筑侧立面检测方法,基于RaySAR的建模仿真及点云生成方法,以及基于3D生成网络的SAR建筑物三维重建方法,利用TerraSAR-X与GF-3高分辨率SAR图像进行实验,得到了较好的三维重建结果.本文方法为SAR图像目标三维重建提供了新的技术途径,是SAR目标三维重建的有益尝试.
关键词 SAR; 深度学习; 语义分割; 点云生成; 建筑物检测; 三维重建; SAR; deep learning; semantic segmentation; point cloud generation; building detection; 3D reconstruction;
Jiankun CHEN, Lingxiao PENG, Xiaolan QIU, et al. A 3D building reconstruction method for SAR images based on deep neural network. Sci Sin Inform, 2019, 49(12): 1606-1625, doi: 10.1360/SSI-2019-0100
系数多状态关联的图像NSST-HMT模型
王相海, 赵晓阳, 朱毅欢, 宋若曦, 宋传鸣
中国科学: 信息科学, 2019, 49(6): 708-725
摘要 近年来,非下采样Shearlet变换(non-subsampled shearlet transform, NSST)因其具有各向异性,多方向捕捉性的同时,还兼具平移不变性,从而在图像恢复过程中发挥着重要的稳定作用.本文首先对图像NSST子带内系数关系、子带间系数的"父子关系"和"兄弟关系" 3方面进行分析,获得子带内系数具有稀疏性、子带间"父子关系"和"兄弟关系"系数均具有聚集性和传递性的结论.在此基础上提出一种基于系数多状态关联的隐Markov树模型(multi-state non-subsampled shearlet transform hidden Markov tree, M-NSST-HMT),该模型通过将NSST子带间系数的"父子关系"和"兄弟关系"作为共同指导子带间系数传递的状态来估计重构系数,并利用两种状态关联的互信息来对重构系数进行整合.最后将所提出的模型应用于图像去噪并取得良好的去噪效果,结果表明所提出的模型较传统HMT模型能够更好地揭示图像NSST变换后子带内和子带间系数的关系,并提高系数的预测准确性.
关键词 非下采样剪切波变换; 混合Gauss模型; 隐Markov树模型; 系数多状态关联; 图像去噪; 支持向量机; non-subsampled shearlet transform; Gaussian mixture model; hidden Markov tree model; multi-state coefficients association; image denoising; support vector machine;
Xianghai WANG, Xiaoyang ZHAO, Yihuan ZHU, et al. Image NSST-HMT model with associated multi-state coefficients. Sci Sin Inform, 2019, 49(6): 708-725, doi: 10.1360/N112017-00293
七次PH曲线G2[C1] Hermite插值方法
李毓君, 方林聪, 汪国昭
中国科学: 信息科学, 2019, 49(6): 698-707
摘要 本文讨论七次PH (Pythagorean hodograph)曲线的G~2[C~1] Hermite插值问题. PH曲线是具有有理形式的等距线的一类多项式参数曲线,其弧长可精确计算,因此在CAD (computer aided design)中有着广泛的应用.本文采用平面参数曲线的复数表示形式,根据导矢曲线因式分解得到的多项式因子次数不同,将七次PH曲线分为3类.第1类七次PH曲线都是正则曲线,且其G~2[C~1]Hermite插值方法已经被研究.本文研究另外两类七次PH曲线的构造方法,并指出对于给定的初始条件,存在不超过6条的偶数条第2类七次PH曲线;而第3类七次PH曲线的存在性不仅对初始条件有约束,而且可以通过用户指定一个具有几何意义的实参进行交互构造.本文最后通过实例构造了这两类曲线对六分之一圆弧曲线的逼近.
关键词 Bézier曲线; 等距曲线; 七次; 几何连续; Hermite插值; Bézier curve; offset curve; septic; continuous; Hermite interpolation;
Yujun LI, Lincong FANG, Guozhao WANG. G2[C1] Hermite interpolation using septic PH curves. Sci Sin Inform, 2019, 49(6): 698-707, doi: 10.1360/N112017-00229
基于编解码网络的多姿态人脸图像正面化方法
徐海月, 姚乃明, 彭晓兰, 陈辉, 王宏安
中国科学: 信息科学, 2019, 49(4): 450-463
摘要 多姿态人脸图像正面化可以缓解头部姿态变化对人脸分析任务的影响.以往直接从多姿态人脸图像合成正面人脸图像的方法存在细节特征缺失的问题.针对这一问题,本文提出一种基于编解码网络的多姿态人脸图像正面化方法——多任务卷积编解码网络(MCEDN).该方法引入正面基础特征网络合成正面人脸基础特征,并在此基础上融合编码网络提取的多姿态人脸局部特征进行细节补偿,最终合成更加清晰的正面人脸图像.利用多任务学习机制建立端到端模型,统一局部特征提取、正面基础特征解析、正面图像合成3个模块,通过共享参数提升整个模型的效果.与已有方法对比, MCEDN在多个数据集上都可以合成结构稳定、细节清晰的正面人脸图像.我们直接使用合成的正面人脸图像进行人脸识别和表情识别,识别准确率达到先进水平,这表明MCEDN可以有效保留人脸细节特征,支持人脸分析任务.
关键词 人脸正面化; 卷积神经网络; 编解码网络; 多任务学习; 人脸识别; 表情识别; face frontalization; convolutional neural network; encoder-decoder network; multitask learning; face recognition; facial expression recognition;
Haiyue XU, Naiming YAO, Xiaolan PENG, et al. A multi-pose face frontalization method based on encoder-decoder network. Sci Sin Inform, 2019, 49(4): 450-463, doi: 10.1360/N112018-00060
基于多视角卷积神经网络的三维模型分类方法
王鹏宇, 水盼盼, 余锋根, 甘渊, 刘琨, 张岩, 孙正兴
中国科学: 信息科学, 2019, 49(4): 436-449
摘要 近些年来,卷积神经网络框架在二维图像的语义分割、分类、检索等领域取得了非常好的效果.但是由于三维模型结构的复杂性与不规律性,卷积神经网络的卷积和池化操作却无法直接应用在三维模型上.为了发挥深度学习框架在二维图像分析领域积累的技术优势,本文采用基于多视角投影的方法来完成三维模型分类的任务.然而现有的基于多视角投影的三维模型分类方法大多采用固定视角,所采集到的多视角下模型投影渲染图中存在大量的信息冗余,对结果造成一定的干扰.本文提出了一种新型的多视角卷积神经网络框架,在网络训练过程中自动判别每个视角的贡献度,舍弃冗余视角的信息,从而提取出最能表征模型类别的特征,提高了网络的鲁棒性.此外,本文将基于视点熵的最佳视角选择方法引入三维模型分类领域,相比于固定视角方法,本文方法能更多地保留模型的细节信息,同时不需要模型的朝向对齐.通过在ModelNet10和ModelNet40数据集上的实验,验证了将基于视点熵的视角选择方法应用于三维模型分类,以及本文提出的基于视角判别的多视角信息融合方法的合理性和优越性.实验结果表明,本文方法的分类准确性也优于现有的基于固定多视角投影的三维模型分类方法.
关键词 三维模型; 视角选择; 视点熵; 卷积神经网络; 深度学习; 3D model; viewpoint selection; viewpoint entropy; convolutional neural network; deep learning;
Pengyu WANG, Panpan SHUI, Fenggen YU, et al. 3D shape classification based on convolutional neural networks fusing multi-view information. Sci Sin Inform, 2019, 49(4): 436-449, doi: 10.1360/N112018-00254
基于力位协同控制的注意力状态客观监测方法
王丽君, 王党校, 郑一磊, 张玉茹
中国科学: 信息科学, 2019, 49(4): 422-435
摘要 高难度精细触觉交互任务依赖于注意资源的高强度激活,研究触觉通道和注意力状态的关系不仅有利于理解人类感知与认知的交互机制,对于触觉模态脑机交互系统的设计也具有重要应用价值.本文构建了融合多点接触力反馈和沉浸式视觉反馈的虚拟现实交互环境,以高精度力位协同控制任务为对象提出了注意力状态的客观监测方法.将力、位置两个模态的容许误差作为任务难度的调控变量,测量了用户在每个模态内的操作绩效.结合用户主观评估数据,证实了该任务可以有效激活注意力资源,并能够作为注意力"示波器",实现高时间分辨率的注意力水平和注意力焦点的客观监测.本文实验结果表明,基于触觉通道的力位协同控制任务能够实现注意力状态的客观测量,为后续构建基于神经生理信号的注意力机制研究提供了行为学基准.
关键词 虚拟现实; 触觉交互; 力位协同控制; 注意力状态; virtual reality; haptic interaction; collaborative force-position control; attentional states;
Lijun WANG, Dangxiao WANG, Yilei ZHENG, et al. Objective monitoring of attentional states based on collaborative force-position control tasks. Sci Sin Inform, 2019, 49(4): 422-435, doi: 10.1360/N112018-00286
轻量级Web3D地铁火灾逃生在线规划关键技术
艾子豪, 胡永豪, 闫丰亭, 张惠娟, 王冬青, 青胜蓝, 朱合华, 贾金原
中国科学: 信息科学, 2019, 49(4): 405-421
摘要 基于移动互联网浏览器实现地铁站逃生模拟训练是一种高效率的火灾逃生训练方式.然而,由于地铁站规模庞大且火灾情景复杂,在线逃生路径规划仿真平台模型因数据规模大,其在基于有限网络带宽传输以及渲染能力较弱的浏览器上运行时,速度将非常缓慢甚至无法运行.为解决此问题,本文针对轻量级Web3D地铁火灾逃生路径在线规划平台实时在线关键技术进行了研究.首先,针对大规模地铁站BIM静态场景数据,通过语义和体素化成分检验的轻量化方法对其进行了轻量化处理.同时,针对大规模虚拟化身的在线渲染,基于数据拆分并灵活组合思想,通过对虚拟化身的几何体信息和虚拟化身的动画数据进行数据管理,实现了大规模虚拟化身在线渲染的轻量化处理,进而实现了轻量级人群可视化;其次,针对动态烟气数据,提出了基于烟气冗余消除和归一化的轻量化处理方法,并基于精灵纹理粒子系统构建了轻量级烟气场景,实现了轻量级烟气可视化;最后,基于上述一系列轻量化处理的Web3D地铁场景中的逃生路径规划问题研究,本文提出了基于虚拟足迹聚类的蚁群优化算法eAACO (evacuation based on adaptive ant colony optimization),该算法通过VR设备获取真实人群逃生路径,实现对路径数据筛选和聚类以形成骨干路径,并与蚁群算法(ACO,ant colony optimization)相结合,设计了逃生路径规划的最优方案.实验表明,上述关键技术的实现较好解决了大规模地铁站火灾逃生路径规划Web3D模拟平台的实时在线处理问题.
关键词 Web3D; 地铁站BIM; 轻量级烟气可视化; 轻量级人群可视化; 虚拟足迹聚类; 火灾逃生路径规划; 蚁群优化算法; Web3D; metro BIM; lightweight smoking visualization; lightweight crowding visualization; virtual traces clustering; online planning of fire evacuation path; ant colony optimization;
Zihao AI, Yonghao HU, Fengting YAN, et al. Key technology of lightweight Web3D online planning of metro fire escape. Sci Sin Inform, 2019, 49(4): 405-421, doi: 10.1360/N112018-00275
非物质文化遗产数字化专刊
面向民族动态艺术数字化的拉班舞谱自动生成
王嘉骥, 苗振江, 张雪艳, 张强
中国科学: 信息科学, 2019, 49(2): 229-244
摘要 拉班舞谱是一种用于记录人体动作的符号记录体系,它是保护、继承和传播民族民间舞蹈及其他动作艺术的有力工具.目前,拉班舞谱的获取主要依靠专业人员手工记录,效率较低.本文基于三维人体运动捕捉数据,通过识别与拉班符号相对应的元素动作,提出了一种自动生成拉班舞谱的方法.方法的主要部分包括运动分割和元素动作分析.在运动分割中,利用速度阈值方法将人体运动捕捉数据分割成与舞谱符号对应的元素动作片段.然后,将动作片段与拉班舞谱的节奏相匹配,从而确保生成的舞谱符号更加规范和准确.在元素动作分析中,拉班舞谱将动作区分为支撑动作和非支撑动作,考虑到两类动作性质不同,因此本文采用两种方法分别对支撑与非支撑动作进行有针对性的分析.实验表明,本文的方法实现了将运动捕捉数据表示的舞蹈动作转换为数字化的拉班舞谱,并且自动生成的效率远高于手工记录.所以该方法可以快速记录濒临失传的民族舞蹈,为保护和传承动作类非物质文化遗产做贡献.
关键词 运动捕捉; 拉班舞谱; 运动分割; 元素动作分析; motion capture; Labanotation; motion segmentation; unit movement analysis;
Jiaji WANG, Zhenjiang MIAO, Xueyan ZHANG, et al. Automatic generation of Labanotation for national dynamic art digitalization. Sci Sin Inform, 2019, 49(2): 229-244, doi: 10.1360/N112018-00204
非物质文化遗产数字化专刊
用线描图生成唐卡浮雕
夏梦, 张荣, 彭韧, 于金辉
中国科学: 信息科学, 2019, 49(2): 216-228
摘要 与基于三维模型和照片生成浮雕的技术相比,黑白线描图中没有物体的三维信息,因此用黑白线描图辅助生成浮雕面临新的研究挑战.本文面向非物质文化遗产唐卡,提出一个用黑白线描图生成唐卡浮雕的方法.本文主要贡献是用物体区域的灰度控制图以及边界种子作为约束求解Poisson方程得到物体浮雕表面高度.具体将浮雕模型分为低频、中频和高频3个分量.低频分量指线描图中人物躯干以及四肢在衣服覆盖下形成的隆起趋势,中频分量指线描图中人物的四肢局部隆起,这两部分的高度用距离变换约束的Poisson扩散获得.高频分量指物体的细节,例如人的眉毛、背景中的云、山、花瓣,以及饰品等,它们的高度通过边界约束的Poisson扩散生成.最后将浮雕低频分量、中频分量和高频分量的高度图叠加并将其转换成面片模型获得完整浮雕模型.文中给出的图例验证了我们方法的有效性.
关键词 非物质文化遗产; 唐卡; 线描图; Poisson扩散; 浮雕; intangible cultural heritage; Thangka; line drawing; Poisson equation; relief;
Meng XIA, Rong ZHANG, Ren PENG, et al. Generation of Thangka relief from line drawings. Sci Sin Inform, 2019, 49(2): 216-228, doi: 10.1360/N112018-00198
非物质文化遗产数字化专刊
基于深度学习的少数民族绘画情感分析方法
张浩, 徐丹
中国科学: 信息科学, 2019, 49(2): 204-215
摘要 图像不仅可以传达丰富的语义信息进而直接表达人的情感,也可以在情感层面影响他人,艺术作品更是如此.人们对于不同的视觉刺激有着不同的情绪反应,所以理解图片所包含的情感是非常重要的.本文通过微调现有的卷积神经网络模型,以少数民族绘画图像数据为研究对象,分析了艺术绘画的色相、亮度、饱和度,以及对比度对神经网络模型情感分类的影响,并在公共数据集Twitter image dataset上取得了超过目前先进水平3.4%的精度提升.最后,本文提出了一种相关任务的预训练策略,对少数民族绘画的情感分类任务有明显的提升,并通过可视化结构对实验结果进行了分析.
关键词 少数民族绘画; 图像情感; 卷积神经网络; 微调; 可视化; ethnic painting; image emotion; convolutional neural network; ?ne-tuning; visualization;
Hao ZHANG, Dan XU. Ethnic painting analysis based on deep learning. Sci Sin Inform, 2019, 49(2): 204-215, doi: 10.1360/N112018-00249
非物质文化遗产数字化专刊
基于多层次块匹配的民族图案分割协同优化方法
陈佳舟, 郑佳, 卢书芳, 缪永伟, 钟凡
中国科学: 信息科学, 2019, 49(2): 188-203
摘要 民族文化图案的分割是数字化分析民族文化的关键步骤之一.现有的图像分割方法虽然能够较好地分割自然图像,但分割民族文化图案时依然存在着难以保持主要结构和依赖大量手动交互等问题.本文提出一种基于多层次块匹配的民族图案分割协同优化方法.首先,充分利用民族文化图案的重复性特点,通过全局块匹配自动检测多个相似目标图案;接着,通过局部块匹配估计图案之间的相对朝向,再利用带约束的块匹配建立准确的稠密对应;最后,构建分割图元之间的协同优化模型,获得保持结构特征的分割结果.本文方法能够将相似图案自动分割为相互关联的细节图元,不仅交互少、精度高,还能改善矢量化等民族文化图案数字化分析的质量,大量的实验证明了其有效性.
关键词 民族图案; 图像分割; 协同优化; 块匹配; 矢量化; ethnic pattern; image segmentation; co-optimization; patch match; vectorization;
Jiazhou CHEN, Jia ZHENG, Shufang LU, et al. Co-optimization of ethnic-pattern segmentation based on hierarchical patch matching. Sci Sin Inform, 2019, 49(2): 188-203, doi: 10.1360/N112018-00205
非物质文化遗产数字化专刊
基于字典学习的民族文化图案语义标注
赵海英, 陈洪, 贾耕云, 郑桥, 王绍杰
中国科学: 信息科学, 2019, 49(2): 172-187
摘要 民族文化图案是中华民族宝贵财富,对民族文化图案进行语义标注与分析,是挖掘其文化价值,进行再创作与应用的基础.本文以此为研究对象,在多分类字典学习的基础上,提出了一种多标签字典学习标注算法SCMIDL.算法结合字典不相关性与系数相似性,有效提高了多标签标注性能,实现了民族文化图案的自动标注.在收集并构建的三类民族文化图案数据集进行多标签语义标注实验,实验结果验证了算法的有效性.
关键词 民族文化图案; 字典学习; 多标签; 图像标注; 相关性; national cultural pattern; dictionary learning; multi label; image annotation; correlation;
Haiying ZHAO, Hong CHEN, Gengyun JIA, et al. Semantic annotation of national cultural patterns based on dictionary learning. Sci Sin Inform, 2019, 49(2): 172-187, doi: 10.1360/N112018-00203
非物质文化遗产数字化专刊
蜡染冰纹生成与染色模拟
喻扬涛, 徐丹, 钱文华
中国科学: 信息科学, 2019, 49(2): 159-171
摘要 本文针对蜡染冰纹和蜡染布料染色两个关键工作进行模拟.使用FIT(?ood identity transform)算法,使模拟具有一定实时性;提出复合交点距离模拟交点加粗效果;使用形态修正、扰动等方法改善冰纹形态及视觉效果.不考虑布料结构,基于乘性模型,尝试多色染色模拟.选择平织纹棉布料,建立布料模型,建立扩散微分方程,对蜡染图案及冰纹进行单色染色模拟.在染色中使用椭圆模型并引入Perlin噪声,有效模拟了晕染现象.实验表明,本文方法能够模拟手工蜡染作品的基本特征.
关键词 蜡染; 距离变换; Fick第二定律; 扩散微分方程; Perlin噪声; batik; distance transform; Fick's second law; diffusion differential equation; Perlin noise;
Yangtao YU, Dan XU, Wenhua QIAN. Simulation of batik cracks and cloth dying. Sci Sin Inform, 2019, 49(2): 159-171, doi: 10.1360/N112018-00212
光学影像序列中基于多视角聚类的群组行为分析
李学龙, 陈穆林, 王琦
中国科学: 信息科学, 2018, 48(9): 1227-1241
摘要 群组行为分析是光学影像序列分析中的一项重要课题,在近年来引起了人工智能领域研究人员的广泛关注.与行人个体相比,群组能提供更高层的语义表示,为分析人群运动模式提供基础.本文将人群影像序列中的影像块作为研究对象,提出了一种基于多视角聚类的群组行为分析方法,对运动模式不同的群组进行区分,主要研究内容有:(1)提出了基于特征点的影像块构图方法,从交互关系、空间位置、运动方向分布,以及运动规律等方面衡量影像块之间的关系;(2)提出了一种多视角聚类方法,通过融合多种特征对每个影像块分配类标签,并引入图多样性正则项以避免特征冗余;(3)提出了一种类合并方法,根据类内特征点的运动方向和类中心位置坐标,对关联度较高的类别进行合并,自动确定最终群组数目.CUHK人群数据集上的实验结果证明了该方法能够准确划分出影像数据中的群组.另外,与现有方法相比,本文提出的多视角聚类方法也在不同数据集上取得了较好的实验结果.
关键词 人群分析; 群组行为分析; 聚类算法; 图聚类; 多视角聚类; crowd analysis; group behavior analysis; clustering; graph clustering; multiview clustering;
Xuelong LI, Mulin CHEN, Qi WANG. Multiview-based group behavior analysis in optical image sequence. Sci Sin Inform, 2018, 48(9): 1227-1241, doi: 10.1360/N112017-00284
弱监督深层神经网络遥感图像目标检测模型
周明非, 汪西莉
中国科学: 信息科学, 2018, 48(8): 1022-1034
摘要 本文提出了一种遥感图像目标检测框架,克服了遥感图像中由于目标较小且背景复杂造成的目标检测任务中的困难.所提框架包含两种深层神经网络模型,分别是全卷积网络模型和卷积神经网络模型.首先,使用全卷积网络提取遥感图像中可能存在待检测目标的候选区域,避免了对图像的穷举搜索.其次,使用深层卷积神经网络对候选区域分类,通过提取高层特征提高分类正确率.然后,提出了新的遥感图像目标检测数据集,模型的训练全部使用图像级的标签,提出简化弱监督训练方法解决遥感图像目标检测领域目标级标签缺乏的问题.最后,提出一种候选框融合算法,合并重叠候选框的同时调整候选框的位置.提出的模型在本文所提数据集satellite aircrafts dataset和公开数据集aircrafts dataset上进行了测试.实验结果表明,提出的目标检测框架和其他使用深层神经网络的框架相比提高了目标检测的正确率,并具有更高的检测效率.
关键词 遥感图像; 目标检测; 卷积神经网络; 全卷积网络; 弱监督训练; remote sensing image; object detection; convolutional neural networks; fully convolutional networks; weakly supervised training;
Mingfei ZHOU, Xili WANG. Object detection models of remote sensing images using deep neural networks with weakly supervised training method. Sci Sin Inform, 2018, 48(8): 1022-1034, doi: 10.1360/N112017-00208
基于离散Tchebichef变换和聚焦评价的多聚焦图像融合方法
周乐, 肖斌, 史文明, 李伟生
中国科学: 信息科学, 2018, 48(8): 1000-1021
摘要 基于变换技术的图像融合是多聚焦图像融合中常采用的方法,融合效果明显,并具有较强的抗噪能力,但时间复杂度普遍较高.本文提出了一种基于离散Tchebichef变换和聚焦评价的多聚焦图像融合方法,根据离散Tchebichef多项式变换和相关分析(correlation)之间的联系,利用少量低阶离散Tchebichef多项式变换系数得到图像块的聚焦评价,然后对输入的多聚焦图像按聚焦评价最大原则进行融合.实验结果表明,该方法在保证融合效果的同时,有效地降低了融合时间,并对噪声有较强的鲁棒性.
关键词 多聚焦图像融合; 离散Tchebichef变换; 聚焦评价; 相关分析; 正交变换; multi-focus image fusion; discrete Tchebichef transform; focus measure; correlation; orthogonal transform;
Le ZHOU, Bin XIAO, Wenming SHI, et al. Multi-focus image fusion method based on discrete Tchebichef transform and focus measure. Sci Sin Inform, 2018, 48(8): 1000-1021, doi: 10.1360/N112017-00085
中国虚拟现实技术新进展专题
面向手机网页的大规模WebBIM场景轻量级实时漫游算法
刘小军, 贾金原
中国科学: 信息科学, 2018, 48(3): 274-292
摘要 当今,使用手机网页来访问大规模建筑环境逐渐被人们所追求.BIM(building information modeling)是新一代智能建造的核心技术.本文以其主流格式IFC(industry foundation classes)作为输入数据格式,提出一套面向手机网页的大规模Web BIM场景实时漫游算法.与图形学领域的可视化程序相比,该方法不只注重可视化渲染时的面片级处理,更是在遵从建筑语义的前提下,以建筑构件为单位,对大规模Web BIM场景进行轻量化处理.方法主要从构件实例冗余、构件及空间混合索引、多粒度数据动态装/卸载策略3方面对场景数据量、组织结构、动态数据管理进行优化,并集成到原型系统.实验表明本文方法的去冗比例达70%左右,原型系统的FPS能保持在30左右,内存损耗约400 MB,能较稳定、流畅地在手机网页上进行大规模Web BIM场景的实时漫游.
关键词 手机Web3D; BIM/IFC; 轻量化处理; 建筑空间分析; 索引结构; mobile web3D; BIM/IFC; lightweight; building space analysis; index structure;
Xiaojun LIU, Jinyuan JIA. Mobile web-based lightweight and real-time roaming algorithm for large-scale WebBIM scenes. Sci Sin Inform, 2018, 48(3): 274-292, doi: 10.1360/N112017-00240
中国虚拟现实技术新进展专题
一种鱼眼视频全景拼接中的亮度补偿算法
黎吉国, 王悦, 张新峰, 马思伟
中国科学: 信息科学, 2018, 48(3): 261-273
摘要 随着鱼眼相机逐渐成为全景视频的主要采集设备,面向鱼眼图像的高效全景拼接技术也得到越来越多的关注.为了解决镜头间亮度差异造成的拼接视频质量下降的问题,本文提出了一种基于非均匀采样直方图的亮度补偿算法.该算法根据全景图像在不同纬度空间采样率变化的特点对相邻图像的重叠区域进行非均匀采样,构成统计直方图,通过直方图匹配实现图像间的亮度补偿.此外,考虑到图像亮度分布对拼接图像质量的影响,本文根据重叠区域图像亮度直方图提出了一种新的自适应基准图像选择方法,基于该方法得到的基准图像可以有效提高全景视频的质量,该方法充分考虑了鱼眼镜头的畸变特性,不要求拼接的图像之间精确配准,能够适应不同的光照条件.实验表明,本文提出的算法在保证全景视频质量的同时,有效地降低了亮度补偿的复杂度,从而可以应用于基于鱼眼镜头的全景实时视频拼接系统.
关键词 图像处理; 虚拟现实; 直方图匹配; 鱼眼镜头; 视频拼接; image processing; virtual reality; histogram matching; fisheye lens; video stitching;
Jiguo LI, Yue WANG, Xinfeng ZHANG, et al. A luminance compensation method for fisheye video panorama stitching. Sci Sin Inform, 2018, 48(3): 261-273, doi: 10.1360/N112017-00243
中国虚拟现实技术新进展专题
基于深度相机的三维人脸迁移
陆炎, 张和东, 刘利刚
中国科学: 信息科学, 2018, 48(3): 248-260
摘要 本文提出一套具有普适性、高效性的三维人脸迁移系统,能够简单、快速地实现带有纹理的三维网格角色模型之间的面部迁移.主要特点是对大部分三维角色均有很好的迁移效果.使用网格Laplace进行迁移面部的几何变换和变形保证几何细节的相似性,使用Poisson图像融合与色差优化技术结合的方法保证面部纹理色调的一致性和平滑过渡.配合人脸迁移系统搭建一套基于深度相机的自动人脸三维扫描系统,可自动快速重建出带有高清纹理贴图、较规整的三维人脸网格.较之前的工作,主要贡献是将人脸迁移对象从二维图像提升到三维模型,并且两个系统无缝衔接,形成了一套自动化程度很高的三维人脸迁移应用.
关键词 人脸迁移; 人脸扫描; 深度相机; 网格Laplace; 纹理融合; face transplanting; face scanning; depth camera; mesh Laplace; texture blending;
Yan LU, Hedong ZHANG, Ligang LIU. 3D human face transplanting via depth camera. Sci Sin Inform, 2018, 48(3): 248-260, doi: 10.1360/N112017-00252
中国虚拟现实技术新进展专题
结合影子障碍物和ORCA模型的人群仿真方法
何高奇, 江东旭, 金祎, 陈琪, 卢兴见, 徐明亮
中国科学: 信息科学, 2018, 48(3): 233-247
摘要 人群仿真已经成为疏散演练、安全监控等重要应用领域的关键支撑技术,但是复杂的个体心理、个性特征,以及个体间的相互影响对人群仿真的真实感提出了挑战.本文从用户的安全心理特征和运动速度特征出发,研究个体在拐角处的运动轨迹和避碰行为的真实感.首先,将影子障碍物模型分别转化为ORCA(optimal reciprocal collision avoidance)半平面和期望速度,分别提出了两种影子障碍物和ORCA模型的结合方法.然后,通过提出影子障碍物的手动生成方法,处理任意角度的拐角以及一些非封闭墙面的情况.基于上述方法,融合行为模拟和物理模拟技术,提出基于速度的人群仿真框架,并对复杂场景以及大规模人群进行实验分析.最后,将上述方法应用在地铁站环境的复杂场景,并采用Unity3D引擎进行真实感渲染,在仿真效果和计算效率两方面与现有的社会力模型进行比较.实验结果表明,本文提出的结合影子障碍物和ORCA模型的人群仿真方法计算效率高、真实感强,具有较好的应用前景.
关键词 人群仿真; 影子障碍物模型; ORCA模型; Unity3D; 真实感渲染; behavior simulation; shadow obstacle model; ORCA model; Unity3D; scene realistic rendering;
Gaoqi HE, Dongxu JIANG, Yi JIN, et al. Crowd behavior simulation based on shadow obstacle and ORCA models. Sci Sin Inform, 2018, 48(3): 233-247, doi: 10.1360/N112017-00253
深度相对度量学习的视觉跟踪
郭文, 游思思, 高君宇, 杨小汕, 张天柱, 徐常胜
中国科学: 信息科学, 2018, 48(1): 60-78
摘要 传统的基于检测的跟踪方法虽然具有较好的鲁棒性,但是这种直接将目标与背景简单分类的方式不能合理地考虑跟踪目标与背景的结构相对关系,而这种相对结构判别性信息的缺乏使得跟踪算法极易发生跟踪漂移,为了缓解这种问题,本文提出了一个基于深度相对度量学习的视觉跟踪方法.利用一个对称且权值共享的深度卷积神经网络构建深度相对度量学习模型,通过这个模型来挖掘跟踪目标在大尺度的图像块里的结构相对关系,然后在Bayes跟踪框架下利用这种相对度量最大值确定跟踪目标,整个跟踪算法简洁有效.通过在跟踪的基准视频序列库上的实验结果验证了本文算法在跟踪精度和跟踪成功率上的高性能.
关键词 相对属性; 度量学习; 卷积神经网络; 视觉跟踪; relative attribute; metric learning; convolutional neural network(CNN); visual tracking;
Wen GUO, Sisi YOU, Junyu GAO, et al. Deep relative metric learning for visual tracking. Sci Sin Inform, 2018, 48(1): 60-78, doi: 10.1360/N112017-00124
一类五次OR曲线的构造方法
方林聪, 汪国昭
中国科学: 信息科学, 2017, 47(12): 1694-1704
一种基于分层复杂性度量的有效的形状图像检索方法
王斌
中国科学: 信息科学, 2017, 47(12): 1674-1693
基于DL1图和KNN图叠加图的高光谱图像半监督分类算法
王君言, 张春梅, 张云斌, 刘瑶瑶, 王晓峰, 李丹, 张少敏, 白静
中国科学: 信息科学, 2017, 47(12): 1662-1673
面向用户体验的透镜式裸眼3D设计与评估
杨文超, 吴亚东, 蒋宏宇, 赵思蕊
中国科学: 信息科学, 2017, 47(10): 1381-1394
基于反射率的多尺度水面重建方法
沈亮, 王昱哲, 张娟, 朱登明, 石敏
中国科学: 信息科学, 2017, 47(10): 1369-1380
基于改进忆阻细胞神经网络的彩色图像边缘提取
杨婷, 段书凯, 王丽丹, 董哲康, 胡小方
中国科学: 信息科学, 2017, 47(7): 863-877
基于三值光学计算机的并行快速Fourier算法实现
彭俊杰, 魏鑫燏, 张晓峰, 沈云付, 付友谊
中国科学: 信息科学, 2017, 47(7): 846-862
一种鲁棒的三维点云骨架提取方法
王晓洁, 周元峰, 潘晓, 张彩明
中国科学: 信息科学, 2017, 47(7): 832-845
P3P问题多解现象的普遍性
王波, 胡浩, 张彩霞, 许华荣
中国科学: 信息科学, 2017, 47(4): 482-491
中国图形学新进展专题
考虑笔画和拓扑结构的字形美化方法
戴庆辉, 张俊松
中国科学: 信息科学, 2017, 47(4): 468-481
中国图形学新进展专题
基于几何矩采样的车道检测算法
宋锐, 陈辉, 肖志光, 许岩岩, Reinhard KLETTE
中国科学: 信息科学, 2017, 47(4): 455-467
中国图形学新进展专题
基于采样半径优化的最大化Poisson圆盘采样
全卫泽, 郭建伟, 张义宽, 孟维亮, 张晓鹏, 严冬明
中国科学: 信息科学, 2017, 47(4): 442-454
中国图形学新进展专题
基于平面ARAP++方法的球面参数化算法
王钊, 张洁琳, 罗钟铉
中国科学: 信息科学, 2017, 47(4): 428-441
中国图形学新进展专题
曲面缺陷的自动检测算法
石泽云, 李全, 鲍虎军, 黄劲
中国科学: 信息科学, 2017, 47(4): 416-427
中国图形学新进展专题
基于L0范数最小化的噪声数据可展曲面重建
伯彭波, 王峥, 张彩明, 郑玉健
中国科学: 信息科学, 2017, 47(4): 401-415
虚拟现实纵览专刊
一种兼容传统电影和虚拟现实互动电影的新型影院技术ARMAX
游志胜, 刘艳丽, 黄戈
中国科学: 信息科学, 2016, 46(12): 1762-1768
虚拟现实纵览专刊
面向大尺度场景的单目同时定位与地图构建
刘浩敏, 章国锋, 鲍虎军
中国科学: 信息科学, 2016, 46(12): 1748-1761
基于轨迹基的三维非刚体线性重建方法
刘侍刚, 彭亚丽, 雷涛, 刘中华, 汪西莉
中国科学: 信息科学, 2016, 46(7): 883-898
基于无标度先验的图模型结构学习
郭骁, 张海, 吴奖伦
中国科学: 信息科学, 2016, 46(7): 870-882
从单幅图像学习场景深度信息固有的歧义性
何雷, 董秋雷, 胡占义
中国科学: 信息科学, 2016, 46(7): 811-818
基于多方向差分的重采样取证技术
彭安杰, 曾辉, 康显桂
中国科学: 信息科学, 2016, 46(5): 627-642
理论计算机科学专题
Paw图-边删除问题的线性顶点核心化算法
盛子默, 肖鸣宇
中国科学: 信息科学, 2024, 54(7): 1604-1619
摘要 图边删除问题中一类重要问题是研究是否可以删除图中不超过k条边之后使得剩余的图不存在某个子图结构H,而子图H为顶点个数不超过4的连通图的情况被研究得最为广泛.本文主要考虑H为Paw图(三角形其中一个顶点再邻接一条边)的情况,称为Paw图–边删除问题,并为该问题设计了一个32k个顶点的问题核.这是该问题的第1个线性顶点大小的问题核.文中主要的技术是结合两个新的皇冠分解的变体来分析图的结构从而对图进行简化.
关键词 图算法; 核心化算法; H-边删除问题; Paw图-边删除问题; 皇冠分解技术; graph algorithms; kernelization; H-edge covering; Paw-edge covering; crown decomposition
Zimo SHENG, Mingyu XIAO. A linear vertex kernel for the Paw edge covering problem. Sci Sin Inform, 2024, 54(7): 1604-1619, doi: 10.1360/SSI-2023-0418
理论计算机科学专题
优先k-设施选址问题的近似算法
张震, 冯启龙, 徐雪松, 彭晗, 刘利枚, 石峰
中国科学: 信息科学, 2024, 54(7): 1588-1603
摘要 给定度量空间中的一个设施集合与一个带有最低服务级别要求的用户集合,优先k-设施选址问题的目标是开设最多k个设施,在每个开设设施上安置不同级别的服务,并将每个用户连接到一个能满足其服务级别要求的开设设施上,使得设施开设费用、服务安置费用与用户连接费用之和最小.本文利用拉格朗日(Lagrange)松弛技术求解优先k-设施选址问题,针对用户的服务级别要求提出了新的确定化舍入方法,并基于此给出了多项式时间的(7.9533+ε)-近似算法.这是关于该问题的第一个常数近似算法.
关键词 设施选址; 近似算法; 拉格朗日松弛; facility location; approximation algorithms; Lagrangian relaxation
Zhen ZHANG, Qilong FENG, Xuesong XU, et al. On approximation algorithms for the priority k-facility location problem. Sci Sin Inform, 2024, 54(7): 1588-1603, doi: 10.1360/SSI-2023-0407
理论计算机科学专题
面向LinUCB算法的数据投毒攻击方法
姜伟龙, 何琨
中国科学: 信息科学, 2024, 54(7): 1569-1587
摘要 LinUCB算法是求解上下文多臂老虎机问题的一种典型算法,被广泛应用于新闻投放、产品推荐、医疗资源分配等场景中.目前对该算法的安全性研究略显薄弱,这就要求研究者进一步加深对该算法的攻击方式的研究,以作出具有针对性乃至泛用性的防御措施.本文提出了两种通过添加虚假数据的方式对LinUCB算法进行离线数据投毒攻击的攻击方案,即TCA方案(target context attack)与OCA方案(optimized context attack).前者是基于训练数据与目标上下文的相似性来生成投毒数据的;后者是建模一个优化问题,通过求解该问题来构造投毒数据,是前者的优化版本.实验测试表明,仅需添加少量投毒数据作为攻击成本即可实现对攻击目标的100%攻击成功率.
关键词 上下文多臂老虎机; LinUCB 算法; 数据投毒攻击; 白盒攻击; 优化问题; contextual multi-armed bandit; LinUCB; data poisoning attack; white-box attack; optimization problem
Weilong JIANG, Kun HE. Data poisoning attacks on the LinUCB algorithm. Sci Sin Inform, 2024, 54(7): 1569-1587, doi: 10.1360/SSI-2023-0308
理论计算机科学专题
创作者经济中的去中心化审查机制设计
陈宏崟, 邓小铁, 孔雨晴, 陆宇暄
中国科学: 信息科学, 2022, 52(6): 992-1001
摘要 创作者经济的兴起以及相应去中心化平台的搭建加速了权力向个体创作者的转移,然而由于去中心化平台缺乏中心内容审查和监管,创作者可能滥用权力,传递可能造成社会损害的信息.已有的去中心化审查机制缺乏对创作内容社会损害的严谨刻画,同时对于该问题的解决方案也缺乏相应的理论支撑.我们提出了一套去中心化平台的审查机制:创作者上传的作品将首先由去中心化的审查者进行损害评估,根据评估结果,创作者在上传作品的同时需要支付一定押金,为了防止在随机环境下较坏情况发生,我们将引入去中心化的担保者进行担保,在此基础上通过中心化的资金池解决极端情形下的社会损害赔付.我们证明:(1)在损害评估阶段,审查者们诚实地给出自己对作品社会损害的评估是一个支配性策略;(2)审查机制以极高的概率保证作品的社会损害会低于担保者的赔偿上限和创作者的押金之和.
关键词 创作者经济; 互联网3.0; 去中心化审查; 区块链; 社交媒体; creator economy; Web3.0; decentralized censorship; blockchain; social media;
Hongyin CHEN, Xiaotie DENG, Yuqing KONG, et al. Decentralized content censorship for creator economy. Sci Sin Inform, 2022, 52(6): 992-1001, doi: 10.1360/SSI-2022-0126
理论计算机科学专题
基于区块链和贝叶斯博弈的联邦学习激励机制
张沁楠, 朱建明, 高胜, 熊泽辉, 丁庆洋, 朴桂荣
中国科学: 信息科学, 2022, 52(6): 971-991
摘要 联邦学习通过聚合多方本地模型成为数据共享的新模式.现有的联邦学习激励机制有效缓解了完全信息下的数据供给不足问题,但仍面临搭便车、不公平、不可信等挑战.为此,本文提出了一种基于区块链和贝叶斯博弈(Bayesian game)的不完全信息联邦学习激励机制,通过量化数据供给方的成本效用与数据需求方的支付报酬对数据交易过程建模,采用沙普利值(Shapley value)实现了数据供给方报酬分配的公平性.在交易模型中考虑到参与个体的异质性与隐私保护,将数据供给方的资源配置策略构建为不完全信息的贝叶斯博弈模型,通过优化本地模型训练策略实现对数据供给方的激励作用.本文进一步分析了激励机制的有效性与行动策略的可信性,提出一种隐私保护的贝叶斯博弈行动策略共识算法(privacy-preserving Bayesian game action strategy consensus algorithm, PPBG-AC),该算法使数据供给方在基于区块链的数据交易平台下实现了贝叶斯纳什均衡.方案对比与理论分析表明本文提出的不完全信息联邦学习激励机制保障了数据供给方利益分配的公平性与资源配置的可信性,基于实际公开数据集的仿真实验与性能评估验证了激励机制的有效性.
关键词 联邦学习; 激励机制; 区块链; 贝叶斯博弈; 沙普利值; 不完全信息; 隐私保护; federated learning; incentive mechanism; blockchain; Bayesian game; Shapley value; incomplete information; privacy protection;
Qinnan ZHANG, Jianming ZHU, Sheng GAO, et al. Incentive mechanism for federated learning based on blockchain and Bayesian game. Sci Sin Inform, 2022, 52(6): 971-991, doi: 10.1360/SSI-2022-0020
理论计算机科学专题
最小最大圈覆盖问题的精确算法
袁森, 陈开奇, 李江坤, 张鹏
中国科学: 信息科学, 2022, 52(6): 960-970
摘要 最小最大圈覆盖问题是旅行售货商问题的推广,该问题在无线传感器网络和无人机救灾等领域有着广泛的应用.目前关于最小最大圈覆盖问题的研究主要集中在近似算法方面,而缺少精确算法方面的结果.本文根据最小最大圈覆盖问题的组合特征,对该问题设计了基于动态规划策略的首个精确算法,时间复杂度为O~*(3~n).本文将对最小最大圈覆盖问题的求解分为两个阶段,第一个阶段是对问题的输入进行预处理,第二个阶段是在预处理的基础上求问题的最优解.有趣的是,两个阶段的方法都是基于动态规划策略设计的,这是本文处理最小最大圈覆盖问题的一个主要的特色.本文所证明的求到最优解的时间O~*(3~n),显著优于基于暴力搜索策略的枚举算法的时间.
关键词 最小最大圈覆盖问题; 动态规划; 分支定界; 精确算法; min-max cycle cover; dynamic programming; branch and bound; exact algorithm;
Sen YUAN, Kaiqi CHEN, Jiangkun LI, et al. Exact algorithms for the min-max cycle cover problem. Sci Sin Inform, 2022, 52(6): 960-970, doi: 10.1360/SSI-2021-0444
理论计算机科学专题
平面上带次模惩罚费用的最小能量部分覆盖问题
刘晓非, 代涵, 李思哲, 李伟东
中国科学: 信息科学, 2022, 52(6): 947-959
摘要 给定平面上的n个用户、m个传感器和一个正整数k (n),任意传感器s均可以通过提供能量p(s)产生一个圆形的覆盖区域,覆盖区域的半径r(s)与p(s)满足p(s)=r(s)~α,其中, α1为衰减系数.平面上带次模惩罚费用的最小能量部分覆盖问题尝试寻找传感器的一个能量供应方案,使得至少有k个用户被覆盖且总能量与未覆盖用户的惩罚费用之和达到最小,其中惩罚费用由一个次模函数确定.该问题推广了最小能量覆盖问题、最小能量部分覆盖问题和带惩罚费用的最小能量部分覆盖问题.通过深入挖掘平面上半不相交圆盘集合的几何性质,本文设计了一个基于原始对偶框架的两阶段多项式时间(5·2~α+1)-近似算法.当惩罚费用函数是线性函数时,此算法的近似比为5·2~α.
关键词 能量部分覆盖问题; 次模惩罚费用; 原始对偶方法; 半不相交; 近似算法; k-prize-collecting power cover problem; submodular penalties; primal-dual method; semi-disjoint; approximation algorithm;
Xiaofei LIU, Han DAI, Sizhe LI, et al. k-prize-collecting minimum power cover problem with submodular penalties on a plane. Sci Sin Inform, 2022, 52(6): 947-959, doi: 10.1360/SSI-2021-0445
理论计算机科学专题
无权重物品的几乎无忌妒分配
张智杰, 应东昊, 张家琳, 孙晓明
中国科学: 信息科学, 2022, 52(6): 935-946
摘要 公平分配研究如何把m个不可分的物品公平地分配给n个玩家.每个玩家关于物品有一个可加的估值函数.物品是无权重的,如果他们的取值范围为{1, 0,-1}.非负估值的物品称为奖品,非正估值的物品称为苦差.本文考虑寻找无权重物品的分配,并满足“相差任意物品下是无忌妒的”(envy-free up to any item, EFX0). EFX_0是本领域内最受关注的公平性度量.一般可加估值函数下的EFX_0分配的存在性仍然是开放的.本文提出寻找无权重物品的EFX_0分配的多项式时间算法.为了达到这个目的,本文分别提出了寻找无权重奖品和无权重苦差的EFX_0分配的算法.然后,通过将二者小心地结合起来,本文得到了最终的算法.本文的结果完整刻画了无权重情况下寻找EFX_0分配的解决方案.
关键词 公平分配; 无忌妒性; 不可分物品; 奖品; 苦差; fair allocation; envy-freeness; indivisible items; goods; chores;
Zhijie ZHANG, Donghao YING, Jialin ZHANG, et al. Almost envy-free allocations of unweighted items. Sci Sin Inform, 2022, 52(6): 935-946, doi: 10.1360/SSI-2021-0449
分布式梅特罗波利斯算法: 收敛条件与最优并行加速
凤维明, 尹一通
中国科学: 信息科学, 2022, 52(2): 287-313
摘要 梅特罗波利斯算法(Metropolis algorithm)是一种基本的马尔可夫链蒙特卡罗(Markov chain Monte Carlo, MCMC)采样技术,可用于从概率图模型所表示的高维概率分布(即吉布斯(Gibbs)分布)中进行随机采样.传统的梅特罗波利斯算法是一个串行算法.关于其快速收敛性的一个经典结论是:当满足梅特罗波利斯算法的Dobrushin-Shlosman条件时,该算法在O(n log n)步内快速收敛,其中n是随机变量的个数.本文研究了梅特罗波利斯算法的分布式版本——局部梅特罗波利斯算法.对该算法的正确性与收敛速度进行了分析,证明了该算法总是收敛于正确的吉布斯分布;并且对于一类自然的不包含三角形(triangle-free)概率图模型,如果满足相同的Dobrushin-Shlosman条件,则局部梅特罗波利斯算法在O(log n)轮内快速收敛.相比于传统的串行算法,实现了?(n)倍的渐进最优并行加速比.具体应用包括图染色、硬核模型和伊辛(Ising)模型的分布式采样算法.
关键词 分布式采样; 马尔可夫链蒙特卡洛; 混合时间; 自旋系统; 耦合; distributed sampling; Markov chain Monte Carlo; mixing time; spin system; coupling;
Weiming FENG, Yitong YIN. Distributed Metropolis algorithm: convergence condition and optimal parallel speed-up. Sci Sin Inform, 2022, 52(2): 287-313, doi: 10.1360/SSI-2021-0127
形式概念分析中的概念约简与概念特征
魏玲, 曹丽, 祁建军, 张文修
中国科学: 信息科学, 2020, 50(12): 1817-1833
摘要 形式概念分析是以形式背景及其概念格为基础的一种数据分析方法,其中的形式概念明确反映了数据信息中对象与属性间的关系,是哲学中"概念"这一名词的形式化描述.文章提出在形式概念分析框架下进行概念约简的思想,研究保持形式背景中二元关系不变的概念约简的相关理论;针对概念约简理论中作用不同的3种概念类型,分别从算子角度以及布尔矩阵角度分析了对象(属性)概念的特征,并给出了求解概念约简的方法.
关键词 形式背景; 形式概念分析; 二元关系; 约简; 特征; formal context; formal concept analysis; binary relations; reduction; characteristic;
Ling WEI, Li CAO, Jianjun QI, et al. Concept reduction and concept characteristics in formal concept analysis. Sci Sin Inform, 2020, 50(12): 1817-1833, doi: 10.1360/N112018-00272
一种求解双目标最小生成树的警示传播算法
王辛, 王晓峰, 许道云, 杨德仁
中国科学: 信息科学, 2020, 50(10): 1501-1510
摘要 双目标最小生成树问题是一个NP-难问题,在光缆通信、智能控制等领域有其重要的应用价值.警示传播(warning propagation, WP)算法是一种基于因子图的消息传递算法,可用于求解组合优化问题.借助于Boltzmann机模型使一个无向图转换为因子图,将求解无向图上的双目标最小生成树问题映射为求解因子图上的对应问题,进而设计一种求解双目标最小生成树问题的警示传播算法.选取由随机数种子产生的若干随机数构造邻接矩阵,生成对应的无向图实例,数值实验结果表明,该算法优于同类算法.
关键词 双目标优化; 组合优化; 警示传播算法; 最小生成树; 因子图; double-objective optimization; combinatorial optimization; warning propagation algorithm; minimum spanning tree; factor graph;
Xin WANG, Xiaofeng WANG, Daoyun XU, et al. A warning propagation algorithm to solve the double-objective minimum spanning tree. Sci Sin Inform, 2020, 50(10): 1501-1510, doi: 10.1360/N112018-00260
极小非正规时序逻辑的矢列式演算系统
马明辉, 王善侠, 邓辉文
中国科学: 信息科学, 2017, 47(1): 31-46
求解多阶段护士排班问题的带权禁忌搜索算法
苏宙行, 王卓, 吕志鹏
中国科学: 信息科学, 2016, 46(7): 834-854
基于矩阵运算的复杂网络构建方法
刘胜久, 李天瑞, 洪西进, 王红军, 珠杰
中国科学: 信息科学, 2016, 46(5): 610-626
求解最小连通支配集问题的变深度邻域搜索算法
王灵敏, 周淘晴, 吴歆韵, 吕志鹏
中国科学: 信息科学, 2016, 46(4): 445-460
NCSS: 一种快速有效的复杂网络社团划分算法
韩忠明, 谭旭升, 陈炎, 段大高
中国科学: 信息科学, 2016, 46(4): 431-444
半代数经济模型的均衡点计算: 一种代数方法
李晓亮
中国科学: 信息科学, 2016, 46(3): 291-310
视觉端边云融合架构: 面向超级智慧城市群演进的关键技术
纪雯, 杨哲铭, 王智, 郭斌, 沈博
中国科学: 信息科学, 2024, 54(11): 2518-2532
摘要 随着城市化建设进程的加速,超级智慧城市群的新格局正在形成,物联网、人工智能和大数据等技术正快速渗透至城市信息基础设施的建设,使智慧城市形成极具前景的新兴交叉研究领域.然而现有智慧城市解决方案通常是面向不同城市的定制化方案,在实际应用中缺乏对城市运行状态全面智能感知和多区域协同能力.本文提出了视觉端边云融合的架构,用于智慧城市群的协同发展.首先,将推动智慧城市信息基础设施的新质生产力凝练出算力、运力、数力、智力、视力的新五维特征.之后,通过构建层次化的城市内和城市间视觉端边云架构,解决数据互通瓶颈并助力打破城市间的信息孤岛,提升整体系统的灵活性和可靠性.同时,本文还提出了特征重构的资源共享技术、面向大规模群体的跨域协同优化技术、以及面向复杂城市网络的持续演化的关键技术,从而实现城市智慧连接,形成共通、共享、共赢的新型城市网络架构,以支持智慧城市群通过视觉数据进行跨场景、精准、动态实时的计算.本文旨在为智慧城市群的发展提供一个全面的技术架构和解决方案,以支撑超级智慧城市群的协同演进,推动智慧城市群的智能化进程.
关键词 视觉端边云; 端边云系统; 智慧城市群; 智能系统; 视觉计算; visual end-edge-cloud; end-edge-cloud system; smart city clusters; intelligent system; visual computing
Wen JI, Zheming YANG, Zhi WANG, et al. Visual end-edge-cloud fusion architecture: key technologies of future super metropolitan clusters. Sci Sin Inform, 2024, 54(11): 2518-2532, doi: 10.1360/SSI-2023-0397
多移动终端轻量化感-算-策协同增强方法
高元, 刘思聪, 郭斌, 徐祥瑞, 卞浩羽, 郝静怡, 徐王锦, 於志文
中国科学: 信息科学, 2024, 54(9): 2136-2156
摘要 近年来,随着物联网和人工智能技术的融合,智能物联网(AI+IoT, AIoT)逐渐成为备受关注的新兴前沿领域.在这一背景下,深度学习驱动的智能应用逐渐渗透到智慧城市、公共安全等多个领域.为了实现智能计算从云端向物联网终端和边缘端延伸,智能物联网的多移动终端设备协同工作需要面对的挑战包括可用资源受限和环境动态变化等方面.在智能物联网中,多移动终端具备泛在感知、智能计算与自主决策能力,并参与到感知、计算、学习和决策的过程中.本文提出了多移动终端轻量化感–算–策协同增强方法,旨在克服单终端的视野、资源和性能局限,提升系统的感知覆盖和计算效率,提高在多种应用场景下的任务性能.
关键词 智能物联网; 数据融合感知; 深度模型伸缩卸载; 大小模型互馈决策; 异构系统跨层优化; intelligent Internet of Things; data fusion perception; deep model scalability offloading; mutual feedback decision of large and small models; cross-layer optimization of heterogeneous systems
Yuan GAO, Sicong LIU, Bin GUO, et al. Lightweight sensing-computing-decision collaboration enhancement for multi-mobile terminals. Sci Sin Inform, 2024, 54(9): 2136-2156, doi: 10.1360/SSI-2024-0089
面向忆阻器存内计算架构的高能效编解码机制
黄禹, 郑龙, 刘海峰, 邱启航, 辛杰, 廖小飞, 金海
中国科学: 信息科学, 2024, 54(8): 1827-1842
摘要 近年来,以忆阻器为代表的存内计算架构被广泛研究,用于加速各种应用,并有望突破冯·诺伊曼(von Neumann)架构面临的内存墙瓶颈.本文观察到忆阻器计算操作的能源消耗存在不对称性,即在低电阻状态下对忆阻器单元的操作能耗可能比在高电阻状态下高出数个数量级.这为通过减少低电阻状态单元的数量来节省计算能源提供了机会.为此,本文提出了一套通用且高效的忆阻器编解码机制,可以无缝集成到现有加速器中,并且不会影响其计算结果.在编码部分,设计了一个基于减法的编码器,实现了低电阻状态到高电阻状态的编码转换,并将编码问题表述为图遍历问题以实现最优的编码结果.在解码部分,配备了一个轻量级的硬件解码器,用于还原编码的计算结果,并且避免引入额外的计算时间开销.实验结果显示,本方案在机器学习和图计算等多个领域取得不俗效果,分别实现了高达31.3%和56.0%的能源节约.
关键词 存内计算; 忆阻器; 加速器; 高能效; 机器学习; 图计算; processing in memory; memristor; accelerator; energy efficiency; machine learning; graph processing
Yu HUANG, Long ZHENG, Haifeng LIU, et al. A general yet accurate approach for energy-efficient processing-in-memory architecture computations. Sci Sin Inform, 2024, 54(8): 1827-1842, doi: 10.1360/SSI-2023-0345
基于自适应Sketch的高速网络流大小测量机制
卜霄菲, 黄河, 孙玉娥, 王兆杰, 吴晓灿
中国科学: 信息科学, 2024, 54(7): 1677-1691
摘要 高速网络流大小的测量面临着高速存储资源极度稀缺的挑战,难以满足海量流式数据的实时存储需求.目前的研究大多采用存储资源共享技术,以便将设计的估计器置于稀缺的高速片上缓存中.然而,这种方法引入了大量难以消除的噪声,导致中小规模流的估算精度不高.为了解决这一问题,本文提出一种能根据流大小自适应调整所占用存储空间的自适应Sketch技术,并在此基础上设计出一个高精度、低存储开销的每流大小估计器.自适应Sketch技术利用可逆计数器高效滤除海量噪声小流,并进一步采用采样概率逐层递减的采样计数器实现对不同规模流的自适应采样计数,从而控制大流对资源的过多占用,实现了低开销、高精度的每流大小测量.基于真实网络数据集CAIDA 2019的仿真实验表明,所提出的自适应Sketch流大小估计器的平均相对误差较现有机制降低了接近1个数量级.
关键词 高速网络; 流大小测量; Sketch; 噪声小流过滤; 可逆计数器; high-speed network; flow size measurement; Sketch; small flows filtering; reversible counters
Xiaofei BU, He HUANG, Yu-E SUN, et al. Adaptive Sketch: accurate flow size measurement in high-speed networks. Sci Sin Inform, 2024, 54(7): 1677-1691, doi: 10.1360/SSI-2023-0294
一种冗余感知的高能效图计算加速器
姚鹏程, 廖小飞, 金海, 周宇航, 徐鹏, 张伟, 曾圳, 潘晨高, 朱冰
中国科学: 信息科学, 2024, 54(6): 1369-1385
摘要 图作为一种灵活表达对象之间关系的数据结构,广泛地应用于各类重要的现实场景.近年来,随着性能提升速度放缓,通用处理器逐渐无法满足图计算应用的需求,并成为限制图计算发展的主要瓶颈.因此,面向图计算的领域专用加速器成为近年来的研究热点.通过定制化的硬件设计,图计算加速器可以在图计算应用中取得通用处理器数十倍的性能.然而,现有的图计算加速器在运行宽度优先算法时会频繁地重复访问幂律顶点的相关数据,进而导致了严重的冗余访存问题.在特定场景下,现有的图计算加速器的性能甚至低于通用CPU.为了解决该问题,本文提出一种冗余感知的高能效图计算加速器JiFeng.当幂律顶点完成迭代计算时, JiFeng通过跳过剩余的相邻边大幅减少其被重复访问的次数. JiFeng实现了一系列软硬件协同设计,在保证负载均衡的同时提升硬件的执行效率.为了验证JiFeng的有效性,本文采用FPGA原型系统对相关设计进行性能评估. JiFeng在典型的生成图和现实图上实现最高每秒遍历4612亿条边的性能和每秒每瓦特遍历125亿条边的能效比,并在2023年11月的图计算超算排行榜GreenGraph500的小数据集榜单上取得第2名的成绩.
关键词 图计算; 加速器; 宽度优先搜索; 冗余访存; FPGA; graph processing; accelerator; breadth-first search; redundant memory access
Pengcheng YAO, Xiaofei LIAO, Hai JIN, et al. A redundancy-aware energy-efficient graph accelerator. Sci Sin Inform, 2024, 54(6): 1369-1385, doi: 10.1360/SSI-2023-0387
一种基于动态可寻址会话的服务器无感知计算
李子俊, 赵一龙, 陈全, 过敏意
中国科学: 信息科学, 2024, 54(3): 582-602
摘要 服务器无感知计算作为云原生范式中快速发展的新兴技术,因其按需付费、自动资源伸缩和底层环境屏蔽等特点而受到越来越多的开发人员欢迎. FaaS (函数即服务)作为Serverless架构的主要实现方式,以函数粒度对应用进行解耦和执行.大多数云服务提供商也为应用开发人员提供了基于Serverless架构的应用搭建服务,这些服务允许开发人员以函数的形式部署代码,并根据实际的请求量进行自动扩缩容.然而,在部署有状态函数时,由于Serverless架构的无状态特性,管理其中的有状态数据变得复杂,往往无法满足Serverless中函数对有状态数据的访问性能要求.因此,本文提出了一种基于有状态和动态可寻址会话机制的服务器无感知计算系统XFaaS,实现了低开销的有状态数据访问和更高的应用吞吐.实验结果表明,通过采用XFaaS系统部署有状态函数的方式,可以降低有状态数据访问时延3个数量级,并提高2倍以上的函数最大吞吐量.
关键词 服务器无感知计算; 函数即服务; 有状态函数; 粘滞会话; 容器; Serverless computing; function-as-a-service; stateful function; sticky Session; container
Zijun LI, Yilong ZHAO, Quan CHEN, et al. Serverless computing based on dynamic-addressable session. Sci Sin Inform, 2024, 54(3): 582-602, doi: 10.1360/SSI-2023-0155
联邦学习在高度数据异构场景下的泛化鲁棒性增强
万伟, 胡胜山, 陆建荣, 李明慧, 周子淇, 金海
中国科学: 信息科学, 2024, 54(3): 566-581
摘要 联邦学习(federated learning, FL)是一种以保护客户隐私数据为中心的分布式处理网络,为解决隐私泄露问题提供了前景良好的解决方案.然而, FL的一个主要困境是高度非独立同分布(nonindependent and identically distributed, non-IID)的数据会导致全局模型性能很差.尽管相关研究已经探讨了这个问题,但本文发现当面对non-IID数据、不稳定的客户端参与以及深度模型时,现有方案和标准基线FedAvg相比,只有微弱的优势或甚至更差,因此严重阻碍了FL的隐私保护应用价值.为解决这个问题,本文提出了一种对non-IID数据鲁棒的优化方案:FedUp.该方案在保留FL隐私保护特点的前提下,进一步提升了全局模型的泛化鲁棒性. FedUp的核心思路是最小化全局经验损失函数的上限来保证模型具有低的泛化误差.大量仿真实验表明, FedUp显著优于现有方案,并对高度non-IID数据以及不稳定和大规模客户端的参与具有鲁棒性.
关键词 分布式网络; 联邦学习; 异构优化; 泛化性; 鲁棒性; 隐私保护; distributed network; federated learning; heterogeneous optimization; generalization; robustness; privacy protection
Wei WAN, Shengshan HU, Jianrong LU, et al. Enhancing generalization robustness of federated learning in highly heterogeneous environments. Sci Sin Inform, 2024, 54(3): 566-581, doi: 10.1360/SSI-2023-0107
TVMT: 基于TVM的高性能神经网络训练编译器
曾军, 寇明阳, 郑惜元, 姚海龙, 孙富春
中国科学: 信息科学, 2023, 53(12): 2458-2471
摘要 随着深度学习应用的快速发展,神经网络模型的参数量变得越来越大,这意味着训练一个可用的神经网络模型需要更多的算力和更长的计算时间,因此如何提升神经网络训练的效率至关重要.然而训练效率在很大程度上取决于硬件后端和编译器.为了提升神经网络训练的性能,编译器的效率亟待提升,而这主要取决于计算图的优化、算子级别的优化和代码生成.主流的神经网络训练框架(如TensorFlow, PyTorch)使用了供应商特定的、通过手工设计算子获得的算子库.然而,手工设计算子浪费了大量的算子级别的优化空间,因此研究人员提出了TVM.作为一个端到端的编译器, TVM实现了算子级的自动优化,比现有框架进一步提高了性能.此外, TVM支持从多种神经网络框架中导入神经网络模型,并在不同主流硬件后端上部署.然而, TVM的注意力集中于提升神经网络推理任务的性能,并不支持神经网络的训练.本文提出了TVMT,第一个基于TVM、支持神经网络训练的端到端编译器.为了支持神经网络训练,本文提出了以下方法.(1)合并损失函数到现有的计算图中,以支持前向和后向传播;(2)在训练过程中采用设备到主机的机制来更新权重参数;(3)集成了最先进的张量程序调优器,以自动优化神经网络训练程序.实验结果表明,与PyTorch相比, TVMT在Intel CPU和NVIDIA GPU上的神经网络训练性能达到了最高4.88倍的提升;与TensorFlow相比, TVMT在Intel CPU和NVIDIA GPU上的神经网络训练性能达到了最高11.5倍的提升.
关键词 神经网络编译器; 神经网络训练; 算子自动优化; 参数更新; 反向传播; neural network compiler; neural network training; automatic optimization for operators; parameters update; back propagation
Jun ZENG, Mingyang KOU, Xiyuan ZHENG, et al. TVMT: TVM-based high-performance neural network compiler supporting training. Sci Sin Inform, 2023, 53(12): 2458-2471, doi: 10.1360/SSI-2022-0140
面向SDN网络的分布式轻量级大流检测算法
周京晶, 黄河, 孙玉娥, 杜扬, 张博宇
中国科学: 信息科学, 2023, 53(10): 1924-1944
摘要 在SDN (software-defined networks)网络中检测大流对负载均衡、异常检测、流量工程等网络应用的实施及网络服务质量的提升至关重要. SDN网络通常使用流表统计流量数据,但由于存储流表的三态内容寻址寄存器(ternary content addressable memory, TCAM)资源有限,仅凭流表无法从海量网络数据中识别出所有大流,需要使用紧凑数据结构作为额外的测量模块来辅助检测.现有的研究多考虑将测量模块部署在单台或边缘交换机上,但交换机中的高速存储资源和计算资源极度紧缺,处于高流量链路上的交换机会因执行测量任务承受过高的负载,甚至影响交换机核心功能的执行.为此,本文提出了一种面向SDN网络的分布式轻量级大流检测方案.该方案将网络流量测量任务分摊至全网交换机,进而实现测量负载的均衡,并结合所设计的轻量级测量模块,有效降低了每台交换机执行测量任务所需的计算和存储开销.实验结果证明该方案较已有最新研究成果具有更高的测量精度及更低的计算和存储开销.
关键词 SDN网络; 网络流量测量; 大流检测; 分布式测量; Sketch; software-defined networks; network traffic measurement; elephant flow detection; distributed measurement
Jingjing ZHOU, He HUANG, Yu-E SUN, et al. A distributed and lightweight elephant flow detection algorithm for software-defined networks. Sci Sin Inform, 2023, 53(10): 1924-1944, doi: 10.1360/SSI-2022-0387
面向动态有向图的单调图算法硬件加速机制
杨赟, 余辉, 赵进, 张宇, 廖小飞, 姜新宇, 金海, 刘海坤, 毛伏兵, 张吉, 王彪
中国科学: 信息科学, 2023, 53(8): 1575-1592
摘要 随着现实世界中动态图计算需求的快速增长,现有的研究工作已经提出了多种方法来有效支持单调图算法在动态有向图中的处理.然而,由于动态有向图的图结构频繁发生变化,其相邻图顶点之间的状态更新存在复杂的依赖关系,这使得现有的软硬件方法在处理单调图算法时依然面临着数据访问成本高和收敛速度慢的问题.为此,本文提出了一种面向动态有向图的单调图算法加速器DSGraph,它能够充分利用图顶点之间的依赖关系来加快单调图算法在动态有向图处理中的收敛速度,并有效降低数据访问成本.具体来说, DSGraph通过实时提取动态有向图中图顶点的局部拓扑依赖顺序来执行异步迭代处理,从而显著减少冗余的图顶点状态更新.同时, DSGraph设计了一种异步迭代流水线架构,其按照依赖顺序对图顶点状态进行异步迭代处理,从而加速图顶点状态传播速度并减少数据访问开销.最后, DSGraph提出了一种无阻塞数据同步机制,通过并行执行本地图顶点的状态更新和外部图顶点的数据同步来减少系统同步开销.实验显示,与目前最先进的面向单调图算法的动态图处理系统KickStarter相比, DSGraph将动态有向图处理速度平均提升了11.2倍.
关键词 动态有向图; 单调图算法; 增量计算; 依赖感知; 图加速器; dynamic directed graph; monotonic graph algorithms; incremental processing; dependency-aware; graph accelerator;
Yun YANG, Hui YU, Jin ZHAO, et al. An efficient hardware accelerator for monotonic graph algorithms on dynamic directed graphs. Sci Sin Inform, 2023, 53(8): 1575-1592, doi: 10.1360/SSI-2022-0191
国防科技大学建校70周年专题
学科交叉多物理场耦合并行计算构件模型
莫则尧, 杨章
中国科学: 信息科学, 2023, 53(8): 1560-1574
摘要 随着高性能数值模拟对客观对象逼真度的不断增强,学科交叉特征凸显,带来多物理场耦合的多样性和动态演化,给并行计算带来了新的挑战.相对于单一学科或静态的多物理场耦合,挑战主要表现在两个方面,其一,如何降低耦合的复杂度;其二,如何支撑提升耦合的可信度.本文提出一种跨学科并行计算构件模型,统一表征结构网格、非结构网格和组合几何的网格数据模型,构件化数据通信、负载平衡和数值计算功能,将耦合复杂度从平方量级降低到线性近优,并奠定了耦合可信度提升的并行计算基础.结构–流体–传热等跨学科多物理场耦合并行计算表明,本文提出的构件模型有效.
关键词 构件模型; 并行计算; 学科交叉; 多物理场耦合; component model; parallel computing; interdisciplinary; multiphysics coupling;
Zeyao MO, Zhang YANG. Parallel computing component model for interdisciplinary multiphysics coupling. Sci Sin Inform, 2023, 53(8): 1560-1574, doi: 10.1360/SSI-2023-0108
一种新型群智感知系统架构模型和实现方法
马华东, 赵东, 王新兵, 王甲海, 华蓓, 童剑军
中国科学: 信息科学, 2023, 53(7): 1262-1280
摘要 物联网移动群智感知模式本质是汇聚大规模普通移动个体的智能感知能力,对开放、动态、复杂物理环境进行感知,通过感知大数据的智能分析,对感知群体引导和反馈,使其持续涌现群体智能并辅助综合决策.目前的群智感知系统仍然存在个体感知欠智能、群体目标少引导、群智过程弱调控三方面的局限性.本文首先讨论了群智感知研究现状和面临的挑战;结合人机物融合、云边端协同、感算控闭环3个核心发展趋势,提出一种智能演进与反馈引导结合的新型群智感知系统架构模型Evo-CPS,并研究了该模型的实现方法;然后结合智慧出行应用场景,将所提出的理论方法进行应用验证;最后,总结全文并展望新一代群智感知研究领域的发展方向.
关键词 群体智能; 群智感知; 人机物融合; 智慧出行; crowd intelligence; crowdsensing; human-cyber-physical fusion; smart transportation;
Huadong MA, Dong ZHAO, Xinbing WANG, et al. A novel crowdsensing system architecture model and its implementation methods. Sci Sin Inform, 2023, 53(7): 1262-1280, doi: 10.1360/SSI-2022-0157
代际交错背景下移动蜂窝系统的近因现象与自调控设计: 速度、能耗与可靠性
刘云浩, 李振华, 李洋, 林灏, 宫良一, 郑雅文
中国科学: 信息科学, 2022, 52(12): 2290-2305
摘要 移动蜂窝系统正经历着从2G/3G/4G到5G的交错式代际进化过程,多样化的信号与协议长期共存.如何在庞大、异构、高动态的蜂窝环境中保证服务的高速(传输快)、高能效(耗电少)和高可靠性(不断网)成为至关重要但又非常困难的问题,该问题同时涉及手机制造商、网络服务提供商、操作系统和应用软件开发商.我们研究和综述了近年来针对该问题的代表性工作,发现蜂窝系统表观层面的多个反常性能问题,实际上归因于核心机制层面隐蔽而深刻的“近因现象”:受社会舆论和商业宣传影响,在选择使用移动网络时,存在非理性的代际偏颇和不自觉的速度至上倾向,进而引发了偏向5G的“亏损迁移”、网络容量的“饱和饥饿”以及基站连接的“乒乓跳跃”等连锁效应.为修复上述缺陷,我们提出基于4G/5G双连接以及非齐次时变马尔可夫过程的自调控技术设计,将5G设备的故障发生率降低40%并将所有设备的平均故障持续时间缩短36%,同时探讨我们基于大规模工业合作实践的洞察和创新.
关键词 代际交错; 5G; 近因现象; 亏损迁移; 自调控技术; interlaced generations; 5G; recency effect; loss-making migration; self-regulating design;
Yunhao LIU, Zhenhua LI, Yang LI, et al. Recency effect and self-regulating design of mobile cellular systems in the context of interlaced generations: network bandwidth, power efficiency, and connection reliability. Sci Sin Inform, 2022, 52(12): 2290-2305, doi: 10.1360/SSI-2022-0062
面向机器学习系统的张量中间表示
庄毅敏, 文渊博, 李威, 郭崎
中国科学: 信息科学, 2022, 52(6): 1040-1052
摘要 随着各类机器学习算法的广泛应用,高能效地定制机器学习系统受到越来越多的关注.定制机器学习系统高效部署的关键在于其编程与编译环境.中间表示是编程与编译环境的核心,用于连接上层编程语言和底层硬件指令.当前的中间表示或是面向上层算法或是面向以标量处理为核心的传统处理器,难以高效应对以张量处理为核心的机器学习系统.本文提出了面向机器学习系统的张量中间表示,以提升机器学习系统的编程和运行效率.具体而言,我们定义了一系列张量类型,张量操作及张量存储空间,并在此基础上进行张量处理优化.我们将所提出的张量中间表示对TVM的底层标量中间表示进行了扩展并在典型机器学习系统上进行了实验.我们探索了原有中间表示没有发掘的优化并取得了1.62~2.85倍的性能提升,同时在典型算子的开发效率上平均提升了5.46倍.
关键词 机器学习系统; 编程与编译; 张量处理; 中间表示; 编程效率; machine learning systems; programming & compiling; tensor processing; intermediate representation; programming efficiency;
Yimin ZHUANG, Yuanbo WEN, Wei LI, et al. A tensor intermediate representation for machine learning systems. Sci Sin Inform, 2022, 52(6): 1040-1052, doi: 10.1360/SSI-2020-0398
FJoin: 一种基于FPGA的流连接并行加速器
林力韬, 陈汉华, 金海
中国科学: 信息科学, 2022, 52(2): 314-333
摘要 流连接广泛应用于提取多源流数据之间的关键信息,是大数据处理的重要支撑技术.但连接两条大数据流时大规模的连接谓词计算,使其易成为性能瓶颈.为提高处理性能,流连接系统常采用并行和分布式两种方式扩展.然而,采用多核并行的流连接系统的扩展性受到CPU核数限制,无法应对大规模数据流.采用分布式扩展的流连接系统由于引入分布式框架运行的开销,导致硬件处理效率严重下降.为实现高效大规模扩展,本文提出一种利用FPGA加速器外设向上扩展的流连接系统FJoin.加速器可进行高并行的流动连接,载入多个流元组后,连接窗口中的数据流经一次即可完成所有连接计算.对于逻辑容易在FPGA实现的连接谓词,通过大量基本连接单元串联构成深度连接流水线,实现大规模并行.通过主机CPU和FPGA设备协同进行连接控制,将连续的流连接计算划分为独立的小批量任务,高效地保证并行化流连接的完整性.在装备FPGA加速卡的平台实现了FJoin,基于大规模真实数据集的测试结果表明,对比部署在40个节点集群上的目前最好的分布式流连接系统,本文提出的流连接加速器FJoin可在单一FPGA加速卡上将连接计算速度提升16倍,达到5倍的系统吞吐,且时延满足实时流处理要求.
关键词 流连接; FPGA; 流处理; 硬件加速; 并行计算; stream join; FPGA; stream process; hardware accelerate; parallel computing;
Litao LIN, Hanhua CHEN, Hai JIN. FJoin: an FPGA-based parallel accelerator for stream join. Sci Sin Inform, 2022, 52(2): 314-333, doi: 10.1360/SSI-2021-0214
一种高效的面向高并发图分析任务的存储系统
赵进, 姜新宇, 张宇, 廖小飞, 金海, 刘海坤, 杨赟, 张吉, 王彪, 余婷
中国科学: 信息科学, 2022, 52(1): 111-128
摘要 随着现实世界中图计算需求的快速增长,同一平台上往往并发运行着大量迭代图分析任务.然而,现有的图计算系统主要是为了高效执行单个图分析任务而设计的.因此,当多个并发图分析任务同时在同一个底层图上并行执行时,现有图计算系统会面临巨大的数据访问开销.为了提高并发图分析任务的吞吐量,现有的核外并发图处理方案通过共享图数据减少并发任务的数据存储与访问开销.但是,由于现实世界中图的图顶点度数幂律分布特性以及图分析任务之间的差异性,现有方案在访问数据时依旧存在着大量的不必要的冗余I/O开销.这是因为即使静态图分区中绝大部分顶点处于非活跃状态或者只被少数图分析任务共享,现有方法也依旧会将整个分区加载入内存供并发图分析任务处理.为解决上述问题,本文提出了一个面向并发图分析任务的高效存储系统GraphDP.它能够插入到现有核外图计算系统中来透明有效地减少现有图计算系统执行并发图分析任务时的存储消耗与数据访问开销,从而提高并发图分析任务的吞吐量.具体来说, GraphDP使用一种新颖的动态I/O调度策略,能够使系统以最优的I/O访问方式完成图数据的加载,并有效地减少加载到内存和cache的数据.同时, GraphDP通过高效的缓存机制在内存中优先缓存被频繁访问的图数据,从而进一步减少数据访问开销.为证明GraphDP的有效性,我们将GraphDP插入到目前流行的核外图计算系统中,包括GridGraph, GraphChi和X-Stream.实验结果表明, GraphDP分别将GridGraph, GraphChi和X-Stream的吞吐量提高了1.57~2.19倍, 1.86~2.37倍和1.62~2.21倍.
关键词 迭代图处理; 并发任务; 存储系统; I/O开销; 吞吐量; iterative graph processing; concurrent jobs; storage system; I/O overhead; throughput;
Jin ZHAO, Xinyu JIANG, Yu ZHANG, et al. An efficient storage system towards high throughput of concurrent graph processing jobs. Sci Sin Inform, 2022, 52(1): 111-128, doi: 10.1360/SSI-2021-0020
基于流量工程的LEO巨型星座主动容错方法
王少清, 孙富春, 赵有健
中国科学: 信息科学, 2021, 51(11): 1840-1852
摘要 LEO巨型星座因其广覆盖、高通量及低延时的通信潜力而受到越来越多的关注.然而由于所处空间环境复杂及自身特点等原因, LEO巨型星座容错问题亟待研究.为此,本文关注如下问题:如何保证卫星失效后,网络流量依然无拥塞正常转发?本文提出了基于流量工程的主动容错方法 SN-FFC,主要思想是通过合理的链路冗余,使得对于至多k (k为可调参数)个卫星失效,网络流量依然能无拥塞正常转发. SN-FFC首先设计基于流量工程的容错建模方法,随后针对模型计算复杂度高的问题,提出基于对偶理论的算法,使得复杂度从O(C_n~k)降低到O(n).基于Starlink第一阶段星座模型的仿真实验表明SN-FFC相较现有方案,能实现故障下的无拥塞转发,并且计算时间和吞吐量开销较低.
关键词 LEO巨型星座; 容错; 流量工程; 对偶理论; 线性规划; LEO mega-constellation; fault tolerance; traffic engineering; duality theory; linear programming;
Shaoqing WANG, Fuchun SUN, Youjian ZHAO. A proactive failure tolerance method for LEO mega-constellation based on traffic engineering. Sci Sin Inform, 2021, 51(11): 1840-1852, doi: 10.1360/SSI-2020-0328
方舱计算
蒋昌俊, 丁志军, 喻剑, 章昭辉, 闫春钢, 张亚英, 王鹏伟
中国科学: 信息科学, 2021, 51(8): 1233-1254
摘要 随着信息技术创新日新月异,数字化、网络化、智能化深入发展,新应用层出不穷、新业态蓬勃发展,对业务系统的敏捷构造和持续运维提出了更高的要求.为此,本文提出了一种新的计算模式:方舱计算.所谓方舱计算,是通过网络访问的,面向IT任务全生命周期的跨域资源配置和协同的计算集成环境.其核心是"方舱专用机动、资源跨域伸缩、系统运维自治".本文给出了方舱计算系统结构及其工作原理,方舱计算系统主要由方舱生成与管理系统、跨域资源管理系统、虚拟数据中心系统和若干网关(方舱网关、虚拟数据中心网关、跨域资源网关等)组成.进而,给出了适于方舱计算的资源分配最优化问题定义,在兼顾数据资源、计算资源和存储资源等的基础上,实现最小化资源成本.通过规划求解器与近似优化算法仿真实验,表明本文的方法能够兼顾数据资源和物理资源的分布,实现方舱资源的优化配置.
关键词 方舱; 虚拟数据中心; 跨域资源管理; 资源分配; 资源分布图; 资源目录; cabin; virtual data center; cross-domain resource management; resource allocation; resource distribution map; resource directory;
Changjun JIANG, Zhijun DING, Jian YU, et al. Cabin computing. Sci Sin Inform, 2021, 51(8): 1233-1254, doi: 10.1360/SSI-2020-0173
三值光学计算机中并行MSD整数除法器的设计与实现
江家宝, 沈云付, 陈迅雷, 王哲河, 刘拥, 陈丽萍
中国科学: 信息科学, 2021, 51(5): 750-763
摘要 除法运算是基本四则运算之一,如何进行快速除法一直是电子计算机、嵌入式系统和其他新型计算系统广受关注的问题.充分发挥三值光学处理器位数众多、运算功能可重构、按位可分配等优势,设计出高效并行MSD (modified signed digit)数除法器对提高大数据除法的运算效率、促进三值光学计算机(ternary optical computer, TOC)在数值计算领域的应用意义重大.本文首次提出MSD数的符号判定算法,并基于SRT算法首次提出利用一个并行无进位SJ-MSD加法器和一个MSD数比较器实现单组MSD整数除法或多组MSD整数并行除法方案——并行MSD整数除法,该算法对于被除数等长的多组与单组MSD整数除法需要的机器周期是相同的.实验表明,并行MSD整数除法方案是可行的,它将有效地提高大数据处理效率并加速TOC进入数值计算等实际应用领域.
关键词 并行MSD整数除法器; SJ-MSD加法器; 比较器; SRT除法; 三值光学计算机; parallel MSD integer divider; SJ-MSD adder; comparator; SRT division; ternary optical computer(TOC);
Jiabao JIANG, Yunfu SHEN, Xunlei CHEN, et al. Design and implementation of parallel MSD integer divider in ternary optical computer. Sci Sin Inform, 2021, 51(5): 750-763, doi: 10.1360/SSI-2019-0240
面向多租户数据中心资源回收利用的能效激励机制
周知, 刘方明
中国科学: 信息科学, 2021, 51(5): 735-749
摘要 多租户公有云是云计算的一种重要组成形式.近年来,多租户公有云数据中心在如火如荼发展的同时,其过低资源使用率所导致的巨大能耗浪费也引起了社会的高度关注.然而,由于多租户公有云的资源通常以"包年包月"的租赁形式预留给租户,云服务提供商无法通过关闭空闲服务器等常用能耗管理方法来降低数据中心能耗.针对这一难题,本文提出了面向多租户数据中心资源回收利用的激励机制来提升多租户数据中心能效.该机制以经济激励的形式来回收利用租户空闲预留型资源,即云服务提供商向租户支付合适的经济补偿,从而回收租户空闲预留型资源,并充分利用其运行其他云计算服务(如电商和搜索服务).基于Lyapunov方法,本文设计并分析了一种面向租户预留资源回收利用的动态定价算法,该算法无需预测系统未来信息便可作出在线定价决策,并且在保障系统稳定性的同时使得云服务提供商长期成本无限接近于理论最低值.通过严格的数学证明以及由真实数据驱动的仿真实验,本文验证了所提出的激励机制在回收利用租户空闲资源方面的有效性.
关键词 多租户数据中心; 能耗管理; 资源回收; 激励机制; 在线算法; multi-tenant datacenter; energy management; resource recycling; incentive mechanism; online algorithm;
Zhi ZHOU, Fangming LIU. An energy-efficient incentive mechanism for resource recycling in multi-tenant datacenters. Sci Sin Inform, 2021, 51(5): 735-749, doi: 10.1360/SSI-2019-0098
基于改进深度卷积神经网络的网络流量分类方法
张小莉, 程光, 张慰慈
中国科学: 信息科学, 2021, 51(1): 56-74
摘要 机器学习方法对网络流量分类的前提是假设流量具有独立同分布性,而实际情况下流量特征不断发生变化,导致该方法在处理海量、不具备独立同分布的流量数据时开销较大,计算复杂度较高,精度较低.针对上述问题,本文提出一种新的分类模型.该模型将PCA算法与改进的深度卷积神经网络分类模型(improved deep LeNet-5 convolutional neural networks, LCNN)相结合进行流量分类.前者进行降维分析,发现影响检测精度的关键特征,后者采用自主特征学习方式提升分类精度.实验表明,本文方法的内存开销较之前方法降低了3.2%,检测精度提升了5%~8%.
关键词 网络流量分类; 深度卷积神经网络; PCA; 多分类器; 特征选择; Tensorflow; network traffic classification; deep convolutional neural network; PCA; multi-classifier; feature selection; Tensorflow;
Xiaoli ZHANG, Guang CHENG, Weici ZHANG. Network traffic classification method based on improved deep convolutional neural network. Sci Sin Inform, 2021, 51(1): 56-74, doi: 10.1360/SSI-2019-0213
一种近似最优的分布式存储系统磁盘修复算法
孙婧, 梁松涛, 路新江
中国科学: 信息科学, 2020, 50(12): 1834-1849
摘要 如何提升分布式存储系统中磁盘修复的速度,一直是磁盘修复问题中的难点.优化的途径有两种:一种是通过对解码算法的优化,减少修盘数据的传输量.另外一种方法是通过对修盘过程中数据流的调度,最大化地利用节点的计算能力、传输能力,进而加速修盘进程.本文从数据流的调度出发,根据数据流图和拓扑结构,计算出了节点的近似最优的修盘数据比例,并依照此比例,设计了分布式存储系统下的近似最优修盘调度算法(NOPT).对于主流的两种Reed-Solomon (RS)编码方式,本文做了等价性证明,并给出了编码转换矩阵.通过大量实验仿真可以看出,在预知系统拓扑的前提下,可以显著地减少通过交换机的流量,进而缩短修盘的时间.
关键词 Reed-Solomon码; 磁盘修复技术; 分布式存储系统; Reed-Solomon code; disk repair algorithm; distributed storage systems;
Jing SUN, Songtao LIANG, Xinjiang LU. An approximately optimal disk repair algorithm for distributed storage systems. Sci Sin Inform, 2020, 50(12): 1834-1849, doi: 10.1360/N112019-00004
基于程序分析的大数据应用内存预估方法
胡振宇, 石宣化, 柯志祥, 金海, 王斐
中国科学: 信息科学, 2020, 50(8): 1178-1196
摘要 基于内存计算模型的分布式数据处理系统,如Flink和Spark,经常遭受严重的内存压力,尤其在平台内存资源紧张,且被多个用户或组织共享情况下,内存资源竞争进一步加剧.用户应用被分配的内存空间不足,会在运行期间产生严重的垃圾回收(garbage collect, GC)开销,而分配过量的内存会导致平台资源的浪费.因此平台中如何为用户应用配置合适的内存成为关键问题.通过研究分析发现,平台上的多个应用会多次共同处理某个特定的数据集,且应用对数据的处理逻辑具有相似性,如图计算和机器学习应用;大数据应用框架的算子API和用户自定义方法 (UDF)与数据处理逻辑有着密切的关系,继而影响运行时内存的使用.基于该发现,本文提出了一种预估新提交应用的合理内存阈值的方法.该方法利用程序分析与历史应用处理数据特征分析,基于kTree判断与历史应用的数据路径的相似性来预估新应用的合理内存阈值,并在Spark系统上实现该方法.通过一系列实验评估预估的准确性和性能收益,实验结果表明本方法预估大数据应用的结果与真实合理内存阈值的误差比例低至4%,预估过程所产生的开销与应用运行时间相比可以忽略不计,平台上数据处理应用整体执行时间减少至56%.
关键词 内存管理; 生命周期; 代码诊断; 数据处理系统; 分布式系统; memory management; lifetime; program diagnostics; data-processing system; distributed system;
Zhenyu HU, Xuanhua SHI, Zhixiang KE, et al. Estimating the memory consumption of big data applications based on program analysis. Sci Sin Inform, 2020, 50(8): 1178-1196, doi: 10.1360/N112018-00108
面向多源关系数据的融合
丁玥, 王涓, 卢卫, 荣垂田, 杜小勇
中国科学: 信息科学, 2020, 50(5): 649-661
摘要 针对"信息孤岛"中的关系数据融合问题,本文提出并实现了多源关系数据融合的基本框架(multi-source relational data fusion, MSF).框架包含3个主要模块:模式匹配、实体对齐、实体融合.模式匹配面向多源关系数据的属性对齐问题,结合属性值的多维特征,提出基于匈牙利(Hungarian)算法的属性间对齐发现机制,实现了多源关系数据的快速模式匹配.实体对齐连接多源关系中的元组对,通过引入多样性取样策略和实体特征抽取方法,提升了实体对齐的效果.最后将对齐实体进行融合,为数据分析提供统一的数据视图.为了验证MSF的效果和效率,实现了数据融合系统DataPuzzle,并在该系统上,结合真实公开的多领域数据,对提出的方法进行了验证.结果表明,所提出的方法可以高效地实现数据融合,具有较高的查全率、查准率.
关键词 多源异构数据; 关系数据; 信息孤岛; 模式匹配; 实体对齐; 数据融合; multi-source heterogeneous data; relational data; information isolated island; schema matching; entity alignment; data fusion;
Yue DING, Juan WANG, Wei LU, et al. Multi-source relational data fusion. Sci Sin Inform, 2020, 50(5): 649-661, doi: 10.1360/SSI-2019-0172
RLO: 一个基于强化学习的连接优化方法
张心怡, 张智鹏, 张铁赢, 崔斌, 范举
中国科学: 信息科学, 2020, 50(5): 637-648
摘要 连接优化是数据库领域最重要的研究问题之一.传统的连接优化方法一般应用基础启发式规则,他们通常搜索代价很高,并且很难发现最优的执行计划.主要原因有两个:(1)这些基于规则的优化方法只能探索解空间的一个子集,(2)他们没有利用历史信息,不能够很好地衡量执行计划的代价,经常重复选择相同的糟糕计划.为了解决以上两个问题,我们提出RLO (reinforcement learning optimization),一个基于强化学习的连接优化方法.我们将连接优化问题建模成马尔可夫(Markov)决策过程,并且使用深度Q-学习来估计每一种可能的执行计划的执行代价.为了进一步增强RLO的有效性,我们提出了基于树形结构的嵌入方法和集束搜索策略来尽量避免错过最好的执行计划.我们在Apache Calcite和Postgres上实现了RLO.实验表明:(1)在Apache Calcite上,与一系列剪枝的启发式算法相比, RLO搜索计划的效率为它们的10~56倍,并且生成的计划能更快地执行(80%的加速);(2)与原生的Postgres相比, RLO搜索计划的效率是其14倍,并且在端到端的执行中达到12.9%的加速.
关键词 连接优化; 强化学习; 嵌入方法; 集束搜索; join optimization; reinforcement learning; embedding method; beam search;
Xinyi ZHANG, Zhipeng ZHANG, Tieying ZHANG, et al. RLO: a reinforcement learning-based method for join optimization. Sci Sin Inform, 2020, 50(5): 637-648, doi: 10.1360/SSI-2019-0179
Apache IoTDB的分布式框架设计
李天安, 黄向东, 王建民, 毛东方, 徐毅, 袁骏
中国科学: 信息科学, 2020, 50(5): 621-636
摘要 Apache IoTDB是一个新型的开源时序数据库管理系统.分布式数据管理系统不仅需要解决数据分区与多副本带来的节点间元数据同步问题,还要支持高效查询请求处理.本文针对节点间元数据同步问题提出了双层粒度元数据管理策略,在此基础上基于一致性哈希分区方法和Raft协议设计了同时支持强一致性查询和最终一致性查询的分布式框架.基于单机版Apache IoTDB进行了系统实现与实验测试,测试结果表明:双层粒度元数据管理策略与单层粒度管理策略相比,其元数据内存资源占用更少且写入性能提升5%~10%,并且分布式Apache IoTDB的读写性能随着集群规模的扩大而线性增长.
关键词 物联网数据库; 时间序列; 分布式框架; Raft协议; 元数据; 强一致性; 最终一致性; IoT database; timeseries; distributed framework; Raft protocol; metadata; strong consistency; eventual consistency;
Tianan LI, Xiangdong HUANG, Jianmin WANG, et al. The design of Apache IoTDB distributed framework. Sci Sin Inform, 2020, 50(5): 621-636, doi: 10.1360/SSI-2019-0189
DNS权威服务器FPGA加速技术研究
李成龙, 李韬, 韩玉浩, 冯振乾, 王宝生
中国科学: 信息科学, 2020, 50(4): 576-587
摘要 现有DNS权威服务器处理DNS请求及响应报文依赖软件网络协议栈, CPU资源占用率高、开销大,处理性能受限.本文基于SmartNIC架构对DNS权威服务器的功能进行卸载加速,提出并设计了高性能DNS权威查询响应流水线PHDR Pipe (perfect Hash DNS response pipeline),基于完美哈希(perfect Hash)实现对区文件的预先处理,避免哈希冲突导致的多次访存,降低流水线最坏情况下处理延迟,从而有效提升系统吞吐率并降低响应延迟.基于开源的FAST平台的实验结果表明,与通用的BIND9系统相比响应延迟降低了约10倍,吞吐量接近10 Gb链路线速,同时资源开销小且具有良好的可扩展性.
关键词 DNS; 权威服务器; 完美哈希; FPGA; 加速; DNS; authoritative server; perfect Hash; FPGA; accelerate;
Chenglong LI, Tao LI, Yuhao HAN, et al. Research on FPGA acceleration technology of DNS authoritative server. Sci Sin Inform, 2020, 50(4): 576-587, doi: 10.1360/N112019-00009
云端融合的工业互联网体系结构及关键技术
罗军舟, 何源, 张兰, 刘亮, 孙茂杰, 熊润群, 东方
中国科学: 信息科学, 2020, 50(2): 195-220
摘要 随着物联网、云计算和大数据等技术的发展,人类正迈入第四次工业革命时代.工业互联网作为建立在生产对象之间、对象与外部环境之间、对象与人之间高度协同、共享智能的全球性网络,是实现这场革命的核心.然而目前对工业互联网的研究大多局限在物联网、云计算和大数据等各自辖域,其云端协同尚处于"感、联、知、控"的初级阶段,尤其缺乏云端融合、共享智能的体系结构及关键技术,无法应对其中感知对象更加复杂、联网实体更加多元、数据处理更加快速、反馈控制更加智能等需求.为此,本文首先重点调研和归纳了该研究领域所涉及的几个重要方向的研究现状和面临挑战;在此基础上,提出一个云端融合的工业互联网新型体系结构及相关关键技术的解决方案;之后,针对智能制造领域的具体应用场景,将所提相关技术进行应用;最后,总结全文并展望了云端融合的工业互联网未来发展趋势.
关键词 工业互联网; 云端融合; 体系结构; 云计算; 大数据; industrial Internet; synergy of cloud and client; architecture; cloud computing; big data;
Junzhou LUO, Yuan HE, Lan ZHANG, et al. The architecture and key technologies for an industrial Internet with synergy between the cloud and clients. Sci Sin Inform, 2020, 50(2): 195-220, doi: 10.1360/N112019-00005
云计算与大数据国家重点研发专项专题
多模态力触觉交互技术及应用
宋爱国, 田磊, 倪得晶, 秦欢欢
中国科学: 信息科学, 2017, 47(9): 1183-1197
云计算与大数据国家重点研发专项专题
云端融合的神经系统疾病多通道辅助诊断研究
李洋, 黄进, 田丰, 韩冬奇, 范俊君, 陈辉, 彭晓兰, 戴国忠, 王宏安
中国科学: 信息科学, 2017, 47(9): 1164-1182
云计算与大数据国家重点研发专项专题
低熵云计算系统
徐志伟, 李春典
中国科学: 信息科学, 2017, 47(9): 1149-1163
云计算与大数据国家重点研发专项专题
面向云际计算的自主对等协作环境
史佩昌, 王怀民, 郑子彬, 尹浩
中国科学: 信息科学, 2017, 47(9): 1129-1148
高性能科学计算若干前沿问题研究专刊
中子输运Sn算法及其应用
阳述林, 魏军侠, 洪振英, 刘会坡
中国科学: 信息科学, 2016, 46(10): 1510-1526
高性能科学计算若干前沿问题研究专刊
矩方法在动理学中的发展与应用
蔡振宁, 樊玉伟, 胡志成, 李若, 王何宇
中国科学: 信息科学, 2016, 46(10): 1465-1488
高性能科学计算若干前沿问题研究专刊
并行自适应有限元软件平台PHG及其应用
张林波, 郑伟英, 卢本卓, 崔涛, 冷伟, 林灯
中国科学: 信息科学, 2016, 46(10): 1442-1464
高性能科学计算若干前沿问题研究专刊
第一原理实空间并行自适应计算程序设计原理
戴小英, 周爱辉
中国科学: 信息科学, 2016, 46(10): 1421-1441
高性能科学计算若干前沿问题研究专刊
求解大规模稀疏线性代数方程组序列的自适应AMG预条件策略
徐小文, 莫则尧, 安恒斌
中国科学: 信息科学, 2016, 46(10): 1411-1420
高性能科学计算若干前沿问题研究专刊
并行算法与并行编程: 从个性、共性到软件复用
莫则尧, 张爱清, 刘青凯, 曹小林
中国科学: 信息科学, 2016, 46(10): 1392-1410
高性能科学计算若干前沿问题研究专刊
纳米集成电路互连线建模和光刻仿真中的大规模并行计算方法
朱恒亮, 曾璇, 崔涛, 严昌浩, 张林波
中国科学: 信息科学, 2016, 46(10): 1372-1391
高性能科学计算若干前沿问题研究专刊
波源转移区域分解算法: 时谐弹性波方程
陈志明, 崔涛, 向雪霜
中国科学: 信息科学, 2016, 46(10): 1359-1371
支持容错的轻量级可验证隐私保护传染病监测数据聚合方案
杨小东, 杨兰, 魏丽珍, 杜小妮, 王彩芬
中国科学: 信息科学, 2024, 54(11): 2589-2605
摘要 随着各种流行传染病在全球频繁暴发,传染病监测在阻止传染病传播方面发挥着至关重要的作用.隐私保护数据聚合技术常用于避免传染病监测数据传输造成的用户隐私泄露问题.然而,现有的数据聚合方案仍然具有一些安全问题,如聚合节点不可信等.为了解决这些问题,本文提出了一个支持容错的轻量级可验证隐私保护传染病监测数据聚合方案.首先,使用基于CRT (Chinese remainder theorem)改进的Paillier同态加密系统和支持批量验证的签名算法分别对传染病数据进行高效加密和签名,以保护数据传输过程中的数据隐私和数据完整性.其次,使用承诺机制解决聚合节点不可信的问题.此外,本方案支持容错,即使某些用户和聚合节点没有按时地上传数据,聚合工作依然能够继续.特别地,本方案能够抵抗合谋攻击,满足更高的安全需求.由于本方案没有使用高耗时的计算操作,如双线性映射等,仿真实验证明本方案具有优秀的计算和通信开销,可以安全有效地应用于传染病检测系统.
关键词 传染病监测; 数据聚合; 隐私保护; 同态加密; 轻量级; infectious disease surveillance; data aggregation; privacy-preserving; homomorphic; lightweight
Xiaodong YANG, Lan YANG, Lizhen WEI, et al. Lightweight verifiable privacy-preserving infectious disease surveillance data aggregation scheme with fault tolerance. Sci Sin Inform, 2024, 54(11): 2589-2605, doi: 10.1360/SSI-2024-0228
日志重融合:应用程序日志完整性对抗攻击及其防御方法
陈昌骅, 万海, 赵曦滨
中国科学: 信息科学, 2024, 54(9): 2157-2180
摘要 在攻击调查领域,为应对依赖爆炸和语义鸿沟的挑战,日志融合通过引入多层级日志的丰富语义得到系统实体之间细粒度的因果关系,以逼近实际的执行历史.然而,由于审计日志的系统调用和应用日志的程序消息被用来推断复杂的系统状态,基于日志融合的攻击调查系统存在被对抗攻击的弱点,本文率先提出并称之为日志重融合攻击(log refusion attacks),其演示了攻击者如何增强实际漏洞来破坏日志完整性,绕过现有防御,破坏溯源中的联结并陷害良性用户.而后,本文提出一种攻击调查的新设计PRovGuARD (provenance guardian),它利用同时包含程序调用控制流和应用消息数据流的建模来交叉验证审计日志和应用日志的历史记录,以确保执行的合法性和一致性.如果攻击者毁损溯源数据,将检测到矛盾并告警,修正执行路径,得到正确的攻击根因和后果.本文在Linux上实现了原型,并在覆盖各类执行模型的14个实际应用场景及程序上进行了广泛评估.实验结果显示,其成功验证还原了正确的攻击故事,且平均性能开销比传统审计框架仅高3.62%,同时在最坏情况下只重新引入0.78%的错误依赖,证明了原型的有效性及其防御攻击的新颖性.
关键词 攻击调查; 对抗攻击; 日志融合; 控制流图; 数据流图; attack investigation; adversarial attack; log fusion; control flow graph; data flow graph
Changhua CHEN, Hai WAN, Xibin ZHAO. Log refusion: adversarial attacks against the integrity of application logs and defense methods. Sci Sin Inform, 2024, 54(9): 2157-2180, doi: 10.1360/SSI-2024-0042
全域哈希椭圆曲线签名
张方国
中国科学: 信息科学, 2024, 54(8): 1860-1870
摘要 椭圆曲线密码体制(elliptic curve cryptosystem, ECC)依然是当前应用最广泛的公钥密码体制,其安全核心是椭圆曲线离散对数问题.本文提出了椭圆曲线离散对数的强不动点问题.利用强不动点假设,在随机预言模型下证明了ECDSA (elliptic curve digital signature algorithm)的一个全域哈希变形方案是可以抵抗自适应选择消息下的存在伪造的.签名的聚合性质使得签名方案在诸如区块链、云存储等众多场景中发挥着重要作用,所以本文也讨论了这个全域哈希椭圆曲线签名方案的聚合性质.
关键词 椭圆曲线; 数字签名; 不动点; 加和多项式; 聚合签名; elliptic curve; digital signature; xed point; summation polynomial; aggregate signature
Fangguo ZHANG. Full domain Hash elliptic curve signature. Sci Sin Inform, 2024, 54(8): 1860-1870, doi: 10.1360/SSI-2024-0064
基于SM9的分层标识广播内积函数加密
李聪, 梁俊凯, 丁煜甲, 沈晴霓, 吴中海
中国科学: 信息科学, 2024, 54(6): 1400-1418
摘要 内积函数加密支持当使用一个与向量y相关的私钥解密一份与向量x相关的密文时,解密者仅能获得内积值?x, y?而无法获取任何其他信息.分层广播内积函数加密,则进一步具有密文向指定用户广播与密钥授权的性质. SM9标识加密是我国自主设计的一个商用密码标准,已被应用于物联网、医疗协同服务与电子政务等领域,但SM9标识加密算法及现有扩展算法均无法同时实现内积函数的功能与密文广播、密钥授权的性质,限制了SM9标识加密算法的适用场景.本文基于SM9标识加密算法设计了一个分层标识广播内积函数加密方案HIBB-IPFE-SM9.方案构造借鉴了Abdalla等的内积函数加密(PKC’15)与Liu等的分层广播加密(ACISP’14)的设计思想,解密算法仅包含两个双线性配对运算.本文还在随机谕言机模型中证明了方案满足选择明文安全性.最后,对提出方案与现有相关方案进行了对比分析,结果显示HIBB-IPFE-SM9方案在计算和通信开销上与相关方案是可比的.
关键词 内积函数加密; 分层广播加密; 标识密码; SM9; 选择明文安全; inner product functional encryption; hierarchical broadcast encryption; identity-based cryptography; CPA
Cong LI, Junkai LIANG, Yujia DING, et al. Hierarchical identity-based broadcast inner product functional encryption based on SM9. Sci Sin Inform, 2024, 54(6): 1400-1418, doi: 10.1360/SSI-2023-0232
分组密码FBC的差分分析
刘端, 罗毅博, 贾珂婷, 张国艳, 邹光南, 尤启迪, 陈颖
中国科学: 信息科学, 2024, 54(2): 335-353
摘要 FBC是一种轻量级分组密码算法,由于结构简单、软硬件实现灵活等优点成为2018年中国密码学会(CACR)举办的全国密码算法设计竞赛中晋级到第2轮的10个算法之一.FBC密码包含3个版本支持128和256两种比特长度的明文分组以及128和256两种比特长度的密钥,本文主要对分组长度128位的两个版本进行分析.我们基于SAT (Boolean satisfiability problem)模型对FBC的差分特征进行自动化搜索,得到了新的14轮差分路线,概率为2~(-102.25).基于此路线我们给出了18轮FBC128-128和20轮FBC128-256差分分析,并且在分析过程中给出了复杂度估计.对于18轮FBC128-128差分分析,时间复杂度和存储复杂度分别为2~(101.5)和2~(52).对于20轮FBC128-256差分分析时间复杂度和存储复杂度分别为2~(184)和2~(96).
关键词 分组密码; 差分分析; FBC 算法; 布尔可满足性问题; block cipher; differential cryptanalysis; FBC; Boolean satisfiability problem
Duan LIU, Yibo LUO, Keting JIA, et al. Differential analysis of block cipher FBC. Sci Sin Inform, 2024, 54(2): 335-353, doi: 10.1360/SSI-2023-0189
基于区块链构建安全去中心化的联邦学习方案
王恺祺, 洪睿琦, 毛云龙, 仲盛
中国科学: 信息科学, 2024, 54(2): 316-334
摘要 联邦学习甫一问世便得到了广泛的关注,被认为是一种具有广阔前景的分布式机器学习范式.然而,传统联邦学习方案基于中央服务器的集中式设计,在效率和可扩展性上存在不足.此外,集中式设计需要有可信的中央节点协调参与者完成训练,可能导致信任和可靠性的问题,例如中央服务器被操控或是出现单点故障.为了解决上述问题,相关领域的研究人员提出了基于区块链的去中心化联邦学习方案.去中心化联邦学习修补了传统集中式联邦学习的缺陷,但与此同时也引入了全新的攻击面.具体而言,由于区块链将网络中节点发起的全部事务保存在一个公开共享的数字账本,所有区块链节点都可以获取联邦学习参与者每轮的本地训练模型副本.这一现象严重地侵害了参与者的数据隐私和自身利益.在上述困境的驱动下,本文提出了一种安全去中心化联邦学习的可行方案,能够同时解决联邦学习参与者的数据机密性问题和学习公平性问题.区别于此前的研究工作,还提出了一种基于区块链的联邦学习的生产–消费模型,用于在模型安全聚合过程中审查参与者的本地行为,防止出现参与者不劳而获或是虚假训练的情况,在此基础上本文提出APoS共识机制,提供一种激励与审查机制,确保参与者在联邦学习的过程中倾向于选择诚实的训练.
关键词 联邦学习安全; 去中心化网络; 区块链; 数据消费; 激励机制; secure federated learning; decentralized network; blockchain; data consumption; incentives
Kaiqi WANG, Ruiqi HONG, Yunlong MAO, et al. Secure solution for decentralized federated learning with blockchain. Sci Sin Inform, 2024, 54(2): 316-334, doi: 10.1360/SSI-2023-0083
可验证布隆过滤器: 加速区块链中的不存在查询与证明
徐松松, 过晓冰, 徐恪
中国科学: 信息科学, 2023, 53(12): 2386-2405
摘要 传统基于区块链的“真实存储”系统在过滤“无效查询请求”时忽略了提供“不存在证明”,恶意节点可以随时对指定用户发动拒绝服务攻击.本文提出了可验证布隆过滤器的一种构建方式,基于布隆过滤器快速过滤无效查询请求的同时能有效提供证据证明数据不存在;此外,针对证明过程中可能造成的隐私泄露问题,本文提出了“隐秘的可验证布隆过滤器”和“数据混淆”两种方式,前者确保每个“不存在证明”只会泄露布隆过滤器的一位置零位,减少了数据泄露量;后者则是在前者的基础上进一步降低用户从泄露的布隆过滤器中推测出真实内容准确率.实验数据表明,当无效查询请求量占比为35%时,读取性能提升大约30%;当无效查询请求量占比为95%时,读取性能可提升十倍以上.
关键词 区块链; 可验证布隆过滤器; 可认证数据结构; 不存在证明; 隐私保护; blockchain; veri able Bloom lter; authenticated data structure; nonexistence proof; privacy preserving
Songsong XU, Xiaobing GUO, Ke XU. Verifiable Bloom filter (VBF): accelerate the query and proof of nonexistent data in a blockchain. Sci Sin Inform, 2023, 53(12): 2386-2405, doi: 10.1360/SSI-2023-0048
基于深度强化学习的算力网络主动防御方法
张焘, 许长桥, 连一博, 康嘉文, 况晓辉
中国科学: 信息科学, 2023, 53(12): 2372-2385
摘要 算力网络旨在深度融合算力资源与网络资源,实现多种资源的高效协同,最大化资源利用率.算力网络边缘部分通常采用分布式软件定义网络架构,构建逻辑集中但物理分散的控制平面,并将其与数据平面分离,实现全网算力资源与网络资源的统一调度与编排.然而,攻击者极易将控制平面作为首要攻击目标,发起分布式拒绝服务攻击(distributed denial of service, DDoS),使控制平面大面积失效,严重影响计算任务的实时传输.为了解决算力网络中的安全问题,本文创新性地提出了基于深度强化学习的算力网络主动防御方法.首先,构建了马尔可夫决策过程(Markov decision process, MDP)模型来准确表征交换机与控制器映射关系的动态性,并设计了一种基于节点介数的奖励函数来反映DDoS攻击对控制器部署方案的影响.其次,综合考虑多种网络约束,将多控制器部署问题建模为约束满足问题,其可行解空间即为MDP模型的动作空间.最后,提出了一种基于深度强化学习的主动防御算法,迭代优化动作选择策略,智能化选择多控制器部署方案.实验结果表明,该方法在网络性能几乎无损的前提下,相比基准方法能够分别提升13%和8%的防御成功率.
关键词 算力网络; 分布式软件定义网络; 主动防御; 分布式拒绝服务攻击; 深度强化学习; computing power network; distributed software-defined network (SDN); moving target defense; distributed denial of service (DDoS); deep reinforcement learning
Tao ZHANG, Changqiao XU, Yibo LIAN, et al. Deep reinforcement learning-based moving target defense method in computing power network. Sci Sin Inform, 2023, 53(12): 2372-2385, doi: 10.1360/SSI-2023-0004
物联网云服务中API滥用的风险分析与检测
袁斌, 郑开民, 万俊, 邹德清, 金海
中国科学: 信息科学, 2023, 53(12): 2355-2371
摘要 近年来,物联网技术的蓬勃发展带动了智能家居应用的快速发展,越来越多的智能家居平台开放各种应用程序接口,以方便用户实现自定义的智能家居应用,如设备联动控制.然而,这些开放接口中存在的安全缺陷也成为影响智能家居系统安全的重要因素之一.本文针对SmartThings智能家居平台的开放接口进行研究,发现了一系列新的具有安全缺陷的接口,并通过概念验证实验证实了其安全风险.为提升智能家居平台的安全性,设计并实现了检测智能家居云服务中接口滥用行为的工具SmartNotify.实验结果表明, SmartNotify能快速且准确地识别利用安全缺陷接口进行攻击的智能家居应用.
关键词 物联网安全; 智能家居安全; SmartThings平台; 开放接口; 云服务; IoT security; smart home; SmartThings platform; open interface; cloud service
Bin YUAN, Kaimin ZHENG, Jun WAN, et al. Risk assessment and detection of API abuse in the IoT cloud. Sci Sin Inform, 2023, 53(12): 2355-2371, doi: 10.1360/SSI-2022-0466
数据推断: 信息物理融合系统数据泄露威胁范式和防御方法
刘烃, 王子骏, 刘杨, 周亚东, 吴江, 鲍远义, 吴桐, 管晓宏
中国科学: 信息科学, 2023, 53(11): 2152-2179
摘要 随着计算单元和物理对象的高度集成,信息系统和物理系统正逐渐耦合发展为信息物理融合系统(cyber-physical system, CPS).根据CPS物理系统的客观规律,或业务流程间的复杂关联关系,CPS数据之间存在相互推断的可能;当出现从低安全域数据向高安全域数据的准确推断途径时,将引发推断型数据泄露威胁.本文通过分析数据推断引发的CPS数据泄露事件,从数据窃取和数据推断两个维度,提出数据泄露威胁的范式;将数据推断归纳为3类问题:状态估计问题、参数辨识问题和盲源分离问题,从模型驱动、数据驱动和数据–模型双驱动的角度,总结了数据推断的方法和算法.以电力市场为例,展示了基于公开电价数据推断电力系统关键参数的过程,验证了数据推断可以引发严重CPS数据泄露威胁.同时,分析了现有数据保护方法应对数据推断攻击时面临的挑战,探讨了CPS数据推断防御和数据安全治理的研究方向.
关键词 数据安全; 信息物理融合系统; 数据泄露威胁范式; 数据推断; data security; cyber-physical system; CPS; data leakage threat paradigm; data inference
Ting LIU, Zijun WANG, Yang LIU, et al. Data inference: data leakage paradigms and defense methods in cyber-physical systems. Sci Sin Inform, 2023, 53(11): 2152-2179, doi: 10.1360/SSI-2022-0362
面向移动边缘计算的广播身份认证协议
周彦伟, 许渊, 杨波, 顾纯祥, 夏喆, 张明武
中国科学: 信息科学, 2023, 53(9): 1734-1749
摘要 随着无线通信技术在各领域的普及,基于该技术演进的移动边缘计算(mobile edge computing,MEC)引起了诸多研究者的关注.在MEC中,为确保边缘节点接入过程的安全性,近年来多个身份认证协议相继被提出,然而上述传统方案仅支持一对一的身份合法性认证,即实现了一个边缘节点与一个边缘服务器间的相互认证.由于需要通过重复认证操作以满足边缘节点在多个边缘服务器间的迁移需求,导致传统协议的工作效率较低、用户的通信体验欠佳.针对传统协议无法高效地解决MEC中边缘节点的移动性问题,本文基于无证书公钥密码体制,提出支持广播通信的身份认证机制,实现一个边缘节点同时与多个边缘服务器完成身份合法性认证的目标,确保边缘节点在多服务器间迁移过程的服务连贯性,提高MEC环境下的身份认证效率.此外,在随机谕言机模型下,基于离散对数问题和计算性Diffie-Hellman问题分别证明了本文协议中通信消息的不可伪造性和协商密钥的安全性;同时使用形式化分析工具ProVerif对协议的安全性进行了模拟验证,结果表明本文协议具有其所声称的安全性.与现有传统方案的性能对比结果表明本文协议具有更优的计算效率,更加适合在MEC等终端计算资源受限的网络环境下部署.
关键词 身份认证; 移动边缘计算; 无证书密码机制; 可证明安全性; identity authentication; mobile edge computing; certificateless cryptography; provably security
Yanwei ZHOU, Yuan XU, Bo YANG, et al. Broadcast identity authentication scheme for mobile edge computing. Sci Sin Inform, 2023, 53(9): 1734-1749, doi: 10.1360/SSI-2022-0419
基于同态加密的医疗数据密文异常检测方法
李腾, 方保坤, 马卓, 沈玉龙, 马建峰
中国科学: 信息科学, 2023, 53(7): 1368-1391
摘要 为了避免电子健康数据(electronic health records, EHRs)在异常检测过程中泄漏患者信息和诊断结果等问题,针对医院与患者敏感数据的隐私保护,提出了一种基于CKKS全同态加密的EHRs异常检测隐私保护模型.将医院以及患者的EHRs由CKKS算法实现浮点数同态加密,设计一个基于密文比较算法的协议,通过可信密钥服务器与第三方数据中心之间的通信建立密文态孤立森林模型.并利用CKKS算法的SIMD技术,实现密文数据在孤立森林模型上的异常检测,最终返回密文结果.理论分析和实验结果表明,所提出的方案能够保证EHRs的隐私安全.并且在不同的EHRs数据集上验证,该模型优于传统的明文异常检测算法和同类型密文异常检测算法,且在密文态上能够保持和明文孤立森林算法相近的检测效率,有较好的异常检测效果.
关键词 同态加密; 孤立森林; 异常检测; 隐私保护; 密文比较; homomorphic encryption; isolation forest; anomaly detection; privacy protection; ciphertext comparison;
Teng LI, Baokun FANG, Zhuo MA, et al. Homomorphic encryption-based ciphertext anomaly detection method for e-health records. Sci Sin Inform, 2023, 53(7): 1368-1391, doi: 10.1360/SSI-2022-0214
用于大状态分组密码的深度学习辅助密钥恢复框架
陈怡, 包珍珍, 申焱天, 于红波
中国科学: 信息科学, 2023, 53(7): 1348-1367
摘要 深度学习辅助密钥恢复攻击是2019年International Cryptology Conference (CRYPTO)上提出的一项全新密码分析技术.针对该技术至今无法应用于大状态分组密码的缺陷,本文提出了一种深度学习辅助的多阶段密钥恢复框架.该框架的核心是找到一个神经区分器组合,分阶段进行密钥恢复攻击.本文首先针对Speck的大状态成员分别训练了一组神经区分器,通过在该框架下利用区分器组合,设计并执行了实际密钥恢复攻击,证实了该框架的有效性.然后,提出了一种在低概率差分中寻找中性比特的方法,来把实际攻击扩展成覆盖更长轮数的理论攻击.最终,针对缩减轮Speck的最大状态成员取得了更好的密钥恢复攻击.这项工作为使用深度学习对更多分组密码进行密码分析铺平了道路.本文的验证代码已开源至https://github.com/AI-Lab-Y/NAAF.
关键词 大状态分组密码; 深度学习; 密钥恢复攻击; 差分分析; Speck; large-state block ciphers; deep learning; key recovery attack; differential cryptanalysis; Speck;
Yi CHEN, Zhenzhen BAO, Yantian SHEN, et al. A deep learning-aided key recovery framework for large-state block ciphers. Sci Sin Inform, 2023, 53(7): 1348-1367, doi: 10.1360/SSI-2022-0298
基于层次结构的隐私多维分析查询算法
张啸剑, 周丹, 徐雅鑫, 林东岱, 纪守领, 孟小峰
中国科学: 信息科学, 2023, 53(6): 1111-1131
摘要 基于本地化差分隐私的多维分析查询(multi-dimensional analytical query, MDA)已得到了研究者的广泛关注.现有基于最优局部哈希(optimal local Hashing, OLH)机制与层次树结构的扰动方法存在泄露根结点隐私的风险.针对现有结合层次树结构的本地扰动机制不足,提出了一种有效且满足本地化差分隐私的MDA查询算法H4MDA (hierarchical structure for MDA),该算法充分利用层次树的横向与纵向结构特征设计了3种基于用户分组策略的本地扰动算法HGRR, LGRR-FD,LGRR.算法HGRR结合层次树横向结构与GRR机制本地扰动用户元组数据,通过摈弃根结点组合来响应MDA查询.不同于HGRR, LGRR-FD算法利用层次树的纵向结构与GRR机制扰动本地数据,同时通过添加假数据来避免叶子结点的隐私泄露. LGRR算法通过摈弃叶子结点层纵向扰动本地数据.收集者结合LGRR的扰动结果利用局部一致性处理技术重构层次树最后两层,通过添加虚拟叶子结点来响应MDA查询,而虚拟叶子结点计数之和等于其父节点计数. HGRR, LGRR-FD, LGRR算法与现有扰动算法在3种数据集上实验结果表明,其响应MDA查询的精度优于同类算法.
关键词 多维分析查询; 层次结构; 本地化差分隐私; 本地扰动; 随机应答机制; multidimensional analytical queries; hierarchical structure; local differential privacy; local perturbation; random response mechanism;
Xiaojian ZHANG, Dan ZHOU, Yaxin XU, et al. Answering private multidimensional analytical queries with hierarchical structure. Sci Sin Inform, 2023, 53(6): 1111-1131, doi: 10.1360/SSI-2022-0310
基于水声信道的隐蔽密钥协商方案
徐明, 冯赫鑫, 关佶红
中国科学: 信息科学, 2023, 53(6): 1096-1110
摘要 水声信道环境下,传统的密钥协商协议更容易遭受信息泄漏等安全威胁,而现有的隐蔽密钥协商协议由于受限于平方根定律,隐蔽通信速率不超过■.为解决上述难题,本文提出了一种基于水声信道的隐蔽密钥协商方案.在优先提取阶段,发送方以一定的功率向接收方发送均匀分布的随机消息,而接收方根据水下噪声方差信息,通过Gibbs采样计算出估计消息,并使用对数似然比检验获取初始密钥来减少消息传输时的不确定性和误比特率.信息调和阶段,发送方将伴随式发送给接收方,而接收方将接收到的伴随式与优先提取阶段得到的对数似然比序列进行联合解码来获得错误比特的位置信息,经过比特翻转后得到与发送方完全一致的最终密钥.通过假设检验理论和信息论,证明了方案的保密性、隐蔽性和可靠性.仿真结果表明,所提方案比现有方案性能有所提升.
关键词 水声信道; 隐蔽密钥协商; 优先提取; 信息调和; 对数似然比检验; underwater acoustic channel; covert secret-key agreement; advantage distillation; information reconciliation; log-likelihood ratio (LLR) test;
Ming XU, Hexin FENG, Jihong GUAN. Covert secret-key agreement scheme based on an underwater acoustic channel. Sci Sin Inform, 2023, 53(6): 1096-1110, doi: 10.1360/SSI-2022-0291
基于商用密码SM9的高效分层标识加密
赖建昌, 黄欣沂, 何德彪, 郭福春
中国科学: 信息科学, 2023, 53(5): 918-930
摘要 分层标识加密能有效减轻标识密码体制中密钥生成中心生成用户私钥和分发私钥的工作量.SM9标识密码作为我国商用密码行业标准和国家标准,在金融、政务等方面起着重要的作用,但SM9标识加密算法不具备分层加密的功能,不适合大规模网络的应用场景,阻碍了SM9加密算法的部署.本文基于商用密码SM9标识加密算法提出一个高效的分层标识加密方案SM9-HIBE.相比SM9标识加密算法,方案的密文只增加一个群元素,解密开销只增加一个双线性对运算,与接收者标识的长度无关.方案的安全性基于判定性BDHI困难问题,在随机谕言模型中可证明方案满足静态选择明文攻击模型下的不可区分性.最后,对方案进行比较分析,结果表明SM9-HIBE在计算开销和通信代价方面与现有HIBE方案是可比的.
关键词 分层加密; 标识密码; SM9; 密钥封装; 选择明文安全; hierarchical encryption; identity-based cryptography; SM9; key encapsulation; chosen-plaintext attack; CPA;
Jianchang LAI, Xinyi HUANG, Debiao HE, et al. Efficient hierarchical identity-based encryption based on SM9. Sci Sin Inform, 2023, 53(5): 918-930, doi: 10.1360/SSI-2022-0163
面向联邦学习的对抗样本投毒攻击
王波, 代晓蕊, 王伟, 于菲, 魏飞, 赵梦楠
中国科学: 信息科学, 2023, 53(3): 470-484
摘要 为了解决传统的机器学习中数据隐私和数据孤岛问题,联邦学习技术应运而生.现有的联邦学习方法采用多个不共享私有数据的参与方联合训练得到了更优的全局模型.然而研究表明,联邦学习仍然存在很多安全问题.典型地,如在训练阶段受到恶意参与方的攻击,导致联邦学习全局模型失效和参与方隐私泄露.本文通过研究对抗样本在训练阶段对联邦学习系统进行投毒攻击的有效性,以发现联邦学习系统的潜在安全问题.尽管对抗样本常用于在测试阶段对机器学习模型进行攻击,但本文中,恶意参与方将对抗样本用于本地模型训练,旨在使得本地模型学习混乱的样本分类特征,从而生成恶意的本地模型参数.为了让恶意参与方主导联邦学习训练过程,本文进一步使用了“学习率放大”的策略.实验表明,相比于Fed-Deepconfuse攻击方法,本文的攻击在CIFAR10数据集和MNIST数据集上均获得了更优的攻击性能.
关键词 联邦学习; 对抗样本; 投毒攻击; federated learning; adversarial example; poisoning attack;
Bo WANG, Xiaorui DAI, Wei WANG, et al. Adversarial examples for poisoning attacks against federated learning. Sci Sin Inform, 2023, 53(3): 470-484, doi: 10.1360/SSI-2022-0116
身份基加密机制的挑战后泄露容忍性
周彦伟, 王兆隆, 乔子芮, 杨波, 顾纯祥, 夏喆, 张明武
中国科学: 信息科学, 2023, 53(3): 454-469
摘要 现有的多数抗泄露加密机制的研究均假设敌手的泄露是来自收到挑战密文之前,并禁止敌手在挑战后进行泄露操作.然而,在现实中敌手往往是接触到密文数据后会通过各种手段获取相应密钥的泄露信息,因此挑战后的泄露容忍性更符合实际环境的真实应用需求.针对上述不足,本文将对身份基加密(identity-based encryption, IBE)机制的挑战后泄露容忍性展开研究,提出IBE机制熵泄露容忍性的属性要求和安全性定义;并在状态分离模型中联合熵泄露容忍的IBE机制和二源提取器设计抗挑战后泄露攻击的IBE机制,对上述构造在选择明文攻击下的安全性进行了形式化证明.此外,为了获得具有更优安全性的IBE机制,在上述构造的基础上,通过增加消息验证码设计选择密文攻击安全的挑战后泄露容忍的IBE机制.
关键词 挑战后泄露容忍性; 身份基哈希证明系统; 身份基加密机制; 熵泄露容忍性; after-the-fact leakage resilience; identity-based hash proof system; identity-based encryption; entropic leakage resilience;
Yanwei ZHOU, Zhaolong WANG, Zirui QIAO, et al. After-the-fact leakage resilience in identity-based encryption. Sci Sin Inform, 2023, 53(3): 454-469, doi: 10.1360/SSI-2022-0148
国密SM2加密算法的RCCA安全设计
陈荣茂, 王毅, 黄欣沂
中国科学: 信息科学, 2023, 53(2): 266-281
摘要 国密SM2密码算法已经成为保障我国网络信息系统安全自主可控的关键技术.然而近期研究发现, SM2加密算法在实际部署应用时面临高效的算法替换攻击.该种攻击可以从当前的密文预测下一次加密所使用的随机数,从而可以在不知道解密密钥的情况下成功解密后续密文.密码逆向防火墙技术已被证实可以有效抵抗该种攻击,但其要求密文具有可重随机性,与SM2加密算法本身所具备的CCA (chosen-ciphertext attack)安全性相冲突.针对该问题,本文改进SM2加密算法,构造了具有RCCA (可重放CCA)安全性的公钥加密方案.该方案具有与SM2加密算法近似的安全性,且同时支持密文重随机操作,因此可以有效兼容密码逆向防火墙.方案的设计遵循Phan等提出的OAEP三轮构造范式,结合SM2加密算法进行改进,并在随机预言机模型下给出了严谨的安全证明.本文提出了首个基于国密算法的可重随机RCCA公钥加密方案,研究结果有助于提升SM2密码算法在实际应用中的安全性.
关键词 SM2; 加密算法; RCCA; 可重随机性; 密码逆向防火墙; SM2; encryption; RCCA; rerandomizability; cryptographic reverse firewall;
Rongmao CHEN, Yi WANG, Xinyi HUANG. RCCA-secure public-key encryption based on SM2. Sci Sin Inform, 2023, 53(2): 266-281, doi: 10.1360/SSI-2022-0282
面向车联网的抗设备捕获认证密钥协商协议
姜奇, 杨雪, 王金花, 程庆丰, 马鑫迪, 马建峰
中国科学: 信息科学, 2022, 52(12): 2351-2370
摘要 随着汽车保有量的持续增长和道路交通的饱和,车联网被视为有效提高交通效率,改善驾乘体验的有效技术之一.认证密钥协商协议是保证车载单元(onboard unit, OBU)与各种信息服务器安全交互的关键手段.通常,认证密钥协商协议所需的密钥被存储于OBU中.然而,由于车辆常处于无人值守状态, OBU失盗事件时有发生.因此,如何确保私钥的存储安全是一个具有挑战性的难题.为了解决上述问题,本文提出了基于不经意伪随机函数(oblivious pseudorandom functions, OPRF)和两方协同签名的抗捕获认证密钥协商协议.借助于两方协同签名,私钥被分成两个部分,一部分使用辅助设备的公钥加密,另一部分通过OBU和辅助设备运行OPRF协议才能恢复.由于OBU中没有存储任何秘密信息,即使OBU被盗取,攻击者仍然无法获取私钥.本文对提出的方案进行了全面的安全性分析和性能比较.结果表明所提出的方案可以抵抗各种已知的攻击,特别是设备被捕获导致的密钥泄露.此外,所提出的方案可以实现计算开销和通信开销的平衡.
关键词 车联网; Schnorr协同签名; OPRF; 认证密钥协商; 抗设备捕获; Internet of vehicle; Schnorr collaborative signature; OPRF; authentication key agreement; capture resilient;
Qi JIANG, Xue YANG, Jinhua WANG, et al. Device capture resilient authentication and key agreement protocol for IoV. Sci Sin Inform, 2022, 52(12): 2351-2370, doi: 10.1360/SSI-2021-0379
一种基于PUF的可证明安全消息认证算法及应用
张效林, 谷大武
中国科学: 信息科学, 2022, 52(12): 2336-2350
摘要 消息认证码(message authentication code, MAC)是一种对称密码算法,能检查消息的完整性与来源合法性,可广泛用于各类信息系统.然而,当运行MAC算法的设备受到物理攻击时,攻击者可通过读取存储器或电路调试等手段获取算法密钥并生成合法的消息认证码,从而危害系统安全.为此,本文提出了PUF-MAC,一种基于物理不可克隆函数(physically unclonable function, PUF)和Hash函数的MAC算法. PUF是一种具有结构不可克隆性与输出不可预测性的数据映射实体,不同PUF实体映射间的差异来源于生产时物理环境的微小变化.通信双方可使用PUF生成共享密钥.在标准模型下,本文归约证明了PUF-MAC算法在适应性选择消息攻击下满足存在性不可伪造(existential unforgeability under chosen message attack, EUF-CMA),且算法的EUF-CMA安全性依赖于Hash的弱抗碰撞性以及PUF的EUF-CMA安全性.同时,本文基于PUF-MAC算法设计了一种满足前后向安全性的密钥协商方案和双向身份认证协议,体现了PUF-MAC良好的实用性.理论分析表明,与其他MAC算法相比, PUF-MAC结构轻量且实现简单,无需预先存储大量的PUF响应. PUF的引入使攻击者即使获取算法密钥,也无法生成合法的消息认证码,保证了通信系统的安全.
关键词 消息认证码; 密钥管理; 物理不可克隆函数; 身份认证; MAC; key management; PUF; authentication;
Xiaolin ZHANG, Dawu GU. A PUF-based provably secure message authentication algorithm and application. Sci Sin Inform, 2022, 52(12): 2336-2350, doi: 10.1360/SSI-2021-0261
基于国产密码SM2的实用公钥广播加密方案
陈泌文, 向涛, 何德彪, 黄欣沂
中国科学: 信息科学, 2022, 52(12): 2321-2335
摘要 近年来网络攻击与数据泄露事件层出不穷,网络安全受到国家及相关部门的高度关注.国产密码算法作为保障我国网络与信息安全的关键技术,推动其应用与实施既符合构建我国网络强国的战略需求,又能保障实际应用的健康发展. SM2公钥加密算法是我国自主设计的国产商用密码之一,可有效保障数据在通信过程中的安全性.然而,经典SM2公钥加密算法适合“一对一”通信场景,在“一对多”通信场景中需承担较大的计算与通信开销.为提升SM2公钥加密算法在“一对多”通信场景中计算与通信效率,扩展我国商用密码的应用范围,本文将我国商用密码SM2公钥加密算法和广播加密概念相结合,利用Diffie-Hellman密钥交换和多项式秘密分享的思想,设计了基于SM2的公钥广播加密方案.所构造方案最大程度地保留原有SM2公钥加密算法结构,通过简单地扩展即可实现在多用户场景下消息安全广播的自主可控.与现有广播加密方案相比,所构造方案的系统参数大小与接收者数量无线性关系,以及系统无需指定数据发送者广播消息.所构造方案的安全性分析表明,本文方案与SM2公钥加密算法具有相同安全强度.理论分析与实验仿真表明,所构造方案具有较好的性能,显著增强了我国商用密码的实用性.
关键词 公钥加密; SM2公钥密码算法; 广播加密; Diffie-Hellman密钥协商; publi-key encryption; SM2 public key cryptography; broadcast encryption; Diffie-Hellman key exchange;
Biwen CHEN, Tao XIANG, Debiao HE, et al. An efficient public-key broadcast encryption scheme based on SM2. Sci Sin Inform, 2022, 52(12): 2321-2335, doi: 10.1360/SSI-2021-0424
满足本地化差分隐私的推荐系统中隐私预算的优化设置
暴婷, 徐蕾, 祝烈煌, 王丽宏
中国科学: 信息科学, 2022, 52(8): 1481-1499
摘要 推荐系统可帮助用户从众多的数据中发现用户所需数据,与此同时,上传用户原始数据给服务器也可能泄露用户隐私.本文使用本地化差分隐私技术为推荐系统中的用户数据提供隐私保护.在本地化差分隐私模型中,隐私预算控制用户数据的隐私保护程度,较高的隐私预算通常意味着较高的分析准确性.为在最小化隐私损失的同时最大化推荐准确性,我们将隐私预算设置问题建模为多臂赌博机问题,并提出基于置信度上界的学习策略帮助用户选择最优的隐私预算.考虑到用户对不同数据的敏感程度不同,我们对学习策略进行了改进.真实数据集上的实验结果表明,所提策略可以帮助用户选出合适的隐私预算,可有效提高用户的累计收益.
关键词 推荐系统; 本地化差分隐私; 隐私预算; 强化学习; 多臂赌博机; recommendation system; local differential privacy; privacy budget; reinforcement learning; multiarmed bandit;
Ting BAO, Lei XU, Liehuang ZHU, et al. Optimized setting of privacy budget in a recommendation system with local differential privacy. Sci Sin Inform, 2022, 52(8): 1481-1499, doi: 10.1360/SSI-2021-0304
基于序列特征提取的溯源图上APT攻击检测方法
梁若舟, 高跃, 赵曦滨
中国科学: 信息科学, 2022, 52(8): 1463-1480
摘要 在真实场景,特别是工业场景下的高级持续性威胁(advanced persistent threat, APT)具有复杂性和长期性,但当前方法无法有效提取攻击中的长期关联关系.针对这一问题,本文提出一种基于溯源图的APT攻击检测方法 SeqNet. SeqNet采用序列特征提取方式,实现APT攻击检测.在SeqNet中,首先将描述系统运行状态的溯源图序列转化为特征向量序列,然后使用GRU (gate recurrent unit)模型提取系统状态变化特征,并使用结合局部注意力机制的编解码器模型训练GRU模型,最后利用K-means聚类方法对系统正常行为进行建模.本文在5个公开数据集StreamSpot, wget, shellshock,ClearScope和CADETS上进行了实验,并与当前具有代表性的方法进行了对比.本文方法在5个数据集上都取得了相似或更好的效果.实验结果证明本文方法能够实现真实场景下的APT攻击检测.
关键词 APT攻击检测; 溯源图; 异常检测; 序列特征提取; 局部注意力机制; APT attack detection; provenance graphs; anomaly-based detection; sequence feature extraction; local attention mechanism;
Ruozhou LIANG, Yue GAO, Xibin ZHAO. Sequence feature extraction-based APT attack detection method with provenance graphs. Sci Sin Inform, 2022, 52(8): 1463-1480, doi: 10.1360/SSI-2021-0252
云与用户之间交互式抗屏摄密文水印协议
董晓娟, 张卫明, 方涵, 俞能海
中国科学: 信息科学, 2022, 52(7): 1272-1286
摘要 现有的云存储服务普遍推出了浏览文件的功能,这为用户通过拍摄屏幕上的文件来窃取信息带来极大的便利,同时也加重了信息泄露的风险.因此,用户通过拍照窃取信息对云存储服务来说是一个潜在的安全性问题.现有的办法是云端在推送图像至用户端前,先嵌入与用户身份相关的抗屏摄水印,那么云端能从拍摄的图像检测到水印,发现用户身份.然而云端和用户端都有含用户水印的图像,我们无法确认被泄露的图像是从云端流出的还是从用户端流出的.为了消除泄露源的二义性,使用密文水印,云端将用户的密文水印嵌入到明文图像,生成含用户水印的密文图像.只有用户端能将之解密,获得相应的明文图像.一旦该图像被偷拍泄露,我们可断定该图像一定是从用户端流出的.但是目前的抗屏摄水印算法不支持上述功能,仅支持明文水印的嵌入.为此,本文提出一个云与用户之间的抗屏摄密文水印协议,旨在保护版权用户对其图像的版权,防止使用图像的用户通过偷拍窃取图像.通过理论分析和仿真实验,本文验证了所提出协议在实施过程中的安全性和有效性.
关键词 云存储; 密文水印协议; 抗屏摄水印; 版权保护; 泄露追踪; cloud storage; ciphertext watermark protocol; screen-shooting resilient watermark; copyright protection; leakage tracking;
Xiaojuan DONG, Weiming ZHANG, Han FANG, et al. Interactive screen-shooting resilient ciphertext watermarking protocol between the cloud and the user. Sci Sin Inform, 2022, 52(7): 1272-1286, doi: 10.1360/SSI-2021-0213
基于区块链和去中心不可否认属性签名的分布式公钥基础设施方案
袁和昕, 刘百祥, 阚海斌, 陈泽宁
中国科学: 信息科学, 2022, 52(6): 1135-1148
摘要 灵活有效的身份体制方案一直是信息时代的核心需求之一.传统的中心化公钥基础设施存在诸多缺陷,而已有的运行在区块链上的分布式的公钥基础设施同样存在诸如性能、鲁棒性、不可否认性、身份灵活性等方面的问题.本文创新地将区块链与去中心不可否认属性签名结合,提出一种新型分布式公钥基础设施方案,方案利用门限算法和属性签名对身份进行细粒度的管理,并引入非交互式零知识证明使得证书具有不可否认的性质,利用区块链的共识机制进行证书库的同步以实现分布式的身份认证.本文通过实验仿真和分析并结合具体场景,证明了该方案在安全性和可用性上都满足实际落地的需求.
关键词 区块链; 公钥基础设施; 属性签名; 门限算法; 零知识证明; 身份认证; blockchain; public key infrastructure; attribute-based signature; threshold algorithm; zero-knowledge proof; identity authentication;
Hexin YUAN, Baixiang LIU, Haibin KAN, et al. Distributed public key infrastructure scheme based on blockchain and decentralized undeniable attribute-based signature. Sci Sin Inform, 2022, 52(6): 1135-1148, doi: 10.1360/SSI-2021-0177
中本聪共识安全性质研究方法
周子钰, 张宗洋, 刘建伟
中国科学: 信息科学, 2022, 52(5): 837-855
摘要 中本聪共识是区块链共识机制中最基础和研究最广泛的一种共识机制,其安全性对整个区块链领域的发展具有重要的理论意义和应用价值.现有大量研究在各种模型假设下对中本聪共识进行了安全性分析和证明.本文首先详细描述了中本聪共识的执行模型,包括时间模型、网络模型、敌手模型等.其次,系统总结了中本聪共识安全性的形式化定义.再次,根据时间模型将中本聪共识研究方法分为基于离散时间模型和连续时间模型两类,并指出不同方法的优缺点.最后对中本聪共识的安全性研究进行展望,旨在为区块链共识机制的研究提供技术支撑.
关键词 中本聪共识; 区块链; 安全性证明; 数字货币; 工作量证明; Nakamoto consensus; blockchain; proof of security; cryptocurrency; proof-of-work;
Ziyu ZHOU, Zongyang ZHANG, Jianwei LIU. Methods of security analysis for Nakamoto consensus. Sci Sin Inform, 2022, 52(5): 837-855, doi: 10.1360/SSI-2021-0225
抗泄露的无证书密钥封装机制及应用
周彦伟, 杨波, 乔子芮, 夏喆, 张明武
中国科学: 信息科学, 2021, 51(12): 2119-2133
摘要 泄露攻击的出现,导致在传统理想安全模型下已证明安全的密码机制在实际应用中不再保持其所声称的安全性;并且现有基于双线性映射构造的抗泄露无证书密钥封装机制(certificateless keyencapsulation mechanism, CL-KEM)的计算效率较低.针对上述不足,在不使用双线性映射的前提下本文设计了抗连续泄露的CL-KEM,并基于经典的判定性Diffie-Hellman假设对构造的安全性进行形式化证明.在我们的CL-KEM实例中,封装密文的所有元素对敌手而言是随机的,确保任意敌手均无法从封装密文中获知关于用户私钥的泄露信息;并且泄露参数是固定的常数,不受封装密钥空间大小的限制.为了进一步增强CL-KEM的抗泄露攻击的能力,本文构造了一个泄露量达到l_(sk)(1-O(1))的新颖抗泄露CL-KEM,其中l_(sk)表示私钥的长度,分析表明该机制在具有上述优势的同时,将抵抗泄露攻击的能力提升到最佳.最后,基于抗泄露CL-KEM提出抗泄露无证书混合加密机制和抗泄露无证书密钥协商协议的通用构造方法.
关键词 无证书公钥密码; 密钥封装机制; 泄露容忍; 连续泄露容忍; DDH安全性假设; certificateless public-key cryptography; key-encapsulation mechanism; leakage resilience; continuous leakage resilience; DDH security assumption;
Yanwei ZHOU, Bo YANG, Zirui QIAO, et al. Leakage-resilient certificateless key-encapsulation mechanism and application. Sci Sin Inform, 2021, 51(12): 2119-2133, doi: 10.1360/SSI-2021-0001
国密SM9数字签名和密钥封装算法的安全性分析
赖建昌, 黄欣沂, 何德彪, 伍玮
中国科学: 信息科学, 2021, 51(11): 1900-1913
摘要 安全性分析为密码方案的安全性提供重要依据和有力保障.我国自主设计的商用标识密码SM9已成为国家标准,其中, SM9数字签名算法和加密算法已成为ISO/IEC国际标准.然而,现有关于SM9标识密码算法安全性分析的公开发表研究成果较少. Cheng在Inscrypt 2018基于Gap-q-BCAA1假设,给出了SM9密钥交换协议、密钥封装机制和公钥加密算法的安全性证明.本文首先基于q-SDH假设和随机谕言模型,证明SM9数字签名算法具有EUF-CMIA的安全性.其次,为了消除对Gap类困难假设的依赖,采用Twin-Hash-ElGamal技术,提出基于SM9密钥封装机制的新型密钥封装机制Twin-SM9.与SM9密钥封装机制相比, Twin-SM9的系统公钥和用户私钥分别增加了一个群元素,而封装密文长度保持不变.在随机谕言模型中证明,若q-BDHI假设成立,则Twin-SM9密钥封装机制满足IND-CCA.然后进一步阐明了SM9标识密码的安全性,研究结果有助于基于SM9的高级密码协议和算法的设计与分析.
关键词 SM9; 安全性分析; 数字签名; 密钥封装; CCA; SM9; security analysis; digital signature; key encapsulation; CCA;
Jianchang LAI, Xinyi HUANG, Debiao HE, et al. Security analysis of SM9 digital signature and key encapsulation. Sci Sin Inform, 2021, 51(11): 1900-1913, doi: 10.1360/SSI-2021-0049
基于轻量级区块链的隐私保护传染病监测数据聚合
胡柏吉, 李元诚, 房方, 商兴宇
中国科学: 信息科学, 2021, 51(11): 1885-1899
摘要 随着COVID-19在全球肆虐,传染病监测有利于阻止传染病传播.而保护监测系统中病人以及数据提供者的隐私能免除他们对隐私信息泄露的顾虑,从而提高系统的数据采集能力.本文提出了一个基于区块链的传染病监测数据聚合方案(lightweight-blockchain based privacy-preserving data aggregation scheme, LBPDA),可以在不依赖可信第三方的情况下对数据进行聚合.特别地,为了保护数据聚合过程中数据隐私,采用基于Paillier密码系统的加法同态性来聚合病例数据.此外,为了减少时间开销和存储开销,对使用的Hyperledger Fabric联盟区块链平台进行了改进,从而轻量化数据聚合过程.我们对提出的方案进行了仿真,并进行安全性和性能分析以验证提出方案的可行性和有效性.结果显示,提出的方案能满足政府部门在聚合病例数据用于传染病监测的同时保护病人和数据提供者的隐私的需求.此外,通过对比也证明本文对区块链的轻量化是有效的.
关键词 区块链; 传染病监测; 隐私保护数据聚合; Paillier密码系统; Hyperledger Fabric; blockchain; epidemic disease surveillance; privacy-preserving data aggregation; Paillier cryptosystem; Hyperledger Fabric;
Baiji HU, Yuancheng LI, Fang FANG, et al. Lightweight-blockchain based privacy-preserving data aggregation for epidemic disease surveillance. Sci Sin Inform, 2021, 51(11): 1885-1899, doi: 10.1360/SSI-2021-0002
一种基于区块链的隐私保护异步联邦学习
高胜, 袁丽萍, 朱建明, 马鑫迪, 章睿, 马建峰
中国科学: 信息科学, 2021, 51(10): 1755-1774
摘要 联邦学习能够在保障本地数据隐私前提下利用分布式数据和计算资源实现机器学习模型联合训练.现有异步联邦学习有效解决了同步联邦学习所存在的计算资源浪费、训练效率低等问题.然而,现有异步联邦学习通过聚合不同节点训练得到局部模型,并通过中心服务器完成全局模型更新,内生性地受制于中心化信用模式,存在单点失效、隐私泄露等问题.为此,提出了一种基于区块链的隐私保护异步联邦学习,通过上链局部模型并通过共识算法生成全局模型,保证异步联邦学习的可信性.为了保证联邦学习的隐私性,同时提高模型效用,提出利用差分隐私中的指数机制以高概率选择贡献度高的模型梯度,并分配较低的隐私预算以保证局部模型的隐私性.另一方面,针对异步联邦学习时钟不同步问题,提出了双因子调整机制进一步提高全局模型效用.最后,理论分析与实验结果表明所提出的方案能有效保证异步联邦学习的可信性和隐私性,同时提高了模型效用.
关键词 联邦学习; 区块链; 差分隐私; 模型效用; 异步训练; federated learning; blockchain; differential privacy; model utility; asynchronous training;
Sheng GAO, Liping YUAN, Jianming ZHU, et al. A blockchain-based privacy-preserving asynchronous federated learning. Sci Sin Inform, 2021, 51(10): 1755-1774, doi: 10.1360/SSI-2021-0087
移动边缘计算中基于位置信息的安全skyline查询处理方法
王缵, 丁晓锋, 周潘, 田有亮, 金海
中国科学: 信息科学, 2021, 51(10): 1721-1737
摘要 针对移动边缘计算下查询的效率和安全问题,本文开展了面向位置信息的移动边缘计算安全skyline查询的研究.首先,提出了移动边缘计算场景下的安全skyline查询框架;其次,针对边缘服务器资源受限的特性,设计了新颖且统一的轻量级安全索引结构;然后,考虑云边协同中的隐私问题,提出了基于移动边缘计算的安全skyline查询协议.安全性分析表明该协议在半诚实模型下是安全的.同时,实验评估发现其比现有协议具有更高的查询效率.
关键词 安全skyline查询; 位置信息; 移动边缘计算; 安全索引; 半诚实模型; secure skyline queries; location-based data; mobile edge computing; secure index; semi-honest model;
Zuan WANG, Xiaofeng DING, Pan ZHOU, et al. Secure skyline query processing in mobile edge computing over location-based data. Sci Sin Inform, 2021, 51(10): 1721-1737, doi: 10.1360/SSI-2020-0395
基于区块链和去中心可追踪属性签名的可控匿名认证方案
方宁, 刘百祥, 阚海斌
中国科学: 信息科学, 2021, 51(10): 1706-1720
摘要 信息技术的发展以及人们对于个人隐私安全重视程度的提升对传统互联网应用的身份认证机制提出了更高的要求,既要实现用户的身份认证,同时也要最大程度地保护用户的隐私信息.与传统的数字签名方案相比,基于属性的数字签名方案天然具有匿名的特点,即属性签名可以隐藏签名者的身份信息,其他用户无法将一个签名链接到签名者的身份(属性集).而在实际应用场景当中,我们通常还需要对用户的身份进行监管,以防止匿名滥用和失信行为的发生.因此,为了平衡这两种看似矛盾的需求,本文提出了一个基于区块链和去中心可追踪属性签名的可控匿名认证方案,通过对已有的可追踪属性签名方案进行适当改进,在不影响效率的前提下实现了去中心化的属性授权机构,以防止单个属性授权机构的腐败对系统安全性造成影响.实验及对比分析结果表明,本方案适用于电子投票系统和其他具有去中心可控匿名认证需求的场景.
关键词 区块链; 属性签名; 可追踪性; 可控匿名; 隐私保护; blockchain; attribute-based signature; traceability; controllable anonymity; privacy protection;
Ning FANG, Baixiang LIU, Haibin KAN. Controllable anonymous authentication scheme based on blockchain and decentralized traceable attribute-based signature. Sci Sin Inform, 2021, 51(10): 1706-1720, doi: 10.1360/SSI-2021-0018
基于区块链的数字内容生态价值链构建
周广猛, 姚苏, 李琳, 刘昕, 徐恪
中国科学: 信息科学, 2021, 51(9): 1559-1574
摘要 随着互联网和移动终端的普及,数字内容产业正成为文化产业主要经济增长点.本文从数字内容产业面临的版权、质量和产业壁垒问题入手,分析区块链技术对于建设数字内容生态价值链的意义和优势,提出以基于区块链的数字内容平台重塑生态价值链的方案.然后分析新型平台中的关键元素、价值流转、平台架构,设计平台价值流转过程中的基础方案,最后从成本和性能角度证明联盟链适合并且可以支撑平台构建.
关键词 数字内容; 价值链; 区块链; 价值流转; 联盟链; digital content; value chain; blockchain; value transfer; consortium blockchain;
Guangmeng ZHOU, Su YAO, Lin LI, et al. Digital content ecological value chain based on block chain. Sci Sin Inform, 2021, 51(9): 1559-1574, doi: 10.1360/SSI-2020-0016
基于格的口令散列方案
李增鹏, 汪定
中国科学: 信息科学, 2021, 51(8): 1375-1390
摘要 在可预见的未来,口令仍将是最主要的身份认证方法.口令认证密钥交换协议(password authenticated key exchange, PAKE)是口令认证的重要组成部分,它允许通信双方在不安全的通话信道上建立一个安全的会话密钥.为了缓解服务器被入侵后对存储在服务器上口令的影响,将口令散列之后再存储被广泛推荐,例如使用传统的口令散列函数,如PBKDF2, Bcrypt,和Scrypt.然而,这些口令散列函数依赖复杂的数学问题,安全性证明建立在随机预言机模型(random oracle model,ROM)之上,且需要较大内存支持.为解决上述问题,基于离散对数假设的口令散列方案陆续被提出,如Benhamouda-Pointceva方案(IACR ePrint2013/833)、Kiefer-Manulis方案(ESORICS’14)、Pointcheval-Wang方案(ASIACCS’17)与平滑投影散列函数(smooth projective hash function, SPHF)集成,但这些方案无法实现后量子安全且仍依赖于ROM模型.因此,本文着重研究如何在标准模型下设计后量子安全的口令散列方案,并给出可证明安全性分析.尽管所提方案尚不能应用于实际,但为构造实际的后量子安全的口令认证及密钥交换协议奠定了基础.
关键词 抗量子; 口令认证密钥交换; 口令散列方案; 平滑投影散列函数; 基于格的密码学; quantum resistant; password authenticated key exchange; password hashing scheme; smooth projective hash function; lattice-based cryptography;
Zengpeng LI, Ding WANG. Achieving password-hashing scheme over lattices. Sci Sin Inform, 2021, 51(8): 1375-1390, doi: 10.1360/SSI-2020-0177
基于区块链和去中心属性密码的访问控制身份方案
陈泽宁, 张亮, 张双俊, 阚海斌
中国科学: 信息科学, 2021, 51(8): 1345-1359
摘要 区块链上的身份体制是不健全的.如何在区块链上认证某个用户的身份、如何确保身份的背书机构是真实的一直是一个挑战.运行在区块链上的分布式公钥基础设施可以在某种程度上解决上述问题,但是属性密码结合区块链可以提供更贴近于真实社会的身份模型.提出一种基于区块链和去中心属性密码的访问控制身份方案,利用用户和组织之间相互授权、背书身份属性实现信任成本的链接,利用属性密码对链上数据进行访问控制和共享达到细粒度的访问控制和隐私保护.设计了可多用户协同的属性密码,为身份模型中的机构提供背书能力.通过实验仿真和对比分析,该方案在安全性和性能上都满足当前通用区块链的需求,为其提供了一种通用基础的身份模型.
关键词 区块链; 属性密码; 访问控制; 身份认证; 隐私保护; blockchain; attributed-based encryption; access control; identity authentication; privacy protection;
Zening CHEN, Liang ZHANG, Shuangjun ZHANG, et al. Access control scheme on blockchain and decentralized attributed-based algorithm with identity. Sci Sin Inform, 2021, 51(8): 1345-1359, doi: 10.1360/SSI-2020-0048
面向数据流发布的数据自适应隐私保护机制
王腾, 杨新宇, 任雪斌, 赵俊
中国科学: 信息科学, 2021, 51(7): 1199-1216
摘要 群智感知系统中针对数据流的实时发布和深度学习在极大方便人们日常生活的同时,也严重威胁了参与用户的隐私信息.现有隐私保护机制在处理动态性强、时空相关性复杂的数据流时,大都难以实现数据自适应性,从而导致较低的数据效用性.因此,基于ω-事件级差分隐私,本文提出了一种数据自适应的多维数据流隐私保护实时发布机制AdaPub.该机制通过集成基于多重哈希的维度划分策略和自适应累积回溯时间聚类策略分别学习数据流的空间和时间相关性,不需要预定义任何参数,能够根据数据流的动态变化趋势来自适应地调整隐私参数,从而保证了隐私保护机制的数据自适应性并有效提高了数据效用性.此外,本文进一步提出了一种面向层次数据流发布的隐私保护机制HierAdaPub,利用最优隐私预算分配策略来最小化扰动方差以保证数据效用性.大量仿真实验从不同角度均验证了所提出隐私保护机制能够在提供强隐私保护的同时,具有较高的数据效用性.
关键词 数据流发布; 数据自适应; 差分隐私; 时空相关性; 数据效用性
Teng WANG, Xinyu YANG, Xuebin REN, et al. Data-adaptive privacy-preserving mechanism for data stream publishing in real-time. Sci Sin Inform, 2021, 51(7): 1199-1216, doi: 10.1360/SSI-2020-0076
基于权限的移动应用程序隐私风险量化
朱敏杰, 叶青青, 孟小峰, 杨鑫
中国科学: 信息科学, 2021, 51(7): 1100-1115
摘要 移动设备的普及带来了移动应用程序市场的蓬勃发展,各类服务提供商通过移动应用程序的权限大量收集用户数据,而数据收集过程往往不为用户所知,因此给用户带来极大的隐私风险.对移动应用程序进行隐私风险评估,不仅有助于规范第三方移动应用市场,而且可帮助用户规避潜在的隐私风险,而如何评估移动应用程序可能带来的最大隐私风险则是当前面临的重大挑战.本文通过研究移动应用程序最大化的数据泄露场景,基于权限请求特征和权限分析原则构建隐私风险最大值量化模型.该模型基于权限敏感度、权限类别异常度、权限使用率和权限调用者数量4个参数,对移动应用程序的潜在隐私风险进行评估.在隐私风险量化和恶意应用检测中,对比当前同类型方法,该模型在真实数据集上效果均较优,说明模型的有效性.实验结果进一步表明,该模型可用于改善现有第三方移动应用市场的隐私风险预警机制,进而保护移动用户的隐私.
关键词 隐私保护; 移动应用程序; 隐私风险量化; 权限分析方法
Minjie ZHU, Qingqing YE, Xiaofeng MENG, et al. Privacy risk quantification of mobile application based on requested permissions. Sci Sin Inform, 2021, 51(7): 1100-1115, doi: 10.1360/SSI-2020-0039
CCA安全的抗泄露IBE机制的新型构造
周彦伟, 杨波, 夏喆, 张明武
中国科学: 信息科学, 2021, 51(6): 1013-1029
摘要 隐私信息的泄露已成为密码系统当前的严重安全性隐患,因此抗泄露性将是密码机制必备的安全属性之一.目前,通常基于非交互式零知识论证系统、一次性损耗滤波器、强一次性签名等密码基础工具来实现选择密文攻击(chosen-ciphertext attack, CCA)安全的抗泄露身份基加密(identity-based encryption, IBE)机制的通用构造;然而,由于底层工具的计算效率较低,导致传统通用构造尚未达到理想的计算效率.针对上述不足,本文提出一个双封装密钥的身份基哈希证明系统(identity-based Hash proof system with two encapsulated key, T-IB-HPS)的新密码学原语,并详细介绍了T-IB-HPS的形式化定义及安全属性;同时,基于T-IB-HPS和消息验证码(message authentication code, MAC)设计了CCA安全的抗泄露IBE机制的新型通用构造,并基于T-IB-HPS和MAC的安全属性,对通用构造的CCA安全性进行了形式化证明;为进一步展示本文通用构造的实用性,在T-IB-HPS形式化定义的基础上,我们设计了T-IB-HPS的具体实例,并基于判定的双线性Diffie-Hellman假设证明了本文实例的安全性.相较于传统CCA安全的抗泄露IBE机制的通用构造而言,本文通用构造未使用计算效率低的密码学基础工具,表明了本文的通用构造方法具有较高的计算效率.
关键词 哈希证明系统; 身份基哈希证明系统; 身份基加密机制; 抗泄露攻击
Yanwei ZHOU, Bo YANG, Zhe XIA, et al. A new construction of leakage-resilient CCA secure IBE scheme. Sci Sin Inform, 2021, 51(6): 1013-1029, doi: 10.1360/SSI-2020-0001
抗恶意敌手的百万富翁问题解决方案
李顺东, 王文丽, 杜润萌
中国科学: 信息科学, 2021, 51(1): 75-88
摘要 安全多方计算是国际密码学界研究的热点,百万富翁问题是安全多方计算最基础最重要的问题,是构造其他安全多方计算协议的基本模块.这个问题已经有许多解决方案,但除了基于混淆电路的协议之外,目前基于公钥加密算法的解决方案几乎都是半诚实模型下的解决方案,抗恶意敌手的解决方案极少,仅有的个别解决方案效率很低,这制约着恶意模型下许多安全多方计算问题的解决.抗恶意敌手的解决方案更符合安全多方计算的实际应用场景,研究抗恶意敌手的百万富翁问题解决方案,具有重要的理论与现实意义.本文首先设计了一个半诚实模型下百万富翁问题的解决方案,进一步分析了恶意敌手可能的恶意行为,并用零知识证明和分割选择阻止或发现这些恶意行为,将半诚实模型下安全的计算协议改造成恶意模型下安全的计算协议,并用理想–实际范例证明了协议的安全性,分析了恶意敌手攻击成功的概率和方案的效率.理论分析表明与现有方案相比,我们提出的方案效率至少提高6倍.
关键词 安全多方计算; 百万富翁问题; 恶意模型; 分割–选择; 零知识证明; 理想–实际范例; secure multiparty computation; millionaires' problem; malicious model; cut-and-choose; zero-knowledge proof; ideal-real paradigm;
Shundong LI, Wenli WANG, Runmeng DU. Protocol for millionaires' problem in malicious models. Sci Sin Inform, 2021, 51(1): 75-88, doi: 10.1360/SSI-2019-0226
面向互联网的SDN流量多粒度处理机制
卢向敏, 王兴伟, 易波, 李婕, 黄敏
中国科学: 信息科学, 2020, 50(12): 1903-1918
摘要 软件定义网络(software defined networking, SDN)作为一种新型的网络架构,将网络的控制平面与数据转发平面分离,实现了可编程化控制,为互联网提供了改善网络全局性能的新思路.虽然SDN具有全局视角优势,但在处理互联网海量数据时也存在性能瓶颈:频繁的层间通信会使控制器计算效率下降,海量的流表项数据使得交换机存储压力过大.为了进一步提升SDN的性能使其适应互联网的海量流量处理,本文提出了面向互联网的SDN流量多粒度处理机制,将SDN架构应用到互联网骨干网的流量处理中,分别从路由和调度两个方面设计并实现了流量多粒度处理机制.仿真结果表明:本文设计的流量多粒度处理机制能减少层间通信次数,减少下发流表项,维持负载均衡,提高了路由选取的正确性和有效性,提升了SDN性能,进而提升了处理互联网海量数据的能力.
关键词 软件定义网络; 互联网; 多粒度路由; 流量调度; 性能优化; software defined networking; Internet; multi-granularity routing; traffic scheduling; performance optimization;
Xiangmin LU, Xingwei WANG, Bo YI, et al. Traffic multi-granularity processing mechanism for Internet-oriented SDN. Sci Sin Inform, 2020, 50(12): 1903-1918, doi: 10.1360/SSI-2019-0214
基于免疫MHC的否定选择算法孔洞修复方法
朱方东, 李涛, 杨进
中国科学: 信息科学, 2020, 50(10): 1529-1543
摘要 否定选择算法(negative selection algorithm, NSA)是人工免疫系统的核心基础算法.孔洞是引起NSA检测率低的重要因素.传统NSA未考虑孔洞的分布,采取在特征空间内通过完全随机的方式盲目生成检测器以修复孔洞,导致孔洞修复效果不佳,并且淘汰无效的检测器也异常耗时.孔洞问题在生物免疫系统中也同样存在.生物免疫系统利用MHC分子针对孔洞产生的特殊形态,对免疫细胞的发育过程进行限定,从而训练出覆盖孔洞的免疫细胞,进而解决孔洞问题.受此启发,本文提出一种基于免疫MHC的否定选择算法——孔洞修复方法 MHC-NSA.首先以训练样本生成的维诺图(Voronoi)对形态空间进行划分,利用维诺图的最邻近特性,在维诺图中两类点处快速生成两类检测器,以较小训练代价达到对非自体空间较好的覆盖;其次模拟MHC针对孔洞所具有的特殊形态,对所产生的孔洞位置进行定位,并限定该位置生成孔洞修复检测器,从而提升孔洞修复效果.理论分析表明,MHC-NSA所生成的孔洞修复检测器可将孔洞最高占比降低62.8%,且MHC-NSA的时间复杂度由传统NSA算法的指数阶降低到多项式阶.在UCI数据集Balance Scale上的实验表明, MHC-NSA的检测器训练时间较典型NSA算法代表RNSA, V-Detector和BIORV-NSA在分别降低53.73%, 96.43%和92.66%的同时,检测率分别提升69.57%, 44%和17.54%.
关键词 人工免疫系统; MHC; 否定选择算法; 孔洞; AIS; MHC; NSA; Holes;
Fangdong ZHU, Tao LI, Jin YANG. A negative selection algorithm hole improvement method based on MHC. Sci Sin Inform, 2020, 50(10): 1529-1543, doi: 10.1360/N112018-00188
分布式隐私保护—Logistic回归
王璞玉, 张海
中国科学: 信息科学, 2020, 50(10): 1511-1528
摘要 本文关注敏感数据的隐私保护问题,开展满足差分隐私的分布式Logistic回归模型研究.通过对算法输出结果加扰动,实现分布式差分隐私.进一步,为了防止计算机信息交互过程中可能产生的隐私泄露,针对算法迭代过程加扰动的方式提出了基于Alternating Direction Method of Multipliers(ADMM)算法的分布式Logistic变量扰动算法,并给出算法的理论界估计.实验表明,所提算法可有效地处理分布式存储数据并保护其隐私.
关键词 差分隐私; 分布式算法; Logistic回归; ADMM算法; differential privacy; distributed algorithm; logistic regression; ADMM algorithm;
Puyu WANG, Hai ZHANG. Distributed logistic regression with differential privacy. Sci Sin Inform, 2020, 50(10): 1511-1528, doi: 10.1360/N112018-00214
DAG区块链中基于确定性退火技术的融合分割遗传任务调度算法
曹怀虎, 张艳梅, 王坚, 李海峰, 崔丽欣
中国科学: 信息科学, 2020, 50(2): 261-274
摘要 传统的区块链结构,由于其固有的响应速度慢,不能适应大规模实时响应的应用场景,本文针对这一问题,提出了一种DAG (directed acyclic graph)区块链理论架构,将传统区块链的链式处理过程转变为并行的处理过程,使得快速响应成为可能.在此基础上,面向DAG区块链环境中非独立任务调度问题,提出了基于确定性退火技术的混合分割遗传任务调度算法.实验结果显示,该算法能够适应DAG区块链节点的异质性、动态性和广域性,其调度的性能也比传统的调度算法有所改善,在优化任务完成时间的同时,兼顾了负载均衡问题,有效地提高了响应速度,是解决DAG区块链环境中非独立任务调度问题的可行方法.
关键词 有向图; 遗传算法; 并行; 任务调度; 优化; 负载均衡; directed graph; genetic algorithms; parallel; task-scheduling; optimization; load balancing;
Huaihu CAO, Yanmei ZHANG, Jian WANG, et al. Fusion-partitioning genetic task scheduling algorithm based on deterministic annealing technology in DAG blockchains. Sci Sin Inform, 2020, 50(2): 261-274, doi: 10.1360/N112019-00025
信息系统在复杂应用中的科学与技术专刊
基于Bayes网络的高维感知数据本地隐私保护发布
任雪斌, 徐静怡, 杨新宇, 杨树森
中国科学: 信息科学, 2019, 49(12): 1586-1605
摘要 群智感知系统通过对高维感知数据的发布和分析为人们带来巨大数据价值的同时,也给参与者的隐私带来了极大的隐患.目前,各种基于差分隐私的隐私保护方法被提出,但大部分方法不能同时解决高维感知数据间复杂的属性关联问题和来自不可信服务器的隐私威胁问题.基于此,本文提出了基于Bayes网络的高维感知数据本地隐私保护发布机制.该机制实现了用户端的本地数据保护,杜绝了其他方直接访问用户原始数据的可能,根本上保护了用户的数据隐私.感知服务器端在接收到用户本地隐私保护的数据后,基于Bayes网络方法对高维数据的维度相关性进行识别,将高维数据属性集划分为多个相对独立的低维属性集,进而依次合成新的数据集,可以有效地保留原始感知数据的属性维度相关性,保证合成数据集与原始数据集具有尽可能相似的统计特性.通过大量仿真实验验证了该方法的有效性,实验结果表明该方法在有效的本地隐私保护下的合成数据具有较高的数据效用性.
关键词 群智感知系统; 感知数据; 高维数据; 本地差分隐私; Bayes网络; crowd sensing system; crowdsourced data; high-dimensional data; local differential privacy; Bayesian network;
Xuebin REN, Jingyi XU, Xinyu YANG, et al. Bayesian network-based high-dimensional crowdsourced data publication with local differential privacy. Sci Sin Inform, 2019, 49(12): 1586-1605, doi: 10.1360/SSI-2019-0119
适用于双重压缩环境的图像内容认证水印算法
付剑晶, 陈德人, 徐达文, 毛家发
中国科学: 信息科学, 2019, 49(4): 464-485
摘要 数字图像内容的恶意篡改可能导致严重后果.随着图像分辨率的提高及其在网络上流通数量的快速增长,图像往往要经过双重压缩:压缩(JPEG/JPEG2000)发布→解码→应用领域的处理(常规信号处理/安全性攻击/内容的恶意篡改)→再次压缩(JPEG2000/JPEG)发布,才能进入末端检测.如何在双重压缩环境下有效判定图像内容是否遭篡改及定位篡改位置是个亟待解决的问题.本文提出了一种基于旋转向量的新颖的水印表示方法及其调制算法,并在此基础上建立了半脆弱水印方案用于图像内容认证.理论分析了水印的稳定性,使该水印方案具有理论基础;详细阐述了以特征抽取与重构、水印嵌入与提取、篡改检测与定位为主要内容的认证方案;分析了水印的鲁棒性、安全性和相关检测性能.理论分析与实验表明:该方案水印透明性好,针对不同的攻击鲁棒性好且分布稳定;在双重压缩环境下能有效区分恶意篡改与保持内容的处理并定位篡改区域;安全性好,能抵制水印攻击、拼贴攻击和伪造攻击.与相关方案相比,本文方案综合性能优越,适用于双重压缩环境下的内容认证,扩大了基于水印的内容认证的应用范围.
关键词 图像水印; 半脆弱水印; 恶意篡改; 内容认证; 双重压缩; image watermark; semi-fragile watermark; malicious tampering; content authentication; double compression;
Jianjing FU, Deren CHEN, Dawen XU, et al. A watermarking algorithm for image content authentication in double-compression environment. Sci Sin Inform, 2019, 49(4): 464-485, doi: 10.1360/N112018-00196
基于局部细节点三维映射的指纹模板生成方法
惠妍, 张雪锋
中国科学: 信息科学, 2019, 49(1): 42-56
摘要 为了提高指纹模板的安全性、不可逆性等性能,本文设计了一种基于局部细节点三维映射的指纹模板生成方法.首先对指纹图像进行预处理,提取指纹的细节点特征,并采用参数自适应的环形区域对细节点进行筛选,然后将细节点投影到直线上,并对投影后的向量集合进行量化、映射和取模运算生成固定长度的二进制比特串,最后结合用户PIN码生成指纹模板.在指纹数据库FVC2002-DB1和-DB2上的实验结果表明,该方法生成的指纹模板在认证性、可撤销性和不可逆性等主要性能上相比几种典型方法更具优势.
关键词 局部细节点; 三维映射; 参数自适应; 比特串; 指纹模板; local minutiae; three-dimensional mapping; parameter adaptive; bit-string; fingerprint template;
Yan HUI, Xuefeng ZHANG. A fingerprint-template-generating method based on the 3D mapping of local minutiae. Sci Sin Inform, 2019, 49(1): 42-56, doi: 10.1360/N112018-00018
主动防御的双结构网络
尹浩, 郭东超, 吕勇强, 杨鹏, 赵志为, 张尧学
中国科学: 信息科学, 2018, 48(12): 1651-1669
摘要 网络空间安全攸关人类福祉与国家利益,但当前网络空间安全存在重大挑战:互联网体系结构具有优越的互联互通性和开放性,但也导致其安全问题无法彻底解决,处处设防却处处难防;传统安全防御机制依赖安全威胁的先验信息,难以应对不断演化的安全威胁.为了应对上述挑战,本文提出了一种新型网络空间安全防御理论体系:构建与互联网主结构平行的"动态、异构、冗余"的基于播存思想的次结构网络,辅助现有互联网体系结构而形成双结构网络;提出不依赖安全威胁先验信息的数据与知识联合驱动的新型主动防御机理;提出双网透明接入与前置主动防御技术等关键支撑技术.为改变我国网络空间安全领域受制于人、被动防御的现状,本文试图从演进式改变网络体系结构角度提出完备解决方案.
关键词 双结构网络; 主动防御; 统一内容标签; 透明接入; 大数据; dual-structural network; active defence; uniform content label; transparent access; big data;
Hao YIN, Dongchao GUO, Yongqiang LYU, et al. Dual-structural network of active defense. Sci Sin Inform, 2018, 48(12): 1651-1669, doi: 10.1360/N112017-00171
点和区间关系的全隐私保密判定
陈振华, 李顺东, 陈立朝, 黄琼, 张卫国
中国科学: 信息科学, 2018, 48(2): 187-204
摘要 点和区间关系的保密判定在范围查询中应用非常广泛,但目前已存的解决方案大多只保护了一方的隐私,而另一方的隐私并未得到保护.此外,已存方案给出的点和区间都是离散的整数(或有理数)范围.针对这些问题,本文利用安全多方计算的思想设计了保密判定点和区间关系的2种协议,不但同时保护了两方的隐私,而且将数域推广到连续的实数.本文首先利用0-1编码并结合Goldwasser-Micali同态加密给出了全隐私判定一个整数点是否在一个离散整数区间上的协议1;然后利用函数的单调性和Paillier同态加密给出了全隐私判定一个实数点是否在一个连续实数区间的协议2.最后,给出了本文协议的一个应用实例.理论和实验分析显示:本文的两个协议在取得较优通信效率的同时都取得了全隐私性.此外,协议2相比以往的方案,第一次给出点和连续实数区间的判定方法,在保持较优效率和良好性能的同时取得了通用性.
关键词 点和区间; 全隐私; 安全多方计算; 实数; 同态加密; point-range; full privacy; secure multiparty computation; real number; homomorphic encryption;
Zhenhua CHEN, Shundong LI, Lichao CHEN, et al. Fully privacy-preserving determination of point-range relationship. Sci Sin Inform, 2018, 48(2): 187-204, doi: 10.1360/N112017-00025
基于三元数极谐–Fourier矩和混沌映射的立体图像零水印算法
王春鹏, 王兴元, 张川, 朱晓强, 夏之秋
中国科学: 信息科学, 2018, 48(1): 79-99
摘要 立体图像因其强烈的沉浸感,近年来受到广泛关注,与之对应的立体图像的版权保护问题日趋紧迫.目前绝大多数用于图像版权保护的水印算法都是针对平面图像的,用于立体图像的水印算法较少.即使是立体图像水印算法,大部分算法未能很好体现和保留左右视角分量内部的特定联系,因而说必然影响算法的鲁棒性.本文提出面向立体图像的三元数极谐-Fourier矩(ternary polar harmonic Fourier moments,TPHFM),并基于此和混沌映射,提出一种鲁棒立体图像零水印算法.首先使用线性和非线性混合耦合时空混沌系统对原始二值logo图像进行混沌化,然后计算原始立体图像的TPHFM并选择适用于零水印算法的精确矩,然后计算精确矩的幅值来构造二值特征图像并使用Sine映射和Cosine映射对其进行置乱,最后将置乱的二值特征图像与二值混沌logo图像进行异或操作得到构造的零水印图像.仿真实验表明,本文算法对常规图像处理和几何攻击均具有较好的鲁棒性,并优于三元数圆谐-Fourier矩(ternary radial harmonic Fourier moments,TRHFM)算法和其他零水印算法.
关键词 三元数; 极谐-Fourier矩; 三元数极谐-Fourier矩; 立体图像; 零水印; 线性和非线性混合耦合时空混沌系统; Sine映射; Cosine映射; ternary number; polar harmonic Fourier moments; ternary polar harmonic Fourier moments; stereo image; zero-watermarking; mixed linear-nonlinear coupled map lattice; Sine mapping; Cosine mapping;
Chunpeng WANG, Xingyuan WANG, Chuan ZHANG, et al. Stereo image zero-watermarking algorithm based on ternary polar harmonic Fourier moments and chaotic mapping. Sci Sin Inform, 2018, 48(1): 79-99, doi: 10.1360/N112017-00109
对轻量级分组密码MIBS和I-PRESENT的非对称Biclique攻击
崔杰, 左海风, 仲红
中国科学: 信息科学, 2017, 47(10): 1395-1410
支持隐私保护的加密遥感图像融合算法
沈蒙, 程国华, 祝烈煌
中国科学: 信息科学, 2017, 47(6): 736-751
可完全验证的双线性对运算外包算法
任艳丽, 丁宁, 王天银, 陆海宁, 谷大武
中国科学: 信息科学, 2016, 46(7): 855-869
OFBNLF加密工作模式的分析
孙哲蕾, 王鹏
中国科学: 信息科学, 2016, 46(6): 729-742
三值光学计算机双空间存储器的结构和理论
欧阳山, 彭俊杰, 金翊, 沈云付, 刘学民, 韩越兴, 李卫民
中国科学: 信息科学, 2016, 46(6): 743-762
基于语法和语义分割的跨领域方面级情感分类
吴震, 戴新宇
中国科学: 信息科学, 2023, 53(7): 1299-1313
摘要 神经网络在方面级情感分类任务上已经取得了良好的性能.然而,由于复杂且耗时的数据标注流程,方面级情感分类在很多领域上是低资源甚至是零资源的,这限制了该任务在实际场景中的应用.为了解决这个挑战性的问题,本文关注跨领域的方面级情感分类,并提出一种基于语法和语义分割的跨领域方面情感分类方法.具体而言,针对不同领域用词差异造成的领域漂移和注意力泛化问题,本文首次提出利用单纯的语法信息来获取可在领域之间迁移的语法注意力,并引入与目标领域相近的文档情感分类任务来增强神经网络模型对目标领域的情感识别能力,最终从语法和语义两个层面分别提升模型的注意力机制和文本上下文表示.实验在6个跨领域方面级情感分类任务上进行,结果表明,与其他9种基线方法相比,本文的方法在6个任务上都取得了最先进的性能,在平均准确率和平均macro-F1两个指标上比之前最好的模型DIFD分别提升7.14%和7.6%.此外,即使以大规模预训练模型BERT, BERT-ADA, RoBERTa等作为骨干网络,本文的方法仍能实现3.5%以上的平均准确率提升和平均macro-F1提升.
关键词 方面级情感分类; 跨领域; 神经网络; 注意力; 语法和语义; aspect-level sentiment classification; cross-domain; neural network; attention; syntax and semantics;
Zhen WU, Xinyu DAI. Separated syntax and semantics modeling for cross-domain aspect-level sentiment classification. Sci Sin Inform, 2023, 53(7): 1299-1313, doi: 10.1360/SSI-2021-0166
基于学习连续时间事件序列的动态网络链路预测
韩忠明, 王宇航, 陈福宇, 杨伟杰, 毛雅俊
中国科学: 信息科学, 2023, 53(2): 234-249
摘要 动态网络链路预测是目前复杂网络的热点研究方向,网络表示学习可以有效学习到节点的相似性,从而为链路预测提供基础.现有的动态网络表示学习方法大多先将动态网络进行离散窗口化,然后在静态网络快照图上建模,这样很难有效处理具有细粒度时间特性的动态网络.本文提出了一种可以学习动态网络中复杂的时间特性的链路预测模型,该模型使用连续时间事件序列表示动态网络,对网络中的连续时间信息和结构演化特征进行学习,并提出了基于时间注意力的信息传递机制来模拟网络中信息的扩散与聚合,最后将链路预测转化为分类问题.实验在4个真实动态网络数据集以及模拟网络上进行,并以ap和auc作为评价指标.真实网络实验结果证明该模型能够较好地学习网络演化的连续性,得到更有效的节点表示,从而提升了链路预测效果.模拟网络的实验结果表明链路预测的效果和网络模型相关,但本文模型仍可以获得较好的预测效果.
关键词 链路预测; 连续时间; 动态网络; 表示学习; 复杂网络; link prediction; continuous time; dynamic network; representation learning; complex network;
Zhongming HAN, Yuhang WANG, Fuyu CHEN, et al. Dynamic network link prediction based on learning continuous time events. Sci Sin Inform, 2023, 53(2): 234-249, doi: 10.1360/SSI-2022-0059
基于解析图嵌入和加权图卷积网络的知识图谱补全
罗妹秋, 张春霞, 彭成, 张鑫, 郭贵锁, 牛振东
中国科学: 信息科学, 2022, 52(11): 2037-2057
摘要 知识图谱补全是知识图谱构建、自然语言处理和知识工程等领域的重要研究课题.知识图谱不仅是实现通用领域和专业领域精准知识服务的知识支撑,而且是信息检索、问答交互和信息推荐等领域取得突破性进展的必要基础.知识图谱的低质量和小规模是阻碍知识图谱广泛应用的主要瓶颈.知识图谱补全的目的是构建大规模高质量的知识图谱,以不断更新和扩充知识图谱.针对现有知识图谱补全方法难以从非结构化文本等辅助信息中提取深层次语义特征的问题,本文提出一种基于解析图嵌入和加权图卷积网络的知识图谱补全方法.一方面,该方法通过加权图卷积网络,对实体描述文本的语义依存分析进行建模,构建语义依存解析图嵌入;另一方面,引入了实体描述文本的多粒度句嵌入生成方法,旨在于构建能够捕获多粒度语义、深层次语义特征的实体表示学习.通过在两个公开数据集上的实验结果表明了本文知识图谱补全方法优于现有方法,验证了本文方法的有效性和优越性.
关键词 知识图谱补全; 解析图嵌入; 加权图卷积网络; 语义依存分析; 实体表示学习; knowledge graph completion; parsing graph embedding; weighted graph convolutional network; semantic dependency parsing; entity representation learning;
Meiqiu LUO, Chunxia ZHANG, Cheng PENG, et al. Knowledge graph completion based on parsing graph embedding and a weighted graph convolutional network. Sci Sin Inform, 2022, 52(11): 2037-2057, doi: 10.1360/SSI-2021-0217
基于句法模板采样的无监督复述生成方法
鲍宇, 黄书剑, 周浩, 李磊, 戴新宇, 陈家骏
中国科学: 信息科学, 2022, 52(10): 1808-1821
摘要 文本复述可以辅助机器翻译、智能问答、文本分类等任务,是非常重要的自然语言处理任务.近年来,一些研究探索了基于结构变换的文本复述,从无监督学习的概率化表示空间中采样多个句法表示并生成多个复述.然而,通过后验分布采样句法表示生成的复述往往高度相似,缺乏多样性;另一方面,从先验分布采样句法表示又难以保证与给定的语义表示相匹配,导致生成的复述质量欠佳.本文提出了基于句法模板的文本复述模型,引入了句法模板隐变量建立语义空间和句法空间的联系,并进一步提出了两步采样策略:(1)使用先验分布采样句法模板,使得采样的句法表示更加多样化;(2)使用后验分布采样句法表示,以确保句法表示与语义表示的匹配.实验表明,两步采样策略有效地结合了先验采样和后验采样的优势,生成的文本复述可以在具备良好生成质量的同时保持着更好的多样性,取得了当前最佳的复述性能.
关键词 无监督复述; 变分自编码器; 句法结构; 采样; unsupervised paraphrasing; variational autoencoder; syntax structure; sampling;
Yu BAO, Shujian HUANG, Hao ZHOU, et al. Unsupervised paraphrasing via syntactic template sampling. Sci Sin Inform, 2022, 52(10): 1808-1821, doi: 10.1360/SSI-2021-0065
细粒度建模用户兴趣的序列化推荐方法
张麒, 吴宾, 孙中川, 叶阳东
中国科学: 信息科学, 2022, 52(10): 1775-1791
摘要 序列化推荐因其实用性和较高推荐精度在近期受到了人们广泛关注.不同于传统推荐方法,序列化推荐的核心在于如何基于用户近期交互行为来捕获用户的短期兴趣.现有工作或者依次考虑用户交互序列中物品之间的成对关系,忽略了更为重要的多对一关系;或者将用户最近交互的多个物品视为集合,忽略了物品之间的相对次序.这不仅未能充分挖掘物品之间的复杂关系,而且未准确刻画用户兴趣的演变过程.为此,本文提出门耦合胶囊网络(gating coupled capsule network, GCC),一种从个体层、联合层以及局部有序性3个层面细粒度分析物品间关系对于用户短期兴趣影响的方法.借助胶囊网络的空间感知能力, GCC引入个性化胶囊模块建模用户高阶时序信息,其不仅能够捕获物品间的联合层关系,也保留了物品间的局部有序性.另外,本文在GCC中设计了用于建模物品间成对关系的个性化门单元模块,以此捕获个体层关系对于用户短期兴趣的影响.在4个真实推荐场景下的实验结果表明, GCC相比于主流序列化推荐方法在多个评价指标上具有显著的性能优势.
关键词 胶囊网络; 序列化推荐; 门单元机制; 隐式反馈; 推荐系统; capsule networks; sequential recommendation; gating mechanism; implicit feedback; recommender systems;
Qi ZHANG, Bin WU, Zhongchuan SUN, et al. Fine-grained modeling of user interests for sequential recommendation. Sci Sin Inform, 2022, 52(10): 1775-1791, doi: 10.1360/SSI-2021-0026
基于交互序列商品相关性建模的图卷积会话推荐
闫昭, 项欣光, 李泽超
中国科学: 信息科学, 2022, 52(6): 1069-1082
摘要 会话推荐旨在根据用户在会话中的短期行为,预测用户的后续行为,多应用于用户匿名访问网站的场景.会话推荐的核心在于商品之间协同关系的建模,以提升推荐结果的性能.现有方法大都挖掘商品交互顺序信息以计算商品间的协同关系.这种方式仅仅考虑了商品之间的相邻交互的信息,忽视了历史交互信息.其实,若两个商品共享相同的历史交互信息,即它们具有一定的协同关联性.例如,在两个商品交互序列为I_1-I_2-I_3和I_1-I_2-I_4的会话中,商品I_3与I_4的历史交互信息均为I_1-I_2,则商品I_3与I_4极有可能具有较强的关联关系.因此,本文提出了一种新颖的会话推荐模型IHGCN,通过分析会话的商品交互序列建模商品之间的关联关系,同时挖掘了相邻交互信息和历史交互信息.为了从这些交互信息中协同分析出商品特征,所提出方法使用图结构构建商品之间的关系,并引入图卷积网络从商品关系图中学习商品特征.该方法使用特征维度级的细粒度注意力机制挖掘户的全局偏好,并融合用户的局部偏好;基于学习得到的商品特征和用户偏好特征生成最终的推荐结果.本文在3个公开数据集上进行了验证分析,与当前最好的相关方法的比较结果表明所提出方法 IHGCN的有效性和优越性.
关键词 会话推荐; 图卷积网络; 商品交互相似性; 用户偏好; 注意力机制; session-based recommendation; graph convolutional network; item interaction similarity; user preference; attention mechanism;
Zhao YAN, Xinguang XIANG, Zechao LI. Item correlation modeling in interaction sequence for graph convolutional session recommendation. Sci Sin Inform, 2022, 52(6): 1069-1082, doi: 10.1360/SSI-2020-0383
基于多头注意力网络的无监督跨媒体哈希检索
李志欣, 凌锋, 唐振军, 马慧芳, 施智平
中国科学: 信息科学, 2021, 51(12): 2053-2068
摘要 跨媒体哈希检索将不同媒体数据编码到公共二值哈希空间中,从而可以有效地测量不同模态样本之间的相关性.为了进一步提高检索性能,提出基于多头注意力网络的无监督跨媒体哈希检索方法.首先,利用多头注意力网络生成哈希码矩阵,使图像和文本能获得更好的匹配.其次,构造一个辅助相似度矩阵,用以整合来自不同模态的原始邻域信息.通过辅助相似度矩阵与哈希码矩阵的协同学习,能够捕获不同模态之间和相同模态内部的潜在联系.此外,设计了两种损失函数训练网络模型,并使用批量归一化和更换哈希码生成函数的策略对模型进行优化,使模型的训练速度得到大幅提升.在3个数据集上的实验表明,本方法的平均性能比目前国际上先进的无监督方法有显著提升,充分证明了本方法的有效性和优越性.
关键词 卷积神经网络; 多头注意力网络; 跨媒体哈希检索; 无监督学习; 协同学习; 辅助相似度矩阵; 批量归一化; convolutional neural network; multi-head attention network; cross-media Hashing retrieval; unsupervised learning; collaborative learning; auxiliary similarity matrix; batch normalization;
Zhixin LI, Feng LING, Zhenjun TANG, et al. Unsupervised cross-media Hashing retrieval based on multi-head attention network. Sci Sin Inform, 2021, 51(12): 2053-2068, doi: 10.1360/SSI-2020-0264
基于时变阻尼运动的社交网络信息传播动力学分析
刘小洋, 何道兵, 刘超, 张宜浩
中国科学: 信息科学, 2021, 51(11): 1867-1884
摘要 针对目前社交网络上信息传播动力学的研究成果中,未能从社会物理学层面揭示微观个体上的随机性和无序性与宏观群体上的可知性和可控性之间的关系问题,本文提出了一种基于时变阻尼运动的信息传播动力学模型(time-varying damped motion, TVDM).首先,深入分析社交网络中信息传播现象,从时间、空间、主体(行为人)、客体(信息) 4个维度提取关键特征;然后,从带阻尼的简谐运动视角、内外力系合力作用视角、信息能量转化视角、时变系统与信号变换视角,揭示了社交网络上信息传播的物理学本质规则和作用机制;最后,通过数值模拟实验验证了网络上个体行为服从统计规律性.实验结果表明:提出的时变阻尼运动信息传播动力学模型精度为91%,构建的社交网络信息传播动力学模型TVDM是合理有效的.
关键词 社交网络; 动力学; 信息能量; 阻尼运动; 时变系统; social network; dynamics; information energy; damping motion; time-varying system;
Xiaoyang LIU, Daobing HE, Chao LIU, et al. Social network information propagation dynamic analysis based on time-varying damping motion. Sci Sin Inform, 2021, 51(11): 1867-1884, doi: 10.1360/SSI-2020-0142
基于大规模结构化病例数据的新型冠状病毒传播特征和感染人群分析
黄振华, 王振宇, 江莉, 张睿, 雷昶, 刘星炜, 谢晓辉
中国科学: 信息科学, 2020, 50(12): 1882-1902
摘要 2020年年初,新型冠状病毒感染的肺炎(COVID-19)爆发,中国采取了全面严格的防控举措全力抗击疫情.地方疫情指挥部门及时通报疫情感染数据,有助公众了解疫情的发展,及时做好防护措施.各地患者病例详情数据主要以文本形式记录,信息描述复杂,且各省市汇报的格式各异,处理难度较大.我们面向全国湖北省外近二分之一匿名的患者病例详情数据,提出了应用自然语言处理技术,辅助病例数据结构化的方法.该方法可以在标记样本较少的情况下,借助预训练模型,准确有效地提取出病例文本中的关键信息.通过对较大规模患者结构化病例数据的挖掘,本文详细分析了新型冠状肺炎总体发病性别和年龄分布特点、主要感染原因、潜伏期特点及疫情趋势等特征.由于潜伏期等时间延迟的存在,确诊人数往往不能反映一个地区的真实感染情况,结合出行大数据,本文提出了一个合理推断武汉市等城市实际感染人数的方法.该方法有助于人们提前估计地区疫情发展情况,及早采取防护措施.也可以辅助地方相关部门科学决策,尽早调度医务人员和分配医疗资源.
关键词 新型冠状病毒; 结构化病例; 自然语言处理; 预训练模型; COVID-19传播特征; 出行大数据; coronavirus; structured medical cases; natural language processing; pretrained models; COVID-19 transmission characteristics; big data of traveling;
Zhenhua HUANG, Zhenyu WANG, Li JIANG, et al. Analysis of COVID-19 spread characteristics and infection numbers based on large-scale structured case data. Sci Sin Inform, 2020, 50(12): 1882-1902, doi: 10.1360/SSI-2020-0029
刻画长短期用户兴趣的基于会话的推荐系统
王鸿伟, 过敏意
中国科学: 信息科学, 2020, 50(12): 1867-1881
摘要 在很多在线推荐系统场景中,用户和系统的交互通常都会按照时间间隔划分成一系列的会话.本文研究了如何在基于会话的推荐系统中对用户兴趣进行建模.现有的工作或者假设会话之间相互独立,忽略了历史会话中包含的长期用户兴趣信息;或者将用户在一个会话中的短期兴趣视为静态不变.这两者都无法充分刻画实际场景中的用户兴趣和行为.我们提出了循环记忆网络RMN,一种刻画了用户长期和短期兴趣的基于会话的推荐系统. RMN基于循环神经网络模型,其核心部分是一个储存了用户长期偏好的兴趣记忆模块.另外,我们在RMN中设计了一个会话内的记忆读取单元和一个会话间的记忆写入单元,这两个单元分别用于刻画短期(即一个会话内)的用户兴趣波动和长期(即跨越多个会话)的用户兴趣转移.我们在真实的电影推荐和职位推荐数据集上进行了实验,实验结果表明RMN相比于现有方法而言取得了显著的性能提升.
关键词 推荐系统; 会话; 长短期用户兴趣; 循环神经网络; 记忆网络; recommender systems; session; long-short term user preferences; recurrent neural networks; memory networks;
Hongwei WANG, Minyi GUO. Recurrent memory networks: modeling long short-term user preferences for session-based recommendation. Sci Sin Inform, 2020, 50(12): 1867-1881, doi: 10.1360/SSI-2019-0177
带有隐式反馈的SVD推荐模型高效求解算法
蔡剑平, 雷蕴奇, 陈明明, 王宁, 张双越
中国科学: 信息科学, 2020, 50(10): 1544-1558
摘要 作为推荐系统的重要组成部分,协同过滤已成为了当今主流的推荐方法之一.其中基于潜在因子的协同过滤常采用SVD推荐模型分析用户喜好.近年来,随着SVD推荐模型研究的深入, SVD++,TrustSVD等一类带有隐式反馈的SVD推荐模型被相继提出.此类模型能更有效地从有限的数据源中挖掘有用信息并取得了较好的效果,因此受到了人们广泛关注.然而,现有文献大多关注于模型设计,缺乏专门针对带有隐式反馈的SVD推荐模型的高效求解算法.为此,本文首先研究了一般性的SVD推荐模型梯度求解框架,然后以SVD++推荐模型为突破口,基于块梯度下降方法设计了高效求解算法BCDSVD++并解决了容量矩阵求逆、稀疏数据优化处理等两个关键问题.实验表明,本文所设计的BCDSVD++算法具有比传统的并行梯度下降法更高效的求解效率及收敛能力.
关键词 SVD推荐模型; 隐式反馈; SVD++; 块坐标下降法; 协同过滤; SVD recommendation model; implicit feedback; SVD++; block coordinate descent method; collaborative filtering;
Jianping CAI, Yunqi LEI, Mingming CHEN, et al. Efficient solution of the SVD recommendation model with implicit feedback. Sci Sin Inform, 2020, 50(10): 1544-1558, doi: 10.1360/SSI-2019-0107
领域大数据知识图谱专题
基于旅游知识图谱的可解释景点推荐
高嘉良, 仇培元, 余丽, 黄宗财, 陆锋
中国科学: 信息科学, 2020, 50(7): 1055-1068
摘要 景点推荐系统可以帮助游客过滤大量的无关信息,还能辅助商家发掘潜在的顾客.然而,现有的基于传统方法的推荐系统,如基于内容的推荐或协同过滤系统,虽推荐过程相对透明直观,但由于数据稀疏性的存在,推荐结果往往不够准确;基于深度学习的推荐方法,虽在一定程度上提高了推荐结果的精度,但由于缺乏可解释性和透明度,难以满足部分用户理解推荐依据的愿望,也阻碍了此类方法的推广应用.为了解决当前方法所存在的局限,本文引入基于知识图谱的景点推荐框架,将推荐过程与知识图谱嵌入相结合,推断用户兴趣在知识图谱上的传播路径,以此作为推荐依据.此外,本文通过对真实旅游数据的多角度时空分析,探究旅游活动的时空规律,并将其应用于景点推荐框架中,提出一种面向旅游的基于知识图谱的可解释推荐方法——Geo-RippleNet,并通过构建基于开放网络资源的旅游知识图谱,对Geo-RippleNet进行了全面的实验验证.结果表明,本文提出的基于知识图谱的景点推荐方法,不仅可以最大限度地吸收知识图谱丰富的语义信息,从而实现可观的性能提升,还能充分利用图谱的关系知识,推理兴趣传播路径,以增强推荐结果的可解释性.此外,将旅游活动的时空规律融入到上述推荐框架中,能够还原用户出游和决策的时空过程,进一步提高方法的性能表现.
关键词 旅游知识图谱; 景点推荐; 可解释性; 推荐系统; 旅游管理; tourism knowledge graph; attraction recommendation system; interpretability; recommendation system; tourism management;
Jialiang GAO, Peiyuan QIU, Li YU, et al. An interpretable attraction recommendation method based on knowledge graph. Sci Sin Inform, 2020, 50(7): 1055-1068, doi: 10.1360/SSI-2019-0268
领域大数据知识图谱专题
基于篇章级事件表示的文本相关度计算方法
刘铭, 郑子豪, 秦兵, 刘一仝, 李阳
中国科学: 信息科学, 2020, 50(7): 1033-1054
摘要 随着网络信息的剧增,信息流服务备受用户关注.在信息流服务中,如何衡量文本之间的相关度进而从多来源的信息渠道中过滤掉冗余信息提升推荐满意度成为至关重要的环节.当前主流的文本相关度计算方法均是将文本表示为向量,进而通过衡量向量之间的相似度来度量文本间的相关度.然而,信息流中的文本多为新闻文本,这些文本的核心是其描述的事件,基于此需要从事件的角度挖掘文本的核心特征进而利用其计算文本间的相关度.当前针对事件的研究大多数着眼于句子级别.事实上,在计算文本相关度时,需要从篇章级别把握文章的内容.故此,篇章级的事件分析更有影响力.为此,本文在句子级事件抽取的基础上,提出了一种篇章级的事件表示方法,其利用句子级事件的抽取结果构建篇章事件连通图,并选取图中重要的节点作为篇章级事件的代表,之后利用篇章级的事件表示结果来度量文本之间的相关度.实验显示,本文提出的文本相关度计算方法要远好于传统的文本相关度计算方法.
关键词 篇章事件连通图; 篇章级事件相关度; 文本排序; 关键子句筛选; 子句连通图; passage event connection graph; passage-level event correlation; textrank; selection of key sentence; sentence-level connection graph;
Ming LIU, Zihao ZHENG, Bing QIN, et al. Text correlation calculation based on passage-level event representation. Sci Sin Inform, 2020, 50(7): 1033-1054, doi: 10.1360/SSI-2019-0272
领域大数据知识图谱专题
顾及时空特征的地理知识图谱构建方法
张雪英, 张春菊, 吴明光, 闾国年
中国科学: 信息科学, 2020, 50(7): 1019-1032
摘要 地理知识是人类对地理现象或事物空间分布、演变过程和相互作用规律的认知结果.当前大数据环境下的地理信息服务,普遍存在"数据海量、信息爆炸、知识难求"现象.地理知识图谱是一种利用语义网络对地理概念、实体及其相互关系进行形式化描述的知识系统,在地理知识理解、地学问题求解、时空预测决策等方面具有巨大的应用潜力.地理知识除了具有通用知识的内涵和特点之外,还具有特定的时空特征和地学机理特点.因此,地理知识图谱构建和应用既具有一定的通用性,同时具有一定的专业特殊性.本文结合地理知识的时空特征和知识图谱的表达形式,提出了一种顾及时空特征的地理知识图谱构建方法.首先,系统梳理了地理知识图谱构建的基本思路和技术流程,并简要阐述了地理知识获取、地理知识抽象与表达、地理知识组织与管理3个关键环节的主要研究内容及其进展.其次,从地理学回答的基本问题出发,对地理知识的内容特征进行概括和抽象,构建了涵盖"地理概念–地理实体–地理关系" 3个层次的地理知识表达模型,用于描述不同粒度地理知识语义单元的基本组成及其逻辑关系.最后,借鉴知识图谱采用的语义网络知识表示方法,提出了基于"过程–关系"的地理知识表示方法.该方法以时间和空间特征为基本条件,以地理实体的状态划分为基础,实现了地理实体演化过程以及复杂地理关系的形式化描述.本文的研究成果有效解决了融合时空间维度的地理知识结构化表达和形式表示问题,为地理知识获取、融合、推理与应用奠定了基础.同时,在地质、环境、气象等地学领域具有一定通用性,对地学知识服务的推进具有重要参考价值.
关键词 地理实体; 时空特征; 地理知识表达模型; 地理知识形式化; 地理知识图谱; geographical entity; spatio-temporal feature; geographical knowledge representation model; geographical knowledge formalization; geographical knowledge graph;
Xueying ZHANG, Chunju ZHANG, Mingguang WU, et al. Spatio-temporal features based geographical knowledge graph construction. Sci Sin Inform, 2020, 50(7): 1019-1032, doi: 10.1360/SSI-2019-0269
领域大数据知识图谱专题
基于简介文本的中文人物关系图谱属性补全与纠错
杨一帆, 马进, 王海涛, 何正球, 陈文亮, 张民
中国科学: 信息科学, 2020, 50(7): 1003-1018
摘要 一个准确丰富的人物关系图谱不仅能够为大众提供人物实体的清晰介绍和人物之间的相互关联,而且能够为智能服务系统提供有效的知识支持.目前大多知识来源均以百科类表格数据为起点,在此基础上构建知识图谱.本文主要描述如何充分利用百科类文本数据构建高质量的人物关系图谱.为解决表格数据中存在属性缺失和错误的问题,我们采用模式匹配和深度学习模型相结合的策略从文本数据中自动学习属性值,进行属性补全和纠错,有效提高了知识图谱的覆盖率和正确率.
关键词 知识图谱; 人物关系图谱; 属性补全与纠错; 信息抽取; knowledge graph; inter-personal relation knowledge graph; attribute identification; information extraction;
Yifan YANG, Jin MA, Haitao WANG, et al. Attribute identification for Chinese inter-personal relation knowledge graph based on encyclopedic text. Sci Sin Inform, 2020, 50(7): 1003-1018, doi: 10.1360/SSI-2019-0243
基于层次化混合特征图的链路预测方法
李冬, 申德荣, 寇月, 林梦儿, 聂铁铮, 于戈
中国科学: 信息科学, 2020, 50(2): 221-238
摘要 现实世界中的实体连同关联关系构成了一种网络关系结构即异构信息网络.利用链路预测技术可以预测出异构信息网络中存在但未被观察到,或者未来可能会出现的链路,更好地帮助用户理解网络的结构生成和演化规律.然而,目前链路预测技术缺乏对多种特征的有效融合而影响预测准确性,且难以适应异构信息网络的异构性和动态性.本文提出了一种层次化混合特征图模型(hierarchical hybrid feature graph, HHFG),充分考虑了异构信息网络的拓扑特征、语义特征和时序特征.提出了一种基于HHFG的链路预测算法,基于混合特征在HHFG上做随机游走,并采用梯度下降法学习特征权重,转移系数等参数,有效地保证了链路预测的准确性.通过实验验证了本文所提出的关键技术的可行性和有效性.
关键词 链路预测; 层次化混合特征图; 异构信息网络; 随机游走; 参数学习; link-prediction; hierarchical hybrid-feature graph; heterogeneous information networks; random walk; parameters learning;
Dong LI, Derong SHEN, Yue KOU, et al. Research on a link-prediction method based on a hierarchical hybrid-feature graph. Sci Sin Inform, 2020, 50(2): 221-238, doi: 10.1360/N112018-00223
基于动态注意力GRU的特定目标情感分类
李丽双, 周安桥, 刘阳, 钱爽, 耿浩彭
中国科学: 信息科学, 2019, 49(8): 1019-1030
摘要 特定目标情感分类是一个极具挑战的任务,其目的是确定上下文语境中某些实体所表达的情感.由于目标实体的情感依赖于实体本身以及对上下文的理解,在分类时应该同时考虑句子和目标实体,并且需要将目标实体与上下文语义进行充分的整合.因此,本文提出:(1)句子、目标实体联合编码方法;(2)基于动态注意力DAGRU (dynamic attention gated recurrent unit)的特定目标情感分析方法.联合编码是指同时对句子和目标实体进行语义编码,能为目标实体增加上下文语义;动态注意力机制能动态地改变模型对上下文单词的注意力以及目标实体的表示,从而更有效地获取上下文情感特征,使模型更准确地识别不同目标实体的情感类别.本文模型在SemEval2014的两个数据集Laptop, Restaurant上进行实验,实验结果表明,基于动态注意力DAGRU的模型相比基于标准注意力的模型结果有显著提高.
关键词 注意力机制; GRU; 情感分析; 深度学习; 自然语言处理; attention mechanism; GRU; sentiment analysis; deep learning; natural language processing;
Lishuang LI, Anqiao ZHOU, Yang LIU, et al. Aspect-based sentiment analysis based on dynamic attention GRU. Sci Sin Inform, 2019, 49(8): 1019-1030, doi: 10.1360/N112018-00280
汉语词的非字面义的表示与应用
陈龙, 饶琪, 刘扬
中国科学: 信息科学, 2019, 49(8): 1005-1018
摘要 作为一种意合型语言,汉语由字组词的特性明显,字面义词的词义大体可由其构词结构和语素概念来表达,但对非字面义词的处理存在偏差,这也是语言深度理解中的一个棘手问题.本文从语言认知的角度出发,提出了适用于汉语词的非字面义的知识表示方式:发掘《现代汉语词典》中的3524个非字面义二字词,判定它们作为隐喻或转喻现象的非字面义类型,标注其在《同义词词林》中的源域、目标域,并选取面向计算的适合的字面义词承担者.该工作首次在词汇级别上,系统地揭示了汉语隐喻和转喻现象的数量、类型及语义域映射分布状况,并且在算法框架不变的情况下,显著改善了词义相似度计算效果.这些思路、做法及语言资源建设,有望推动人文领域和计算应用等相关工作的深入开展.
关键词 汉语概念词典; 语素; 语素概念; 语义构词; 字面义; 非字面义; 隐喻; 转喻; Chinese object-oriented lexicon; morpheme; morphemic concept; semantic word formation; literal meanings; non-literal meanings; metaphor; metonymy;
Long CHEN, Qi RAO, Yang LIU. Knowledge representation of non-literal meanings of Chinese words and its applications. Sci Sin Inform, 2019, 49(8): 1005-1018, doi: 10.1360/N112018-00266
支持可扩展的在线社交网络数据放置方法
周经亚, 樊建席, 王进
中国科学: 信息科学, 2018, 48(3): 329-348
摘要 在线社交网络的兴起吸引了越来越多用户的加入,面对数以亿计的用户量,如何以一种可扩展的方式存储用户数据已成为社交服务提供商和学术界共同关注的热点问题.目前广泛采用的分布式键值存储通过Hash方法将用户数据随机放置在不同的存储服务器上,这种方法会导致数据中心内部巨大的通信量,不利于社交网络的扩展.本文针对社交网络中用户交互的特点,提出一种社交图划分与数据复制相结合的数据放置方法;进一步考虑数据中心网络拓扑,针对具体拓扑结构,设计数据放置算法,并分别讨论了算法对社交网络规模的增量调整以及分布式实现.在真实数据集上的比较实验结果表明本文所提出的算法能够有效降低社交网络数据中心内部通信量,增强其可扩展性.
关键词 在线社交网络; 数据放置; 数据中心网络; 社交局部性; 位置局部性; online social networks; data placement; data center networks; social locality; position locality;
Jingya ZHOU, Jianxi FAN, Jin WANG. Data placement approach for scalable online social networks. Sci Sin Inform, 2018, 48(3): 329-348, doi: 10.1360/N112017-00064
从大数据到大知识工程专刊
基于多特征多核哈希学习的大规模图像检索
曾宪华, 袁知洪, 王国胤, 杨洁
中国科学: 信息科学, 2017, 47(8): 1109-1126
从大数据到大知识工程专刊
混合分类/回归模型的用户年龄识别方法
陈敬, 李寿山, 王晶晶, 周国栋
中国科学: 信息科学, 2017, 47(8): 1095-1108
从大数据到大知识工程专刊
基于块密度加权标签路径特征的Web新闻在线抽取
吴共庆, 刘鹏程, 胡骏, 胡学钢
中国科学: 信息科学, 2017, 47(8): 1078-1094
从大数据到大知识工程专刊
基于随机行走N步的汉语复述短语获取方法
马军, 张玉洁, 徐金安, 陈钰枫
中国科学: 信息科学, 2017, 47(8): 1066-1077
从大数据到大知识工程专刊
基于社交属性的时空轨迹语义分析
殷浩腾, 刘洋
中国科学: 信息科学, 2017, 47(8): 1051-1065
从大数据到大知识工程专刊
利用编码器-解码器学习依存边翻译规则表示
陈宏申, 刘群
中国科学: 信息科学, 2017, 47(8): 1036-1050
从大数据到大知识工程专刊
基于用户在线查询行为的民航异常需求发现
许强永, 林友芳, 万怀宇, 吴丽娜, 贾旭光
中国科学: 信息科学, 2017, 47(8): 1023-1035
从大数据到大知识工程专刊
基于Spatial-DCTHash动态参数网络的视觉问答算法
孟祥申, 江爱文, 刘长红, 叶继华, 王明文
中国科学: 信息科学, 2017, 47(8): 1008-1022
从大数据到大知识工程专刊
聊天机器人中用户出行消费意图识别方法
钱岳, 丁效, 刘挺, 陈毅恒
中国科学: 信息科学, 2017, 47(8): 997-1007
泛在操作系统理论、技术与开源生态构建专题
BrickOS: 面向异构硬件资源的积木式内核
古金宇, 李浩, 夏虞斌, 管海兵, 丁佐华, 赵永望, 陈海波
中国科学: 信息科学, 2024, 54(3): 491-513
摘要 人机物融合的新兴领域需要新型操作系统内核以支持泛在计算,对下管控海量异构硬件,对上服务动态多变应用场景.本文提出一种积木式内核架构BrickOS,可以根据使用场景灵活选择要加入内核的系统组件,同时可以选择将系统组件运行在用户态以提供较好的安全性,或者运行在共享地址空间的内核态中以提升性能.为了保障运行在相同地址空间中的系统组件的安全性, BrickOS为底层硬件的内存保护机制提供了统一的抽象,并将其用于单地址空间的内存隔离.测试结果表明BrickOS可以根据不同场景生成定制化内核,并拥有较低的进程间通信(inter-process call, IPC)开销,整体性能良好.
关键词 操作系统内核; 组件编排; 进程间通信; 内存隔离; operating system kernel; components arrangement; inter-process communication; memory isolation
Jinyu GU, Hao LI, Yubin XIA, et al. BrickOS: specialized kernels for heterogeneous hardware resources. Sci Sin Inform, 2024, 54(3): 491-513, doi: 10.1360/SSI-2022-0413
一种基于列计算的空间并置模式挖掘方法
杨培忠, 王丽珍, 王晓璇, 周丽华
中国科学: 信息科学, 2022, 52(6): 1053-1068
摘要 空间并置(co-location)模式挖掘旨在发现空间特征间的关联关系.一个并置模式是空间特征集合的子集,它们的实例在空间中频繁并置出现.传统的并置模式挖掘方法大多基于表实例计算模式的并置程度,但表实例的生成和存储将导致巨大的时间、空间消耗.针对这一问题,本文提出了一种基于列计算的空间并置模式挖掘方法,不再生成表实例,只需要搜索模式的参与实例.为了加速参与实例搜索,设计了实例搜索空间剪枝、候选参与实例验证、频繁性提前感知等优化策略.在此基础上,提出了CPM-Col算法,讨论了算法的复杂度、正确性和完备性.在真实和模拟数据集上进行了大量实验,实验结果表明,本文提出的算法比其他7个baseline算法具有更好的性能和可扩展性,特别地,CPM-Col算法的效率提升达到数倍至数个量级.此外,实验验证了本文提出的优化策略的有效性.
关键词 空间数据挖掘; 并置模式; 列计算; 搜索算法; 剪枝技术; spatial data mining; co-location pattern; column calculation; search algorithm; pruning technique;
Peizhong YANG, Lizhen WANG, Xiaoxuan WANG, et al. A spatial co-location pattern mining approach based on column calculation. Sci Sin Inform, 2022, 52(6): 1053-1068, doi: 10.1360/SSI-2020-0384
组合云系统可靠性概念漂移在线度量方法研究
王磊, 张云秋, 徐丙凤, 徐逸卿
中国科学: 信息科学, 2021, 51(9): 1438-1450
摘要 随着全球云计算产业规模的迅速增长,采用按需付费的方式,基于云服务组合实现大规模软件服务的动态集成和协同,从而构造复杂软件,已成为一种切实可行的方法.所构建的组合云系统运行在动态、不确定的环境下,如何应对系统运行可靠性数据流的概念漂移问题,保障系统运行质量,是一个亟待解决的挑战性问题.为给针对组合云系统的可靠性自适应提供早期指导,本文基于主动式缺陷管理思想,研究组合云系统运行风险的在线感知方法,提出基于Sinkhorn距离的可靠性概念漂移在线度量方法 RCDMeas.这一方法通过引入熵正则化和不动点迭代,计算系统历史累积的可靠性流数据和临近的可靠性流数据的分布距离,从而识别组合云系统可靠性概念漂移及系统潜在运行风险.大规模数据实验结果验证了本文方法的有效性.本文的工作对服务组合系统的自动化运维具有重要的理论意义与实际应用价值.
关键词 组合云系统; 可靠性; 概念漂移; 在线; 运行质量保障; composite cloud systems; reliability; concept drift; online; execution quality assurance;
Lei WANG, Yunqiu ZHANG, Bingfeng XU, et al. Reliability concept drift online measurement for composite cloud systems. Sci Sin Inform, 2021, 51(9): 1438-1450, doi: 10.1360/SSI-2020-0117
基于路径相似度的并行程序多路径覆盖调度序列排序
潘峰, 巩敦卫, 田甜, 姚香娟, 李吟
中国科学: 信息科学, 2021, 51(4): 565-581
摘要 测试是提高软件可靠性的重要方法.消息传递并行程序中存在的不确定通信语句,使得进程执行顺序具有不确定性,这增加了测试该类程序的难度.鉴于进程执行顺序对目标路径覆盖难易程度的影响,本文研究消息传递并行程序多路径覆盖调度序列排序方法,以提高多路径覆盖测试数据生成的效率.首先,在每个调度序列下,以每个采样的程序输入执行程序,生成路径覆盖矩阵;然后,针对每条目标路径,分别计算与路径覆盖矩阵中每条路径的相似度,生成多个路径相似度矩阵;接着,基于这些路径相似度矩阵的特征量,评价调度序列的性能,并依此对调度序列排序;最后,基于调度序列排序集,使用随机采样法,生成覆盖所有目标路径的测试数据,并使用缺陷检测平均百分比(average percentage of faults detected, APFD)指标评估调度序列排序集.将所提方法应用于9个基准并行程序中,并与随机方法和传统方法进行比较.实验结果表明,所提方法对路径覆盖率没有影响,但显著减少了被测程序执行次数和运行时间.
关键词 消息传递并行程序; 多路径覆盖; 测试; 调度序列排序; 路径相似度; message-passing parallel program; multi-path coverage; testing; scheduling sequence sorting; path similarity;
Feng PAN, Dunwei GONG, Tian TIAN, et al. Path similarity-based scheduling sequence sorting for multi-path coverage of parallel programs. Sci Sin Inform, 2021, 51(4): 565-581, doi: 10.1360/SSI-2019-0113
基于互联网群体智能的拼图问题求解
申博, 张伟, 赵海燕, 金芝, 吴艳红
中国科学: 信息科学, 2021, 51(2): 206-230
摘要 拼图游戏是一类复杂问题的典型代表.这类问题的复杂性体现在其无法通过自上而下、集中控制的方式进行有效求解.通常情况下,拼图游戏由一个玩家独立完成,或由几个玩家围坐在一起协同完成.本文提出一种基于互联网人类群体智能的拼图问题求解方法.该方法使用一种被称为"探索–融合–反馈"的回路用于支持人类玩家群体在互联网环境中进行并行、协同的拼图问题求解.其中,探索活动由玩家实施,融合与反馈活动由拼图环境自动实施.在探索活动中,每个玩家独立进行拼图问题的求解,不与其他玩家发生直接的交互.在任何时刻,一个玩家探索活动的结果是一个关于当前拼图问题的片段解,以及一组被该玩家判断为错误的图块邻接关系.在融合活动中,拼图环境实时地将所有玩家的当前探索结果融合在一起,形成一个不断演化的群体观点图.在反馈活动中,对于每一个玩家,拼图环境根据该玩家的当前探索结果和当前的群体观点图,向该玩家推荐特定的信息,以加速其拼图进程.我们实现了一个支持上述方法的多人在线拼图环境,并在2~10人规模的玩家群体中进行了初步的实验.实验结果表明:(1)在这一多人拼图环境中,拼图求解时间大致正比于玩家数量的倒数,且以玩家群体中的最强个体为基准点,群体拼图效率能够实现31.36%~64.57%的提升;(2)在该环境中,最快完成拼图的玩家获得的反馈信息平均具有86.34%的准确率,且随着群体规模的增加,反馈信息在最快玩家拼图结果中的平均占比逐渐从20%增加到45%左右;(3)相比于面对面协同的群体拼图求解方式,该环境展示出更好的群体规模可扩展性,且拼图结果总是具有100%的正确率,而拼图问题自动求解算法平均只具有52%的正确率.我们希望本文工作能够为探索群体智能在互联网环境下的更广泛应用提供一些有用的信息或观点.
关键词 人类群体智能; 互联网; 复杂问题求解; 拼图问题; 信息融合与反馈; collective human intelligence; Internet; complex problem solving; pictorial jigsaw puzzle; information integration and feedback;
Bo SHEN, Wei ZHANG, Haiyan ZHAO, et al. Solving pictorial jigsaw puzzles via Internet-based collective intelligence. Sci Sin Inform, 2021, 51(2): 206-230, doi: 10.1360/SSI-2019-0150
可成长软件专题
指挥控制系统自主适变解决方案研究
赵鑫, 郭成昊, 黄强, 张煜, 于靖
中国科学: 信息科学, 2020, 50(11): 1665-1679
摘要 围绕如何构建能够在高动态战场环境下持续保障多样化任务完成的指挥控制系统,依据可成长软件理论、方法,提出了一套指挥控制系统的自主适变解决方案;首先建立了具备自主适变能力的指挥控制系统总体架构模型,并构建了面向深度软件定义的核心任务保障框架;在此基础上,给出了基于"环境认知环–决策执行环"的"双环"自主适变机制,以实现面向任务保障的主动感知、适变控制和重构演化;最后基于所构建的技术验证原型系统进行了运行等级转进、资源受损下的业务持续运行等典型场景下的仿真试验验证.
关键词 指挥控制系统; 可成长软件; 自主适变; 核心任务保障; command and control systems; growing software systems; autonomous adaptability; core-mission assurance;
Xin ZHAO, Chenghao GUO, Qiang HUANG, et al. Solution study for building autonomous adaptive command and control systems. Sci Sin Inform, 2020, 50(11): 1665-1679, doi: 10.1360/SSI-2020-0119
可成长软件专题
面向大规模集群的柔性配置更新推送方法
唐震, 王伟, 黄宇, 李艳林, 纪树平, 宋傲, 魏峻, 黄涛
中国科学: 信息科学, 2020, 50(11): 1645-1664
摘要 配置管理是支撑云服务提供商管理大规模容器集群的重要基础设施.这一规模的集群通常包含百万量级的容器实例,如何根据不同业务场景的需求,及时可靠地将配置更新推送至对其感兴趣的容器实例,是亟待解决的关键问题.然而,现有方法仍存在不足之处.保障顺序一致性的共识算法限制了集群的扩展能力,难以适用于大规模集群.反熵算法存在长尾现象,时延难以保障,不适用于推送关键的配置更新.为了应对上述挑战,本文提出了一种面向大规模集群的柔性配置更新推送方法.这一方法基于发布/订阅机制,引入基于完全N叉树拓扑的可定义的多层次推送,并使用订阅者的部分计算资源协助推送,以提升推送性能;引入容错机制以应对节点失效和网络分区,保障网络分区时多分区读写可用.方法的拓扑参数和策略可根据业务场景对性能、可靠性等维度的不同需求而调整.实验结果表明,与现有的方法相比,我们的方法可以有效降低更新推送的时延,并可有效应对节点失效和网络分区场景.
关键词 更新推送; 配置管理; 完全N叉树; update delivery; configuration management; complete N-ary tree;
Zhen TANG, Wei WANG, Yu HUANG, et al. Flexible configuration update delivery for large clusters. Sci Sin Inform, 2020, 50(11): 1645-1664, doi: 10.1360/SSI-2020-0126
可成长软件专题
意图敏感的日志自动增强
贾周阳, 李姗姗, 刘晓东, 王戟, 廖湘科
中国科学: 信息科学, 2020, 50(11): 1612-1628
摘要 高质量的日志代码是软件故障诊断的重要依据.由于缺乏统一规范、开发人员不够重视等原因,现有软件中的日志质量参差不齐.目前,已有工作致力于日志的自动化增强,主要分为基于易错模式的方法和基于代码特征的方法,这些方法通过总结软件易错代码模式或学习已有日志代码的代码特征,进而在相应的代码段中自动添加日志语句.但开发人员添加日志代码的意图往往难以用固定的模式或特征来描述,导致日志增强的准确性不高.因此,本文探索了意图敏感的日志增强方法,提出了一种日志意图描述模型(log-intention description model, LIDM),在此基础上设计和实现了自动化日志增强工具SmartLog. SmartLog利用LIDM提取日志代码意图,挖掘日志增强规则,进而实现意图敏感的日志自动增强.本文在6款成熟且被广泛使用的开源软件上对SmartLog的有效性展开了评估.评估结果显示, SmartLog的准确性相比两个已有最好的日志增强工具分别提升43%和16%.此外,本文收集了软件演化过程中86个开发人员增加日志的实例,并使用SmartLog和两个已有工具分析每次日志演化的旧软件版本,发现3个工具可自动在新软件版本添加的日志分别是49, 10, 22个,软件演化效率相比已有工作显著增强.
关键词 日志增强; 故障诊断; 日志演化; 软件意图; 日志自动化; log enhancement; failure diagnosis; log evolution; software intention; log automation;
Zhouyang JIA, Shanshan LI, Xiaodong LIU, et al. Intention-aware log automation. Sci Sin Inform, 2020, 50(11): 1612-1628, doi: 10.1360/SSI-2020-0111
软件技术前沿专题
高可信众包群体构建方法
冯洋, 王祎, 房春荣, 郭楠楠, 陈振宇
中国科学: 信息科学, 2019, 49(11): 1412-1427
摘要 构建高可信众包群体是众包活动的一个重要挑战.目前,众包机制研究主要集中在激励众包个体,而忽略了能够反映微服务质量的高诚信众包群体的构建.本文根据通过融合委托–代理模型和信号博弈理论提出了一种新颖的高可信众包群体构建机制.该机制实现了众包工人和发包方的信息交换,并通过随机质量审查来为诚信/失信工人提供动态的经济激励/惩罚.本文通过大规模的仿真实验来对该机制进行验证.实验结果表明该机制具有良好的有效性和高效性,能够通过极小的代价让能力强但失信的工人在任务提交前改正行为做出诚信决策.
关键词 可信众包; 众包机制; 信号博弈理论; 委托代理模型; trustful crowd-sourcing; crowd-sourced mechanisms; signaling game theory; principal-agent model;
Yang FENG, Yi WANG, Chunrong FANG, et al. An approach for developing a highly trustworthy crowd-sourced workforce. Sci Sin Inform, 2019, 49(11): 1412-1427, doi: 10.1360/N112018-00303
软件技术前沿专题
软件数字社会学
周明辉, 张宇霞, 谭鑫
中国科学: 信息科学, 2019, 49(11): 1399-1411
摘要 随着互联网不断发展,软件开发(尤其是全球开源开发)面临诸多问题和挑战,如分布在全球的开发者个体差异明显,群体协作的困难度增加,并且广泛的社会参与形成复杂生态等.这些问题使得软件开发呈现出很强的社会学特征.因此,本文提出软件数字社会学来刻画和应对以上问题的挑战,涉及个体学习、群体协作和可持续生态.本文对核心研究方法——软件开发活动数据的挖掘和分析进行了讨论,并初步探讨了已经形成态势的开源供应链的重要问题.软件数字社会学可以启发研究者们更好地理解软件开发面临的关键挑战并探索更好的解决方案.
关键词 软件数字社会学; 软件活动数据; 个体学习; 群体协作; 开源生态; 软件供应链; 数据质量; software digital sociology; software-activity data; individual learning; group collaboration; opensource ecosystem; software supply chain; data quality;
Minghui ZHOU, Yuxia ZHANG, Xin TAN. Software digital sociology. Sci Sin Inform, 2019, 49(11): 1399-1411, doi: 10.1360/N112018-00319
软件自动化前沿进展专题
一种静态的编译器重复缺陷报告识别方法
陈俊洁, 胡文翔, 郝丹, 熊英飞, 张洪宇, 张路
中国科学: 信息科学, 2019, 49(10): 1283-1298
摘要 编译器缺陷报告在编译器质量保证中具有重要作用,而重复缺陷报告往往带来不必要的人力、时间等资源浪费.为了识别编译器重复缺陷报告,本文提出了一种静态的重复缺陷报告识别方法IdenDup.该方法可以有效解决两个场景下的重复缺陷报告问题,即模糊测试(fuzz testing)所产生的缺陷报告和缺陷管理系统中不同来源的缺陷报告.具体来说, IdenDup利用缺陷报告中静态文本和程序特征来识别重复缺陷报告,其中程序特征包括程序词法、语法,以及本文首次提出的数据流特征.特别地,程序数据流特征指的是程序中变量使用路径(变量使用方式及使用方式的顺序)特征.之后,我们使用C语言的两个主流编译器GCC和LLVM作为实验对象,对IdenDup的效果进行了实验探究.实验结果表明, IdenDup可以有效地识别上述两个场景下的重复缺陷报告,并且超过已有方法.
关键词 编译器调试; 编译器缺陷报告; 重复缺陷报告; 数据流分析; 静态方法; compiler debugging; compiler bug report; duplicate bug report; dataflow analysis; static approach;
Junjie CHEN, Wenxiang HU, Dan HAO, et al. Static duplicate bug-report identification for compilers. Sci Sin Inform, 2019, 49(10): 1283-1298, doi: 10.1360/N112019-00001
一种高效的面向动态有向图的增量强连通分量算法
廖小飞, 陈意诚, 张宇, 金海, 刘海坤, 赵进
中国科学: 信息科学, 2019, 49(8): 988-1004
摘要 强连通分量(strongly connected component, SCC)算法可以将一个有向图缩略为有向无环图(directed acyclic graph, DAG),广泛应用于可达性查询等有向图分析应用.尽管现有工作已经提出多种面向静态有向图的强连通分量算法,但是它们需要高额的运行时开销来反复对整个图进行全量计算,以响应现实世界中普遍存在的动态有向图结构的频繁变化.其实,在通常情况下,动态有向图每次改变量极小(少于5%).其允许我们以增量的方式对动态有向图进行强连通分量计算,以缩短响应时间.因此,为解决此问题,本文提出了一种高效的面向动态有向图的增量强连通分量算法Incremental Strongly Connected Components Algorithm,简称Inc-SCC,通过对不必要的计算进行裁剪以减少算法的数据访问量和计算量,并利用SCC的不相交性进行并行处理以提升SCC计算效率.其次,提出了一种启发式优化方法进一步加快算法收敛速度.实验结果显示,本方法可以用于实时响应有向图持续性动态变化,并且当整个有向图的边变化比例为5%时,本方法相对于现有算法的加速比可达2.8到12倍,当整个有向图的边变化比例为0.5%时,本方法相对于现有算法的加速比可达2.9到12倍.
关键词 强连通分量; 动态有向图; 增量计算; 收敛; 有向无环图; strongly connected components; evolving directed graph; incremental computation; convergence; directed acyclic graph;
Xiaofei LIAO, Yicheng CHEN, Yu ZHANG, et al. An efficient incremental strongly connected components algorithm for evolving directed graphs. Sci Sin Inform, 2019, 49(8): 988-1004, doi: 10.1360/N112018-00125
无标注L型Petri网语言属性判定的一种方法
栾尚敏, 田立勤, 耿子林
中国科学: 信息科学, 2017, 47(6): 696-714
基于组合IIS路径抽取的组合线性混成系统有界可达性分析优化
解定宝, 周岳翔, 卜磊, 王林章, 李宣东
中国科学: 信息科学, 2017, 47(3): 288-309
软件缺陷预测中基于聚类分析的特征选择方法
刘望舒, 陈翔, 顾庆, 刘树龙, 陈道蓄
中国科学: 信息科学, 2016, 46(9): 1298-1320
算术表达式的一种可信计算算法及其软件ISReal
赵世忠
中国科学: 信息科学, 2016, 46(6): 698-713
智能时代的人机交互专刊
基于Bots的人机交互界面范式
王慧, 姚乃明, 董健, 朱频频, 陈辉
中国科学: 信息科学, 2018, 48(4): 475-484
摘要 以聊天机器人为代表的Bots带动了以用户为中心的全新交互体验.基于多通道自然语言交互的Bots不再依赖于桌面的图形环境,源于桌面隐喻的传统WIMP(windows,icon,menu,pointor)范式也不再适用于基于Bots的人机交互,因此需要建立一种新的支持移动交互的界面范式来规范界面的描述.为此,本文对化身隐喻(avatar metaphor)进行扩展,提出了基于化身交互隐喻的ASLI(avatar,scenario,language,instrument)界面范式,并给出了基于ASLI范式的界面实例和交互框架,为基于Bots的人机交互系统提供了界面设计的指导.最后,讨论了未来ASLI范式的平台化发展趋势和衍生的生态系统.
关键词 Bots; 人机交互; 界面范式; 化身隐喻; Bots; human-computer interaction; interface paradigm; avatar metaphor;
Hui WANG, Naiming YAO, Jian DONG, et al. Interface paradigm of Bots-based human-computer interaction. Sci Sin Inform, 2018, 48(4): 475-484, doi: 10.1360/N112017-00210
智能时代的人机交互专刊
基于语义三角形的自然人机交互模型
刘胜航, 陈辉, 朱嘉奇, 武汇岳, 熊金泉, 王宏安
中国科学: 信息科学, 2018, 48(4): 466-474
摘要 随着认知科学与移动计算技术的发展与应用,如何构建与评估自然用户界面成为越来越重要的问题.为此,本文在分析了自然人机交互主要特征的基础上,指出了自然语言的使用及其语义理解的重要性,借用语言学的语义三角形模型,提出了基于语义三角形的自然人机交互模型.该模型诠释了自然人机交互场景下,人与计算机之间信息流转与理解过程.最后,基于该模型给出了自然性、连续性和易学性3个评估要素的评估思路.
关键词 自然人机交互; 自然用户界面; 语义三角形; 自然人机交互模型; 用户界面评估; natural HCI; NUI; semiotic triangle; natural HCI model; user interface evaluation;
Shenghang LIU, Hui CHEN, Jiaqi ZHU, et al. A model for natural human-computer interaction based on semiotic triangle. Sci Sin Inform, 2018, 48(4): 466-474, doi: 10.1360/N112017-00214
智能时代的人机交互专刊
面向人类智能增强的多模态人机交互
王党校, 郑一磊, 李腾, 彭聪, 王丽君, 张玉茹
中国科学: 信息科学, 2018, 48(4): 449-465
摘要 人机和谐是人机交互的理想境界和永恒追求.近年来人工智能的蓬勃发展使得机器智能不断进步,引发了对于人类智力造成挑战的担忧.能否利用多模态人机交互技术实现人类智能的训练和强化,是人机交互研究的新命题.神经可塑性研究成果表明,人类的核心认知能力,如注意力控制能力、工作记忆容量等,有望通过视听觉交互任务、触觉交互任务、经颅电磁刺激、脑机接口等技术进行训练和强化.本文通过剖析虚拟现实系统的沉浸感、交互性、想象性的本质优势,结合工程控制论思想,提出面向人类智能增强的视听触觉多模态有机融合的人机交互机制.通过构建可控认知负荷、及时生理反馈、双向体脑交互的新型人机交互系统,探索基于Hebbian learning可塑性机制的智能增强方法.该研究将为揭示和认识人脑神经可塑性机制提供新的研究工具,同时将促进新型人机交互的硬件设备和软件方法研究,并将在个性化教育、神经康复、特种职业认知能力强化等领域产生应用价值.
关键词 神经可塑性; 触觉交互; 视听触融合; 人机交互; 注意力; 工作记忆; 智能增强; neural plasticity; haptic interaction; haptic-visual-aural multisensory feedback; human-machine interaction; attention; working memory; cognitive enhancement;
Dangxiao WANG, Yilei ZHENG, Teng LI, et al. Multi-modal human-machine interaction for human intelligence augmentation. Sci Sin Inform, 2018, 48(4): 449-465, doi: 10.1360/N112017-00213
智能时代的人机交互专刊
多通道人机交互信息融合的智能方法
杨明浩, 陶建华
中国科学: 信息科学, 2018, 48(4): 433-448
摘要 本文首先简要回顾了认知科学在单通道信息加工及多通道信息融合方面的假定;其次,介绍了计算机科学在多通道信息融合方面相对于单通道信息处理增强的理论模型及实验验证.在各通道特征能够同时获得并统一表示的前提下,多通道人机交互信息的融合可以转化为分类或者回归问题求解.对于实际的交互系统,目前的多通道信息融合技术除了依赖单通道信息识别的准确性外,还依赖于交互系统设计的合理性.最后通过一个多通道信息融合的人机交互的实例,讨论了目前多通道交互系统的缺陷,并给出多通道人机交互信息融合智能方法未来的一个突破方向.
关键词 多通道信息融合; 人机交互; 机器学习; 模式识别; 认知科学; multi-modal information fusion; human-computer interaction; machine learning; pattern recognition; cognitive science;
Minghao YANG, Jianhua TAO. Intelligence methods of multi-modal information fusion in human-computer interaction. Sci Sin Inform, 2018, 48(4): 433-448, doi: 10.1360/N112017-00211
智能时代的人机交互专刊
普适计算环境中用户意图推理的Bayes方法
易鑫, 喻纯, 史元春
中国科学: 信息科学, 2018, 48(4): 419-432
摘要 本文阐述了通过Bayes方法来预测用户交互意图的建模方法过程和推理过程.在自然交互界面上,用户不再是严格地通过离散明确的交互操作完成交互,而是通过连续、非确定的多模态数据表达交互意图.在解释用户的交互意图时,既可以使用"黑盒子"的机器学习方法,也可以利用"白盒子"的基于用户行为建模的方法.后者中的用户建模,其本质是通过计算的方法来刻画用户的行为能力,对于理解用户意图和探索自然交互的计算原理具有重要的科学意义.文章回顾了近年来人机交互研究中主要采用的智能算法,向读者厘清不同方法之间的差别,并通过我们实验室的具体研究工作展示用户建模的方法和Bayes推理的建模方法过程和推理过程.
关键词 Bayes方法; 机器学习; 意图推理; 用户建模; Bayes method; machine learning; intent prediction; user modelling;
Xin YI, Chun YU, Yuanchun SHI. Bayesian method for intent prediction in pervasive computing environments. Sci Sin Inform, 2018, 48(4): 419-432, doi: 10.1360/N112017-00228
智能时代的人机交互专刊
智能时代的人机交互范式
张小龙, 吕菲, 程时伟
中国科学: 信息科学, 2018, 48(4): 406-418
摘要 本文首先介绍范式的含义,然后讨论人机交互领域中范式这一概念的使用.以人机交互领域最有影响力的WIMP范式为例,讨论界面范式所包含的主要成分,并在此基础上分析了目前主要的智能系统的界面的特点和不足.最后本文提出了针对智能系统界面设计的RMCP界面范式,强调智能系统界面设计需要考虑系统的角色(role)、交互模态(modal)、交互命令(commands)和信息展示方式(presentation style)这几个基本因素.
关键词 人机交互; 界面范式; 智能系统; human-computer interaction; interface paradigm; intelligent system;
Xiaolong ZHANG, Fei LYU, Shiwei CHENG. Interaction paradigm in intelligent systems. Sci Sin Inform, 2018, 48(4): 406-418, doi: 10.1360/N112017-00217
基于双向哈希链表的异构内存页迁移机制
裴颂文, 姬燕飞, 沈天马, 刘海坤
中国科学: 信息科学, 2019, 49(9): 1138-1158
摘要 随着大数据技术的快速发展,大规模访问存储器的需求随之剧增,导致访问动态随机访问存储器DRAM的高耗能问题越来越突出.大容量、低能耗的非易失性内存NVM技术逐渐成熟,有望被广泛应用于异构内存计算机系统.基于访问内存页的历史记录,本文针对异构内存系统提出了一种双向哈希链表的异构内存页迁移机制(THMigrator),将频繁访问的内存页从PCM或STT-RAM迁移到DRAM,并用能效分析模型(EEAM)评估了异构内存系统的能效.实验结果表明, THMigrator迁移机制比采用多级队列迁移机制MQMigrator的系统计算性能提升了9.3%,系统平均能效比提升了17%;THMigrator比采用随机迁移机制CoinMigrator的系统平均能效比提升了26%.
关键词 页迁移; 双向哈希链表; 异构系统; 非易失性内存; 迁移方法; page migration; two-way Hash chain list; heterogeneous systems; non-volatile memory; migration algorithm;
Songwen PEI, Yanfei JI, Tianma SHEN, et al. Migration mechanism of heterogeneous memory pages using a two-way Hash chain list. Sci Sin Inform, 2019, 49(9): 1138-1158, doi: 10.1360/N112018-00246
面向智能应用的定制计算加速器技术专题
低功耗神经网络计算芯片技术研究
严佳乐, 张颖, 涂锋斌, 杨建勋, 郑时轩, 欧阳鹏, 刘雷波, 谢源, 魏少军, 尹首一
中国科学: 信息科学, 2019, 49(3): 314-333
摘要 当前人工智能引发了全球的热潮,它涵盖了图像识别、视频检索、语音识别、自动驾驶等各类智能应用.在人工智能算法中,神经网络算法扮演着举足轻重的作用,也成为了当前的研究热点.但是神经网络算法本身具有灵活性高、计算复杂、数据量大的特点,这也对计算平台提出了高性能、低功耗、高灵活性及高存储等方面的需求.针对神经网络专用芯片,本文提出了可重构硬件架构来满足神经网络的灵活性需求,以可重构架构为基础的Thinker系列可以执行多类神经网络运算.在该架构基础上,本文探究了相应的数据访存优化方案来降低功耗.在存储系统优化方面,基于eDRAM的神经网络加速方案和计算存储一体化ReRAM方案可以满足神经网络计算在存储性能及低功耗方面的需求,它们配合可重构硬件架构可以实现全新的神经网络加速框架.在高效计算方面,本文针对低比特神经网络的标准卷积计算提出基于积分和基于滤波器拆分特征重建的优化方案,以此满足高性能需求.
关键词 人工智能; 神经网络算法; 神经网络专用芯片; 可重构架构; 低功耗; artificial intelligence; neural network algorithms; neural network accelerator; reconfigurable hardware architecture; low power;
Jiale YAN, Ying ZHANG, Fengbin TU, et al. Research on low-power neural network computing accelerator. Sci Sin Inform, 2019, 49(3): 314-333, doi: 10.1360/N112018-00282
新一代软件定义体系结构
吕平, 刘勤让, 邬江兴, 陈鸿昶, 沈剑良
中国科学: 信息科学, 2018, 48(3): 315-328
摘要 体系结构在信息系统中起着举足轻重的作用,不仅决定了系统的功能和性能,而且决定了系统的效能和安全,因此,体系结构直接决定着信息系统的先进性.本文在介绍体系结构概念的基础上,对体系结构的发展进行了归纳总结,分析指出体系结构刚性是当前信息系统灵活性和高效能无法兼备的问题本质,提出了以软件定义互连和软件定义节点为特征的新一代软件定义体系结构,基于软件定义体系结构实现了Web服务、口令字恢复和图像识别3种典型系统,对比测试表明,软件定义体系结构系统较传统通用系统性能提升29.4~344.5倍,效能提升13.7~315.4倍,证明了软件定义体系结构的高灵活性和高效能.
关键词 信息系统; 软件定义互连; 软件定义节点; 软件定义体系结构; information system; software defined interconnection; software defined node; software defined architecture;
Ping LV, Qinrang LIU, Jiangxing WU, et al. New generation software-defined architecture. Sci Sin Inform, 2018, 48(3): 315-328, doi: 10.1360/N112017-00204
基于S3变换的TriBA-Net最短路径路由机制
石峰, 陈旭, 尹飞, 王小军, 胡森森, 计卫星, 王一拙, 高玉金, 卫晋
中国科学: 信息科学, 2018, 48(1): 100-114
摘要 片上网络中路由算法的设计对芯片的性能有直接的影响.本文针对TriBA-Net网络提出一种新颖的最短路径.路由算法.首先,基于TriBA-Net网络设计了一种编码方法,该编码方法中所用到的文字1,3,2的集合与群论中的三文字集S_3群具有相同的含义.其次,设计了一种相隔节点间的通信模型,根据通信路径端点的可能状态,将通信划分为6种宏观数据流动模式.最后,利用S_3群的循环置换特性对通信模型进行简化,在XC6VLX550TL芯片上完成了SPR4T路由器的设计实现.实验结果表明,在27个节点的TriBA-Net网络性能测试中,在均衡负载模式下,与SPORT路由算法相比,SPR4T路由算法的饱和注入率提升7.5%,吞吐率提升7.7%,而且有效降低了硬件以及功耗的开销.
关键词 片上网络; 路由算法; 编码方法; 拓扑结构; 性能评估; networkon-chip; routing algorithm; coding scheme; topology; performance evaluation;
Feng SHI, Xu CHEN, Fei YIN, et al. A shortest path routing mechanism based on S3 for TriBA-Net. Sci Sin Inform, 2018, 48(1): 100-114, doi: 10.1360/N112017-00065
一类多容错的阵列纠删码
唐聃, 舒红平
中国科学: 信息科学, 2016, 46(4): 523-538
代表扫描——一种低功耗可测试性设计结构
张玲, 王伟征
中国科学: 信息科学, 2016, 46(4): 511-522
基于时序特征的移动模式挖掘
陈勐, 刘洋, 王月, 禹晓辉
中国科学: 信息科学, 2016, 46(9): 1288-1297