计算机 人工智能 论文 Website Google Scholar

面向异构数据的自适应个性化联邦学习——一种基于参数分解和持续学习的方法

Adaptive personalized federated learning for heterogeneous data: a method based on parameter decomposition and continual learning

倪宣明, 沈鑫圆, 张海
中国科学: 信息科学, 2022, 52(12): 2306-2320
摘要 联邦学习允许资源受限的边缘计算设备协作训练机器学习模型,同时能够保证数据不离开本地设备,但也面临着异构数据下全局模型收敛缓慢甚至偏离最优解的挑战.为解决上述问题,本文提出一种自适应个性化联邦学习(adaptive personalized federated learning, APFL)算法,在同时包括空间和时间维度的多任务学习框架下,考虑面向异构数据的联邦优化问题.首先, APFL采用参数分解策略,将待训练模型参数分解为全局共享参数和客户端特定参数,在提取所有客户端公共知识的同时实现针对每个客户端的个性化建模.进一步地, APFL将每个客户端上执行的局部优化构建为顺序多任务学习,通过对全局共享参数的更新施加弹性权重巩固(elastic weight consolidation, EWC)惩罚,实现了全局共享模型中重要参数的记忆保留和非重要参数的快速学习.多个联邦基准数据集上的对比实验验证了本文方法的有效性和优越性.
关键词 联邦学习; 边缘计算; 异构数据; 多任务学习; 持续学习; 参数分解; 个性化; federated learning; edge computing; heterogeneous data; multi-task learning; continual learning; parameter decomposition; personalization;

计算机 人工智能 论文 Website Google Scholar

基于特征增广的生成—判别混合模型构建方法

A feature augmentation-based method for constructing generative-discriminative hybrid models

张文钧, 蒋良孝, 张欢
中国科学: 信息科学, 2022, 52(10): 1792-1807
摘要 从概率框架的角度来看,生成模型首先由数据学习联合概率分布,然后再求出条件概率分布,通常具有更快的收敛速度;而判别模型由数据直接学习条件概率分布,往往具有更高的准确率.生成–判别混合模型作为二者的有效结合,同时集成了它们的优点.然而,现有方法在构建混合模型时,需要将原始特征划分为两个独立的特征空间,分别用于训练生成模型和判别模型.特征划分不仅提升了模型的时间复杂度,还削弱了原始特征空间的表达能力.为了解决这一问题,本文提出了一种基于特征增广的生成–判别混合模型构建方法.该方法首先利用生成模型学习条件概率分布,然后将学到的条件概率分布作为新特征增广到原始特征空间中,最后在增广后的特征空间中训练判别模型并预测最终的分类结果.该方法利用特征增广的思想做模型混合,无需对原始特征进行划分,具有较低的时间复杂度,同时还增强了原始特征空间的表达能力.在36个经典UCI标准数据集上的实验结果表明,所提方法不仅具有有效性和通用性,还遵循了偏差–方差权衡原则.
关键词 生成模型; 判别模型; 特征增广; 条件概率分布; 偏差–方差权衡; generative model; discriminative model; feature augmentation; conditional probability distribution; bias-variance trade-off;

计算机 人工智能 论文 Website Google Scholar

基于多尺度空洞卷积的知识图谱表示方法

Multi-scale dilated convolutional network for knowledge graph embedding

杜昊桐, 王震, 聂弘毅, 姚权铭, 李学龙
中国科学: 信息科学, 2022, 52(7): 1204-1220
摘要 知识图谱嵌入是知识图谱研究中的一项重要课题.它旨在根据已观测到的三元组,学习知识图谱中实体与关系的低维向量表示.知识图谱嵌入在许多下游任务中发挥了巨大作用,例如知识图谱补全、三元组分类.如今,深度模型利用神经网络强大的非线性拟合能力,在知识图谱嵌入领域展示出了优异的性能.然而,现有的大多数方法忽略了实体与关系之间的多尺度特征交互, InceptionE是目前唯一考虑到了多尺度交互特征的模型,但由于大量的计算开销导致其很难进行训练.本文提出了一种全新的知识图谱嵌入模型MDCE,它使用多尺度空洞卷积核在不同的尺度空间捕捉丰富的交互特征.同时, MDCE相比于InceptionE方法的计算开销更小.我们在多个基准数据集上进行了大量实验.在链接预测任务上的结果表明, MDCE不仅在性能方面超过了已有的工作,而且更加高效、稳健.
关键词 知识图谱; 知识图谱嵌入; 深层模型; 多尺度特征; 链接预测; 人工智能; knowledge graph; knowledge graph embedding; deep model; multi-scale feature; link prediction; artificial intelligence;

计算机 人工智能 论文 Website Google Scholar

基于独立自表达学习的不完全多视图聚类

Incomplete multi-view clustering via independent self-representation learning

诸葛文章, 范瑞东, 罗廷金, 陶红, 侯臣平
中国科学: 信息科学, 2022, 52(7): 1186-1203
摘要 不完全多视图聚类是通过结合多视图数据的异构不完全特征来获得数据本征结构,从而提高聚类性能的一种学习范式.在实际应用中,各个视图除了缺失某些完整样本外,还会受到缺失值与异常值的影响,使得大部分传统的不完全多视图聚类方法失效.为解决上述问题,本文提出一种基于独立自表达学习的不完全多视图聚类方法.该方法通过自表达重构,补全缺失的特征的同时学习视图独有的自表达矩阵,然后为自表达矩阵添加低秩约束,更好地挖掘本征结构,并通过引入希尔伯特–施密特独立性准则来衡量不同视图间的差异性.多个数据集上的实验结果表明,所提方法在大多数情况下能取得较对比方法更优的聚类结果.
关键词 不完全多视图聚类; 特征任意缺失; 自表达; 差异性; incomplete multi-view clustering; arbitrary missing feature; self-presentation; diversity;

计算机 人工智能 论文 Website Google Scholar

珠算: 可微概率编程库的设计与实现

ZhuSuan: design and implementation of differentiable probabilistic programming libraries

石佳欣, 陈键飞, 朱军
中国科学: 信息科学, 2022, 52(5): 804-821
摘要 概率模型为机器学习处理广泛存在的不确定性提供了强大的工具.概率编程利用计算机程序表示概率模型,支持采样和以任意观察值为条件进行的概率推断.长期以来,概率程序中的依赖关系往往是线性或广义线性的,许多成功的模型和推断算法往往都依赖于这一简化.然而,这也限制了概率程序的表达能力和灵活性.可微概率编程允许构建具有参数化的非线性依赖关系(如神经网络)的概率程序,并使用基于梯度的方法从数据中学习未知参数.这种编程范式容易扩展,极大地避免了繁琐的模型选择过程,且允许端到端地部署概率模型.本文介绍珠算(ZhuSuan),一种开源的可微概率编程库,并以此为例,探讨可微概率编程系统的设计与实现.
关键词 概率模型; 概率编程; 贝叶斯推断; 变分推断; 深度学习; probabilistic models; probabilistic programming; Bayesian inference; variational inference; deep learning;

计算机 人工智能 评述 Website Google Scholar

基于通信的多智能体强化学习进展综述

Review of the progress of communication-based multi-agent reinforcement learning

王涵, 俞扬, 姜远
中国科学: 信息科学, 2022, 52(5): 742-764
摘要 强化学习(reinforcement learning, RL)技术经历了数十年的发展,已经被成功地应用于连续决策的环境中.如今强化学习技术受到越来越多的关注,甚至被冠以最接近通用人工智能的方法之一.但是,客观环境中往往不仅包含一个决策智能体.因此,我们更倾向于以多智能体强化学习(multi-agent reinforcement learning, MARL)为技术手段,应对现实的复杂系统.近十年来,多智能体系统(multi-agent system, MAS)和强化学习的结合日渐紧密,逐渐形成并丰富了多智能体强化学习这个研究方向.回顾MARL的相关工作,我们发现研究者们大致从学习框架的讨论、联合动作学习,以及基于通信的MARL这3个角度解决MARL的问题.而本文重点调研基于通信的MARL的工作.首先介绍选取基于通信的MARL进行讨论的原因,然后列举出不同性质的多智能体系统下的代表性工作.希望本文能够为MARL的研究者提供参考,进而提出能够解决实际问题的MAS方法.
关键词 强化学习; 多智能体系统; 部分可观测环境; 多智能体通信; 协同控制; reinforcement learning; multi-agent system; partially observable environment; multi-agent communication; coordinated control;

计算机 人工智能 评述 Website Google Scholar

基于联邦学习的推荐系统综述

Survey of recommender systems based on federated learning

梁锋, 羊恩跃, 潘微科, 杨强, 明仲
中国科学: 信息科学, 2022, 52(5): 713-741
摘要 随着互联网和移动计算等技术的发展,人们的在线行为产生了越来越多的数据,想要从海量数据中挑选出用户可能喜欢的物品,推荐系统不可或缺.然而传统的推荐算法需要将用户数据收集到服务端才能构建模型,这会泄露用户隐私.最近,谷歌针对机器学习任务中需要收集用户数据才能进行建模的问题,提出了一种新的学习范式——联邦学习.联邦学习与推荐系统相结合,使得联邦推荐算法能够在模型构建过程中,始终将用户数据保留在客户端本地,从而保护了用户隐私.本文主要对联邦学习与推荐系统相结合的研究工作进行综述,并从架构设计、系统的联邦化和隐私保护技术的应用3个角度重点分析联邦推荐算法的研究进展.最后,对基于联邦学习的推荐系统可研究的方向进行展望.
关键词 推荐系统; 联邦学习; 隐私保护; 联邦推荐; 协同过滤; recommender systems; federated learning; privacy protection; federated recommendation; collaborative filtering;

计算机 人工智能 论文 Website Google Scholar

局部-全局关系耦合的低照度图像增强

Local-global coupling relationship based low-light image enhancement

王克琪, 钱宇华, 梁吉业, 刘畅, 黄琴, 陈路, 贾洁茹
中国科学: 信息科学, 2022, 52(3): 443-460
摘要 卷积神经网络目前在人工智能多个领域均取得了不同程度的进展.卷积计算是基于参数共享的滑窗机制,这导致卷积神经网络更多地关注特征信息的局部关系,对全局关系的建模能力有限.局部关系和全局关系对特征的表达均具有重要的作用.为此,本文聚焦于如何对特征信息的局部–全局关系进行构建并有效耦合,从而挖掘更加丰富的特征信息,提高特征的判别性.本文提出了局部–全局关系耦合模块,该模块是由特征提取、基于深度卷积(depth-wise convolution, DWConv)的局部关系构建分支、基于多头自注意力机制(mutli-head self-attention, MHSA)的全局关系构建分支和基于点向卷积(point-wise convolution, PWConv)的关系耦合4部分组成.基于此模块,本文构建了编解码结构的局部–全局关系耦合神经网络,该网络可以对特征信息的局部–全局关系进行建模,增强特征信息的表征能力,进而提升模型的性能.为验证所提算法的有效性,本文在低照度图像增强任务上,使用基准数据集与其他算法进行了实验对比.实验结果表明,本文所提出的方法取得了较好的图像增强结果,优于当前先进的图像增强方法.最后,本文通过消融实验和扩展实验从多个角度进一步验证了有效耦合局部–全局关系的重要性和可扩展性.
关键词 低照度图像增强; 局部–全局关系; 计算机视觉; 卷积神经网络; 深度学习; low-light image enhancement; local-global relationship; computer vision; convolution neural network; deep learning;

计算机 人工智能 论文 Website Google Scholar

基于特征归因和泰勒展开引导重要度评价的梯度流剪枝

Gradient flow pruning based on the evaluation of the importance of characteristic attribution and Taylor-guidance

高畅, 王家祺, 景丽萍, 于剑
中国科学: 信息科学, 2022, 52(3): 430-442
摘要 卷积神经网络压缩是近年来研究的热点.本文将模型存在冗余的原因归结为部分卷积核未学到任务相关特征.为去除这部分冗余,本文基于剪枝框架,从卷积核学习任务相关特征的程度和卷积核对损失函数的影响两个角度出发,提出一种新颖的重要度评价标准.此评价标准能准确量化卷积核的重要度,并以此指导卷积核剪枝操作.此外,本文还将梯度流策略引入到卷积核剪枝的过程中,在每次训练迭代中根据重要性和压缩率将卷积核分成两类并对它们分别用不同的更新策略.对于冗余参数,此策略将目标函数反传的梯度进行截流,仅使其权重逐渐衰减直至为零.本文在VGGNet和ResNet两种网络框架上对此剪枝算法进行验证.结果表明:本算法不仅能够在分类精度、计算量、参数量和任务相关特征的保留程度上优于当前主流剪枝算法,而且在高压缩率情况下表现优越.
关键词 卷积神经网络; 压缩; 剪枝; 任务相关特征; 梯度流; convolutional neural networks; compressing; pruning; features related to task; gradient flow;

计算机 人工智能 论文 Website Google Scholar

群体智能系统的动力学模型与群体熵度量

Dynamic model and crowd entropy measurement of crowd intelligence system

罗杰, 姜鑫, 郭炳晖, 郑宏威, 吴文峻, 吕卫锋
中国科学: 信息科学, 2022, 52(1): 99-110
摘要 群体智能是自然界普遍存在的现象,受到了国内外研究者的广泛关注.网络和人工智能技术的高速发展,使得大规模群体在网络上通过个体智慧激发和群体智慧汇聚形成超越个体能力的群体智能成为可能.随之而来,如何认知和形成这样的群体智能系统成为了研究的热点.本文将在广义群体智能的概念体系之下,探索群体智能系统的度量理论和方法,以此来促进对群体智能形成机理的更深层认知.本文提出了群体智能系统的基本特性以及其形成的激发汇聚建模,指出群体智能系统实质上是一类复杂非线性动力学系统,包含微观个体激发、宏观群体协作、全局群智汇聚3个核心动力学属性.并以此为基础,讨论了群体智能系统群体熵度量所应满足的基本性质.最后以图的群体化搜索为例,说明了群体的激发和汇聚过程,以及在此过程中如何通过群体熵来度量群体行为的变化,验证了本文提出的群体熵度量思想的有效性.
关键词 群体智能系统; 动力学模型; 群体熵; 度量; 激发; 汇聚; crowd intelligence system; dynamic model; crowd entropy; measurement; incentive; convergence;

计算机 人工智能 论文 Website Google Scholar

面向半监督聚类的最优间隔分布学习机

Optimal margin distribution machine for semi-supervised clustering

张腾, 黎铭, 金海
中国科学: 信息科学, 2022, 52(1): 86-98
摘要 基于间隔的聚类是一类经典的聚类算法,此类算法假设聚类结构能通过引入监督学习中的间隔来确定.即一个好的聚类结果,当以其簇标记作为类别标记进行监督学习时,所得分类器产生的关于间隔的目标物理量也同时达到最优.目前最为有效的间隔物理量是间隔分布,其基于最新的间隔理论,取得了比优化最小间隔更好的效果.然而在现实聚类任务中,我们往往还能获得一些额外的监督信息,例如两两样本之间的"必连"约束和"勿连"约束,此时优化间隔分布是否还有效尚未可知.对此,本文提出面向半监督聚类的最优间隔分布学习机(ODMSSC),对该问题进行初步探索. ODMSSC对应的形式化是一个混合整数规划,我们将其放松成一个鞍点问题,并提出一种高效的交替优化方法进行求解.最终通过真实数据集上的实验,我们验证了所提算法的有效性.
关键词 半监督聚类; 约束聚类; 最优间隔分布学习机; 间隔分布; 间隔; semi-supervised clustering; constrained clustering; optimal margin distribution machine; margin distribution; margin;

计算机 人工智能 论文 Website Google Scholar

连续无监督异常检测

Continual unsupervised anomaly detection

倪一鸣, 陈松灿
中国科学: 信息科学, 2022, 52(1): 75-85
摘要 无监督异常检测(unsupervised anomaly detection, UAD)旨在检测任何未见过的偏离预期模式或正常分布的数据,由于其学习过程不依赖对罕见异常样本的获取,因此在现实动态环境下备受青睐.然而,在现实场景中,目标任务往往会随时间动态变化,这要求模型能够连续执行多个不同的UAD任务,确保在仅有当前任务正常数据的前提下,实现对所有见过任务的异常检测.本文旨在研究这一问题,尝试从互信息角度,提出一种新的连续UAD (CUAD)算法.具体而言,我们针对原始目标依赖过往任务原始数据和异常数据的问题,给出基于信息论的损失函数,并对其进行近似优化.据此,我们构建出来的深度编码器模型既能连续执行不同的UAD任务,又能有效应对连续学习带来的灾难性遗忘问题.最后,我们在多个标准数据集上的实验验证了所提出方法的优越性.
关键词 异常检测; 无监督; 灾难性遗忘; 连续学习; 信息论; anomaly detection; unsupervised; catastrophic forgetting; continual learning; information theory;

计算机 人工智能 论文 Website Google Scholar

基于单簇聚类的非对齐多视图异常检测算法

Non-aligned multi-view anomaly detection algorithms based on one-cluster clustering

史小艳, 陈松灿
中国科学: 信息科学, 2021, 51(12): 2037-2052
摘要 多视图数据广泛存在于现实,而异常也不可避免地伴随其中.现有的多视图异常检测方法针对的都是对齐的多视图场景,无法胜任更具挑战的非对齐多视图场景.为此,本文提出了4种基于单簇可能性C–均值(possibilistic C-means, PCM),即P1M (PCM, C=1)算法的非对齐多视图异常检测算法.不同于对齐的多视图场景,非对齐特性造成了样本在各视图间对应关系的缺失,以致我们无法利用在对齐场景下示例级的局部关键信息.为此,我们设法通过各视图的全局信息进行学习.本文的关键之处在于借助交替优化法为各视图分别学得一个变换矩阵,用其将各视图投影到一个公共子空间,进而在该公共子空间中用P1M学得所有训练数据对目标类的隶属度,并设置隶属度阈值,从而实现异常检测.在多个UCI数据集上的实验结果表明,本文方法能够有效应对非对齐多视图场景中的异常检测.
关键词 可能性C–均值; 非对齐多视图; 异常检测; 公共子空间; 单簇; possibilistic C-means; non-aligned multi-view; anomaly detection; the common subspace; one-cluster;

计算机 人工智能 观点与争鸣 Website Google Scholar

人工智能的10个重大数理基础问题

Ten fundamental problems for artificial intelligence: mathematical and physical aspects

徐宗本
中国科学: 信息科学, 2021, 51(12): 1967-1978
摘要 本文提出并阐述人工智能研究与应用中亟待解决的10个重大数理基础问题:(1)大数据的统计学基础;(2)大数据计算的基础算法;(3)数据空间的结构与特性;(4)深度学习的数学机理;(5)非正规约束下的最优输运;(6)如何学习学习方法论;(7)如何突破机器学习的先验假设;(8)机器学习的自动化;(9)知识推理与数据学习的融合;(10)智能寻优与人工智能芯片问题.
关键词 人工智能; 数理基础; 统计学; 大数据算法; 数据空间; 深度学习; 最优传输; 学习学习方法论; 机器学习假设; 机器学习自动化; AI芯片; artificial intelligence; mathematical and physical foundation of AI; statistics; big data algorithms; data spaces; deep learning; optimal transportation problem; simulate learning methodology; hypotheses on machine learning; machine learning automation; AI chips;

计算机 人工智能 论文 Website Google Scholar

基于隐式网络和显式网络相似性学习的零样本意图识别

Similarity learning with implicit-network and explicit-network for zero-shot intent detection

孙鹏飞, 欧阳亚文, 戴新宇, 张文明
中国科学: 信息科学, 2021, 51(11): 1853-1866
摘要 意图识别是对话系统的一个重要组成部分.现有的工作主要集中在使用充足的标记数据进行意图识别.然而,这些方法不能识别训练数据中不存在的意图.为了解决这个问题,我们提出了一种基于隐式网络和显式网络的相似性学习模型,用于零样本意图识别,该模型能够从词级和句子级学习用户话术和意图描述之间的相似性.为了增强意图的表示,我们引入槽位类型作为意图描述.并依据表达方式的不同将意图分为显式意图和隐式意图,分别从词级和句子级构建显式网络和隐式网络.同时,为了更好地结合这两部分信息,我们还设计了关系层来融合不同层级的信息.在两个基准数据集上的实验结果表明,我们的模型明显优于现有的最先进的模型,并展示了从词级和句子级同时学习相似性的有效性.
关键词 零样本意图识别; 隐式网络; 显式网络; 关系层; 选择门; zero-shot intent detection; implicit network; explicit network; relation layer; switch gate;

计算机 人工智能 论文 Website Google Scholar

三元空间大数据网络关联表征

Cyber-physical-human big data correlational representation

朱文武, 王鑫
中国科学: 信息科学, 2021, 51(11): 1802-1839
摘要 三元空间是由信息空间、物理世界、人类社会所构成,三元空间大数据由信息空间所产生的互联网数据、物理空间所产生的物联网数据和人类社会空间所产生的数据所构成.本文介绍了三元空间大数据的关联复杂性,并针对三元空间大数据关联复杂性这一本质困难,提出解决三元空间异构数据的关联表征这一关键科学问题.传统信息科学往往依据既有的先验信息进行特征表达,并在先验表征空间内分析信息语义及其关联关系.然而,在表征层面所引入的先验偏见,极大限制了信息理解和关联的广度和深度,使得蕴含于三元空间大数据之中的超出人类现有经验的知识难以被发掘.为解决上述难题,本文提出将三元空间数据关联关系通过拓扑图理论表征成网络或图以实现三元空间大数据的关联表征和融合分析.具体地,利用数据驱动的深层网络表征对三元空间异构数据的弱先验关联关系进行深度建模以保持原始数据间的异构关联关系,通过对非线性、非凸异构数据关联表达进行深度解离化计算以提升深层关联表征的鲁棒性与可解释性,借助拓扑图理论挖掘三元空间大数据中蕴含的异构关联关系以达到对三元空间异构关系的精准刻画.最后,本文从知识与数据双驱动、自适应,以及可推理三元空间大数据分析的角度对三元空间大数据关联表征的未来研究方向进行展望.
关键词 三元空间; 大数据; 关联表征; 深层表征; 网络表征; cyber-physical-human space; big data; correlational representation; deep representation; network representation;

计算机 人工智能 论文 Website Google Scholar

基于自适应对偶图与非凸约束的嵌入特征选择

Adaptive dual graphs and non-convex constraint based embedded feature selection

尚荣华, 徐开明, 焦李成
中国科学: 信息科学, 2021, 51(10): 1640-1657
摘要 在传统的特征选择方法中,为了保证行的稀疏性,经常采用l_1范数或者l_(2,1)范数来约束评价矩阵.作为凸正则项,它们在多数情况下可以发挥良好的作用.然而在处理冗余性特征时,一些非凸正则项有望表现出更好的性能.借助自适应流形学习与非凸约束的优点,本文提出了一种新的算法,叫做基于自适应对偶图与非凸约束的嵌入特征选择(adaptive dual graphs and non-convex constraint based embedded feature selection, DNEFS).借助稀疏回归框架, DNEFS同时保留了数据空间与特征空间的流形结构信息.通过运用信息熵原理,对偶图中的局部流形信息可以自适应的学习与更新,因此可以获得更好的特征选择效果.不同于传统的凸约束,本文引入了一个新的非凸正则项,这一正则项由l_(2,1)范数与Frobenius范数的差分构成,并记为l_(2,1-2)范数.通过使用这一新正则项, DNEFS可以更好地处理冗余性的特征.本文运用交替迭代更新的方式来优化目标函数,并在6个基准数据集上测试DNEFS算法的性能.通过与6种对比算法做对比,实验结果表明提出的DNEFS优于对比算法的性能.
关键词 对偶图; 流形结构; 非凸约束; 嵌入; 特征选择; dual graphs; manifold structure; non-convex constraint; embedded; feature selection;

计算机 人工智能 论文 Website Google Scholar

基于本质自表示的多视角子空间聚类

Intrinsic self-representation for multi-view subspace clustering

于晓, 刘慧, 吴彦, 张彩明
中国科学: 信息科学, 2021, 51(10): 1625-1639
摘要 大数据时代,针对高维数据的聚类分析已成为数据挖掘的热点和难点问题,与此同时,近年来数据获取方式的重大变革推动了多视角研究快速兴起.多视角子空间聚类能够针对高维数据进行聚类,已成为目前聚类研究的一个重要分支.然而,现有部分方法直接从原始数据学习相似度矩阵,极易受到数据中噪声的影响.因此,本文提出了一种基于本质自表示的多视角子空间聚类方法 (intrinsic self-representation for multi-view subspace clustering, ISMSC),从数据的潜在表示中学习相似度矩阵,并利用数据的自表达特性将所有视角的特征融合成本质表示.然后,本文使用交替方向乘子法(alternating direction method of multipliers, ADMM)设计了有效的求解策略对模型进行优化.最后,将ISMSC在人造数据集和8个真实基准数据集上的实验结果与9种基准方法进行了对比,结果表明了模型的鲁棒性和有效性.
关键词 多视; 聚类; 子空间; 谱聚类; 稀疏; multi-view; clustering; subspace; spectral clustering; sparse;

计算机 人工智能 论文 Website Google Scholar

基于联合分布核适配的迁移学习及其隐私保护

Transfer learning based on joint distribution kernel adaptation and its privacy protection

倪宣明, 沈鑫圆, 张海
中国科学: 信息科学, 2021, 51(10): 1609-1624
摘要 迁移学习利用不同但相关的源域标记数据来解决目标领域的学习问题,大多数减小域间分布差异的方法依赖于最大均值差异距离,但其仅仅能匹配域间数据分布的各阶矩.此外,隐私保护意识的增强限制了对数据源的访问,对迁移学习的发展提出了新的挑战.本文提出一种基于联合分布核适配的迁移学习及其隐私保护方法,直接在再生核希尔伯特空间中同时减小域间边缘分布和条件分布的差异,从而学习一个域不变核矩阵.此外,我们设置数据源双方首先访问一个相同的随机投影函数,然后聚合器发布基于目标扰动的差分隐私核分类器,在实现基于核的联合分布适配的同时,避免了数据源与聚合器直接共享原始特征数据.在多个文本和图像迁移学习基准数据集上进行了对比实验和参数分析,结果显示本文方法具有良好的有效性.
关键词 迁移学习; 隐私保护; 分布适配; 谱学习; 差分隐私; transfer learning; privacy protection; distribution adaptation; spectral learning; differential privacy;

计算机 人工智能 评述 Website Google Scholar

几何视角下深度神经网络的对抗攻击与可解释性研究进展

Adversarial attack and interpretability of the deep neural network from the geometric perspective

夏萌霏, 叶子鹏, 赵旺, 易冉, 刘永进
中国科学: 信息科学, 2021, 51(9): 1411-1437
摘要 随着深度神经网络在机器学习的各个领域获得广泛成功,其自身所存在的问题也日益尖锐和突出,例如可解释性差、鲁棒性弱和模型训练难度大等.这些问题严重影响了神经网络模型的安全性和易用性.因此,神经网络的可解释性受到了大量的关注,而利用模型可解释性改进和优化模型的性能也成为研究热点之一.在本文中,我们通过几何中流形的观点来理解深度神经网络的可解释性,在通过流形视角分析神经网络所遇到的问题的同时,汇总了数种有效的改进和优化策略并对其加以解释.最后,本文对深度神经网络流形解释目前存在的挑战加以分析,提出将来可能的发展方向,并对今后的工作进行了展望.
关键词 深度学习; 对抗攻击; 可解释性; 流形; deep learning; adversarial attack; interpretability; manifold;

计算机 人工智能 论文 Website Google Scholar

复杂担保网络中传染路径的风险评估

Risk assessment for contagion path in complex loan network

程大伟, 牛志彬, 刘新海, 张丽清
中国科学: 信息科学, 2021, 51(7): 1068-1083
摘要 中小企业贷款在促进技术创新、推动经济发展、改善民生和增加就业等方面有着重要的作用.为了满足商业银行的贷款评估标准,很多中小企业选择互相提供担保以获得授信,形成了结构复杂的担保网络.当借款方的贷款违约时,风险则沿着担保方向在网络中层层传播,由此造成的潜在系统性风险给国家的金融安全和监管带来了严峻的挑战.因此,迫切需要发展相应的方法从系统角度对复杂金融担保网络中的传染路径进行风险评估和预测.本文提出了一种基于深度学习的风险评估模型,该方法应用图神经网络和注意力机制直接从网络化的贷款行为数据中学习风险特征,无需依赖于金融领域专业知识的人工特征工程.实验结果表明,本文设计的方法在多数评价指标上均优于现有的7个对比的基准模型.在传染路径风险评估任务中,比基准方法在精确率和召回率的调和平均数(F1-score)方面平均提升了2%~15%.在新路径风险评估任务中,比最好的基准方法平均提升了3.5%.结果表明了本文设计方法在传染路径风险评估中的有效性,可为监管部门和金融机构对担保网络进行系统性风险评估提供方法理论基础.
关键词 风险评估, 传染路径, 担保网络, 图神经网络, 注意力机制

计算机 人工智能 论文 Website Google Scholar

EL-Picker: 基于集成学习的余震P波初动实时拾取方法

El-Picker: a machine learning-enhanced robust P-phase picker for real-time seismic monitoring

申大忠, 张琦, 徐童, 祝恒书, 赵雯佳, 殷子凯, 周培伦, 房立华, 陈恩红, 熊辉
中国科学: 信息科学, 2021, 51(6): 912-926
摘要 在实时地震监测中,地震P波(primary wave)的初动拾取任务具有至关重要的作用,其有助于地震应急响应的及时实施.虽然此前在该领域已开展了大量的研究,但是如何从地震分布密集并且充满噪声的监测波形中有效地识别出P波仍然是一个具有挑战性的任务.例如对于大地震的余震监测,实践中使用的普遍方法仍依赖于专家辅助标注.本文针对地震实时监测任务,基于集成学习策略,提出一个全新的技术框架——EL-Picker,实现从连续地震波形中自主拾取P波的初动到时.具体而言,EL-Picker包含3个模块,即触发器、分类器和精化器.其中,分类器模块借鉴集成学习策略,实现对多个个体学习器的整合,提升整体模型性能.基于汶川Ms8.0地震的余震数据集进行的大量实验,我们发现EL-Picker不仅较好地实现P波初动拾取效果,并且多诊断出120%被人工遗漏的地震P波.同时,实验结果也启发我们探索如何针对不同的地震站台选取个性化的个体学习器构建分类器模块.此外,我们进一步地讨论了被人工遗漏的地震波形的规律特点,用于指导人工地震标注.这些发现清晰地验证了EL-Picker框架的鲁棒性、时效性、灵活性以及稳定性.
关键词 P波拾取, 机器学习, 集成学习, 汶川余震, 实时地震监测

计算机 人工智能 论文 Website Google Scholar

联邦学习下对抗训练样本表示的研究

Towards training time attacks for federated machine learning systems

冯霁, 蔡其志, 姜远
中国科学: 信息科学, 2021, 51(6): 900-911
摘要 联邦机器学习系统由于能够在多方之间训练联合模型而无需各方共享训练数据,因此在学术界和工业界都获得了越来越多的关注和应用.与传统的机器学习框架相比,这类系统被认为具有保护数据隐私的良好潜力.另一方面,训练阶段攻击是一种通过故意扰动训练数据,从而希望在测试时操纵相应的学习系统预测行为的攻击方法.例如, DeepConfuse是最近的一种高效生成对抗训练数据的方法,展示了传统监督学习范式在此类攻击下的脆弱性.在本文中,作者扩展了DeepConfuse方法,将其应用在联邦机器学习框架中.这是首次针对联邦学习系统的训练阶段攻击.实验结果表明,在δ–准确率损失的衡量标准下,相比于传统的机器学习框架,联邦学习系统在DeepConfuse攻击下更加脆弱.
关键词 联邦学习, 学件, 表示学习

计算机 人工智能 论文 Website Google Scholar

一种基于对抗学习和语义相似度的社交网络跨媒体搜索方法

A cross-media search method for social networks based on adversarial learning and semantic similarity

刘翀, 杜军平, 周南
中国科学: 信息科学, 2021, 51(5): 779-794
摘要 社交网络蕴含着丰富的多媒体信息,如何实现社交网络跨媒体信息的搜索已成为研究热点.基于深度学习的单一模态语义特征提取和学习在社交网络信息搜索上取得了较好的效果.在跨模态信息搜索时不同模态的数据特征不能直接比较,因此不同模态之间的语义鸿沟是亟待解决的关键问题.针对上述问题,本文提出了一种基于对抗学习和语义相似度的跨媒体搜索方法,实现了文本和图像之间的相互匹配、排序和搜索.该方法使用对抗学习方法框架构建训练特征映射网络和模态判别网络,其中特征映射网络使用多维语义分布向量将不同模态的数据映射到同一语义空间中,使得相同语义下的不同模态数据在该空间距离小,不同语义下相同模态数据距离大.使用语义分布及相似度作为特征映射网训练依据,模态判别网络负责判定空间中不同数据的模态.基于对抗学习交替训练两个网络,使得特征映射网络得到的数据和原数据语义一致,并消除模态特性,最终在同一空间内使用相似度来排序并得到搜索结果.实验结果表明本文提出的方法在文本和图像的相互搜索的map值比同类方法高,并验证了该方法在社交网络安全话题数据上的有效性.
关键词 跨媒体搜索; 对抗学习; 语义相似度; 社交网络; 搜索排序; cross-media retrieval; adversarial learning; semantic similarity; social network; search and rank;

计算机 人工智能 论文 Website Google Scholar

稀疏连接的异步池计算网络

Sparsely connected asynchronous reservoir computing network

薄迎春, 张欣, 刘宝, 王平
中国科学: 信息科学, 2021, 51(5): 764-778
摘要 针对池计算网络的构建问题,提出了一种稀疏连接的异步神经元池构造方法,该方法将多个子神经元池顺序连接,并在子神经元池之间设置滞后环节,以实现各子神经元池对输入信息的异步处理,进而构成串行的记忆.为实现信息高效传输,子神经元池之间采用稀疏的连接方式.实验表明,所提方法能够有效地提高神经元池的记忆容量,易于解决长时依赖问题.此外,该结构能够使神经元池产生丰富的动力学行为,对初始参数也有较好的鲁棒性.
关键词 人工神经网络; 池计算; 记忆; 鲁棒性; 动力学; artificial neural network; reservoir computing; memory; robustness; dynamics;

计算机 人工智能 观点与争鸣 Website Google Scholar

精准智能理论: 面向复杂动态对象的人工智能

Refined intelligence theory: artificial intelligence regarding complex dynamic objects

郑志明, 吕金虎, 韦卫, 唐绍婷
中国科学: 信息科学, 2021, 51(4): 678-690
摘要 新一轮科技革命和产业变革正在萌发,以深度学习和大数据为基础,以Alpha Go等为典型应用场景掀起了人工智能的第3次高潮.传统的基于统计线性化动态建模的人工智能,在处理复杂对象时遇到了可解释性、泛化性和可复现性等发展瓶颈,迫切需要建立基于复杂性与多尺度分析的新一代人工智能理论,我们称之为精准智能.针对复杂系统的非线性特征,精准智能构建内嵌领域知识和数学物理机理的系统学习理论,包括复杂数据科学感知、复杂系统精准构建、复杂行为智能分析3个层次.具体而言,通过复杂数据科学感知建立内嵌时空特征与数理规律等具有可解释性的科学数据系统;通过复杂系统精准构建反演具有非线性复杂逻辑关系的多层次、多尺度、可解释的人工智能动态学习模型;通过对系统复杂行为智能分析建立面向系统行为演进和全局动态分析的可解释可调控人工智能新理论和新方法.将上述精准智能理论应用于群体智能,提出了群体熵方法,实现了群体激发和汇聚行为复杂性度量与有效引导调控.
关键词 人工智能; 可解释性; 非线性; 复杂性; 精准智能; artificial intelligence; interpretability; nonlinearity; complexity; refined intelligence;

计算机 人工智能 论文 Website Google Scholar

生成式对抗网络的不稳定性分析及其处理技术

Instability analysis for generative adversarial networks and its solving

谭宏卫, 周林勇, 王国栋, 张自力
中国科学: 信息科学, 2021, 51(4): 602-617
摘要 生成式对抗网络(generative adversarial networks, GANs)训练的不稳定性问题一直是GANs研究领域最具挑战性的问题之一.目前,仍未从理论上找到影响GANs训练稳定性的根本原因及有效的解决办法.本文通过理论分析发现, GANs训练的不稳定性主要是由于训练最优判别器与最小化生成器之间相互矛盾所致.经逐步分析得出,控制判别器的Lipschitz常数是解决GANs不稳定性问题的关键,进而提出一种有针对性的梯度惩罚技术来解决此问题.最后,本文从损失函数的振荡幅度(收敛性)、梯度总体变化趋势,以及网络整体性能3个方面进行了全面对比实验.结果显示,本文所提出的惩罚技术对处理GANs训练的不稳定性问题具有显著的效果.
关键词 生成式对抗网络; 不稳定性分析; 惩罚技术; 梯度范数; Lipschitz常数; generative adversarial networks; instability analysis; penalty technique; gradient norm; Lipschitz constant;

计算机 人工智能 论文 Website Google Scholar

求解增量二分图优化问题的动态规划驱动的局部搜索算法

A dynamic programming-based local search algorithm for solving the dynamic bipartite drawing problem

彭博, 卢晨贝, 赵岳虎, 苏宙行, 廖毅, 吕志鹏
中国科学: 信息科学, 2021, 51(4): 582-601
摘要 增量二分图优化问题(dynamic bipartite drawing problem, DBDP)是一个具有NP难度的组合优化问题,该问题在实际生产生活中有着广泛的应用.本文提出了一种新的动态规划驱动的局部搜索(DP-LS)算法来求解该问题.不同于文献中求解该问题和该类问题的所有启发式算法的邻域搜索方式(即每次邻域操作只对一个或两个节点进行插入或交换动作),本文提出的动态规划驱动的局部搜索算法能从邻域结构中挑选出并执行多个独立的邻域动作,大大提高了邻域搜索的效率. DP-LS算法从一个随机初始解出发,迭代地利用基于动态规划的局部搜索算法来寻找局部最优解,同时结合扰动机制跳出局部极值陷阱实现全局搜索.本文提出的增量评估方法能够快速评估基于插入和交换的邻域动作,可以大大提高算法的搜索效率.本文针对1120个公共算例进行了计算实验并同文献中已有算法(包括通用求解器Gurobi)进行对比,表明了所提出的动态规划驱动的局部搜索算法在解的优度和计算效率两方面的有效性.此外,通过对比实验表明了DP-LS算法中动态规划机制的有效性(提升近十倍的搜索效率).值得注意的是,本文提出的基于动态规划的局部搜索算法不仅能够用于求解DBDP问题,也能作为一种通用的启发式算法来求解其他组合优化问题,尤其是排序类优化问题.
关键词 增量二分图优化问题; 动态规划; 局部搜索; 增量评估机制; dynamic bipartite drawing problem; dynamic programming; local search; incremental evaluation technique;

计算机 人工智能 刊讯 Website Google Scholar

弱监督学习专题简介

张敏灵, 李宇峰
中国科学: 信息科学, 2021, 51(3): 520-520
关键词 弱监督学习; 多示例学习; 半监督学习;

计算机 人工智能 进展 Website Google Scholar

数据驱动的网络多媒体边缘内容分发

Data-driven multimedia edge network and content delivery

朱文武, 王智
中国科学: 信息科学, 2021, 51(3): 468-504
摘要 近年来,网络多媒体迅猛发展.相较于传统固定网络多媒体内容服务,兴起的移动化多媒体服务中的用户行为发生了根本变化.传统内容分发架构依靠中心化基础设施、全局流行度趋势,无法有效感知和服务移动多媒体内容.利用边缘网络架构结合数据驱动策略服务动态移动多媒体内容,提升服务质量成为一种新的选择.通过数据驱动与跨域协同的研究方法,本文深入研究移动多媒体内容服务规律、系统架构、策略设计等.本文首先探讨数据驱动的大规模移动多媒体内容分发模式挖掘与网络性能分析,揭示边缘多媒体内容分发与传统内容分发的本质区别;进一步,本文给出一般性的边缘多媒体网络与内容分发的研究方法,包括数据驱动与跨域协同的多媒体边缘网络内容分发研究框架.最后,本文给出几种代表性框架,包括基于社交媒体传播预测进行内容部署的SocialCDN,基于内容提供商智能的CPCDN,基于边缘网络设备进行移动多媒体内容分发的EdgeCDN,以及基于用户众筹资源的CrowdCDN.
关键词 多媒体网络; 大规模内容分发; 数据驱动策略; 边缘计算; 资源分配; multimedia network; large-scale content delivery; data-driven strategies; edge computing; resource allocation;

计算机 人工智能 论文 Website Google Scholar

基于深度线性判别分析的哈希技术

Deep linear discriminant analysis hashing

胡迪, 聂飞平, 李学龙
中国科学: 信息科学, 2021, 51(2): 279-293
摘要 传统基于分类学习的监督哈希方法并不能完全满足哈希检索技术需求,但是线性判别分析却能够在一定程度上做到这一点.本文提出将线性判别分析作为深度网络的优化目标,以端到端训练的方式学习有效的哈希编码.但是,直接以上述目标训练神经网络就必须解决具有较高计算复杂度的特征值分解问题.在本文中,线性判别分析目标被转化为一个简单的最小均方问题,这种转化可以解决上述问题,同时可以利用成熟的优化方法优化网络.这种基于线性判别分析的深度网络拓展可以弥补传统判别分析在简单线性投影和特征学习上的劣势.本文在3个基准数据集上进行大量对比实验,相对于传统线性判别分析,本文所提方法在检索基准指标上有70%的提升,并超过大多数基于深度模型的哈希方法,这些实验结果证明了本文方法的有效性.
关键词 哈希技术; 线性判别分析; 最近邻检索; 深度网络; 量化技术; hashing technique; linear discriminant analysis; nearest-neighbor search; deep network; quantization technique;

计算机 人工智能 论文 Website Google Scholar

基于地质知识蒸馏学习的油气储集层识别方法

Method of oil and gas reservoir detection based on geological knowledge distillation learning

李徵, 刘淇, 王喆锋, 郑毅, 林霞, 怀宝兴, 米兰, 陈恩红
中国科学: 信息科学, 2021, 51(1): 40-55
摘要 油气储集层识别是石油能源企业在勘测和开发业务中核心的任务之一.长期以来,油气行业一直依靠专家人工分析海量测井数据以对地下油气储集层进行定性分析,虽然专家解释结论有着很高的精准度,但是时间与经济成本都十分高昂.近些年来,随着以深度学习为代表的人工智能技术的迅速发展,智能油气储集层识别技术成为学术界和工业界共同关注的问题.然而,真实工业环境存在严重的传感数据不一致问题,给传统的监督学习模型带来巨大的挑战.本文针对传感器不一致情境中油气储集层识别任务展开研究,提出多尺度地质知识蒸馏网络的方法.首先,该方法提出一种多尺度特征自注意力融合机制来学习地质信息的多尺度动态表征.其次,该方法设计一种地质知识蒸馏学习模型,从非一致传感数据中学习额外的地质知识,进一步提升模型准确度.最后,在真实数据集上进行大量实验,结果充分证明本文提出的模型在油气储集层识别任务上的有效性和鲁棒性.
关键词 油气储集层识别; 地质知识; 蒸馏学习; 传感数据; 深度神经网络; oil and gas reservoirs detection; geological knowledge; distillation learning; sensor data; deep neural network;

计算机 人工智能 论文 Website Google Scholar

K-近邻分类器鲁棒性验证: 从约束放松法到随机平滑法

Robustness verification of K-NN classifiers via constraint relaxation and randomized smoothing

王璐, 姜远
中国科学: 信息科学, 2021, 51(1): 27-39
摘要 本文研究K-近邻分类器的鲁棒性验证问题.形式化鲁棒性验证的目标是计算分类器在给定样本点上的最小对抗扰动的精确值或者最小对抗扰动的非平凡下界.我们将计算K-近邻分类器的最小对抗扰动形式化为一组二次规划问题.二次规划问题的数目随近邻参数K的增大呈指数级增长,精确求解该组二次规划问题往往不可行.约束放松法通过放松优化的约束项,可以在多项式时间内求解最小对抗扰动的下界.然而,本文通过理论分析和实验发现,当近邻参数K取值较大时,约束放松法求得的下界往往过于宽松,甚至会出现K越大下界越小的反直觉结果.为解决这一问题,本文提出使用随机平滑法对K-近邻分类器进行鲁棒性验证.随机平滑法利用了K-近邻分类器对高斯(Gauss)白噪声鲁棒的特点,获得了较为理想的鲁棒性验证效果.基准数据集上的实验结果表明,相比于最新的鲁棒神经网络,"随机平滑的" K-近邻分类器展现出了更好的验证鲁棒性.
关键词 监督学习; 对抗机器学习; 对抗鲁棒性; 鲁棒性验证; K-近邻分类器; supervised learning; adversarial machine learning; adversarial robustness; robustness verification; K-NN classifier;

计算机 人工智能 论文 Website Google Scholar

基于特征归因重要度评价的卷积网络剪枝

Convolution network pruning based on the evaluation of the importance of characteristic attributions

张彪, 杨朋波, 桑基韬, 于剑
中国科学: 信息科学, 2021, 51(1): 13-26
摘要 近几年,深度模型在诸多任务中取得了巨大成功,但是深度模型需要大量的存储和计算资源实现精确决策,研究者为了将深度模型应用到资源受限的终端设备中,设计了模型压缩的优化策略来降低模型占存和计算量.本文基于剪枝压缩框架,从卷积核重要度评价的角度提出了两种模型剪枝算法.(1)由于每个卷积核都可以学习到其独有特征信息,因此本文提出了一种归因评价机制用于评价卷积核所学特征与因果特征的相关度,将模型中与因果特征相关度较低的卷积核进行裁剪,以实现模型压缩的目的,同时也能够保留原模型的归因特征,称此算法为归因剪枝.(2)第2种剪枝算法基于迭代优化剪枝框架,采用卷积通道和梯度中正相关特征评价相应卷积核重要度,以便于提高剪枝冗余卷积核的精准度,称为Taylor-guided剪枝算法.本文在VGGNet和ResNet两种网络架构上进行实验验证,结果表明:归因剪枝算法可以极大地保留原模型的归因特征;并且两种剪枝算法能够取得比当前主流剪枝算法更优异的压缩效果.
关键词 深度学习; 网络剪枝; 归因; 压缩; Taylor展开; deep learning; network pruning; attribution; compression; Taylor expansion;

计算机 人工智能 论文 Website Google Scholar

基于决策树模型重用的分布变化流数据学习

Learning from distribution-changing data streams via decision tree model reuse

赵鹏, 周志华
中国科学: 信息科学, 2021, 51(1): 1-12
摘要 在很多真实应用中,数据以流的形式不断被收集得到.由于数据收集环境往往发生动态变化,流数据的分布也会随时间不断变化.传统的机器学习技术依赖于数据独立同分布假设,因而在这类分布变化的流数据学习问题上难以奏效.本文提出一种基于决策树模型重用的算法进行分布变化的流数据学习.该算法是一种在线集成学习方法:算法将维护一个模型库,并通过决策树模型重用机制更新模型库.其核心思想是希望从历史数据中挖掘与当前学习相关的知识,从而抵御分布变化造成的影响.通过在合成数据集和真实数据集上进行实验,我们验证了本文提出方法的有效性.
关键词 机器学习; 分布变化; 流数据; 模型重用; 集成学习; 动态环境; machine learning; distribution change; data stream; model reuse; ensemble methods; dynamic environments;

计算机 生物信息 论文 Website Google Scholar

基于自注意力机制生成对抗网络的超分辨率磁共振图像重建

Super-resolution reconstruction of MR image with self-attention based generate adversarial network algorithm

蒋明峰, 支明豪, 李杨, 李铁强, 张鞠成
中国科学: 信息科学, 2021, 51(6): 959-970
摘要 高分辨率的磁共振图像可以提供细粒度的解剖信息,但是获取数据需要较长的扫描时间.本文提出了一种基于自注意力机制生成对抗网络的超分辨率磁共振图像重构方法 (SA-SR-GAN),利用生成对抗网络从低分辨率磁共振图像生成高分辨率磁共振图像,将自注意力机制集成到超分辨率生成对抗网络框架中,用于计算输入特征的权重参数,同时引入了谱归一化处理,使判别器网络训练过程更加稳定.本文使用40组3D磁共振图像(每组图像包含256个切片)训练网络,并用10组图像进行测试.实验结果表明,所提出的超分辨率自注意力生成对抗网络方法生成的超分辨率的磁共振图像的PSNR和SSIM值高于同类比较方法.
关键词 磁共振图像, 超分辨率, 生成对抗网络, 自注意力, 谱归一化

计算机 生物信息 论文 Website Google Scholar

基于互样本熵脑网络的脊髓电刺激下微意识状态患者脑功能评估

Brain function evaluation in the minimally conscious state using cross-sample entropy based on brain network measure under the spinal cord stimulation

梁振虎, 任娜, 王勇, 李佳妮, 白洋, 李小俚, 何江弘
中国科学: 信息科学, 2021, 51(6): 940-958
摘要 脊髓电刺激作为一种有效的意识促醒手段已经在临床上得到了较为广泛的应用,但是其内在机制仍不完全明确.本文将正常人静息态脑电作为对照组,利用样本熵对微意识状态患者的脊髓电刺激前后的脑电信号进行计算,并分析了基于互样本熵构造的脑网络在刺激前后的变化.结果表明,脊髓电刺激提高了微意识状态患者额叶和中央区内的脑电信号复杂度;还提高了患者在额叶内、中央区内以及额叶与其他脑区间的高频段(α~γ, 8~45 Hz)的耦合模式复杂度,表明通道间信息交互作用的显著增强;同时,患者高频段脑网络平均聚类系数增加,平均特征路径长度减少,小世界特性显著提升(在α,β,和γ均为p <0.001).相对于健康对照组,这些指标变化的方向趋向于正常人静息态的脑功能.样本熵和互样本熵在脊髓电刺激后与健康对照组在某些脑区内或脑区间上无显著差异(比如,β和γ频段的样本熵值在额叶和中央区(p> 0.05)),但是高频段的脑网络参数仍有显著差异(比如,高频段小世界网络特征p <0.001).因此,我们认为这些变化是脊髓电刺激对大脑产生了一个"短时程效应".我们推测脊髓电刺激对脑功能的重塑有一定的促进作用.本研究对脊髓电刺激的内在机理提供了新的解释,同时也为微意识状态患者的脑功能评估提供了新的思路.
关键词 微意识状态, 脑电, 脊髓电刺激, 互样本熵, 脑网络

计算机 生物信息 论文 Website Google Scholar

基于多数据融合的circRNA-疾病关联关系预测

Prediction of circRNA-disease associations based on multiple biological data

雷秀娟, 张文祥, 刘恋
中国科学: 信息科学, 2021, 51(6): 927-939
摘要 环状RNA (circluar RNA, circRNA)在基因表达、剪切和转录的过程中扮演着重要角色.越来越多的证据表明, circRNA与疾病的产生与发展存在着重要的联系.本文提出了一种基于多数据融合的非负矩阵分解算法(EDNMF)预测circRNA–疾病关联关系.该方法首先对circRNA–疾病关联关系进行预处理,解决了circRNA–疾病关联关系过少对算法产生的负面影响的问题.然后, EDNMF算法将circRNA表达谱和癌症相似性数据转化为约束条件,基于预处理后的circRNA–疾病关联关系采用改进的非负矩阵分解算法得到最终的打分值,从而预测circRNA–疾病关联关系.五折和十折交叉验证结果表明, EDNMF算法相比其他算法能更有效地预测circRNA–疾病关联关系.此外,采用EDNMF算法预测新的circRNA–结肠直肠癌关联关系打分排名前10的结果中,大部分结果已经得到了佐证,表明了该算法可以有效地预测未知的circRNA–疾病关联关系.
关键词 circRNA, circRNA 表达谱, circRNA-疾病关联关系, 非负矩阵分解, 疾病相似性

计算机 图形图像 论文 Website Google Scholar

面向多设备协同场景的实时视频流分析系统

Toward cooperative multi-agent video streaming perception

杨铮, 董亮, 蔡新军
中国科学: 信息科学, 2023, 53(1): 46-65
摘要 实时视频流分析在智能监控、智能制造、自动驾驶等场景中具有重要价值,然而其存在计算负载高、带宽需求大和延迟要求严格等特点,难以通过传统的本地计算模式或者云计算模式进行部署.近年兴起的边缘计算范式,将复杂的计算任务从终端设备上传到物理临近的边缘服务器上,能够有效解决设备层面的部署问题.然而,例如无人机编队飞行、车队自动驾驶和多机器人协同等不断涌现的多设备协同场景,新增了系统层面的综合性能要求,包括智能分析的实时准确率、设备之间的性能一致性和系统容纳的设备数量上限.当前的边缘计算范式对多设备协同场景的优化尚显不足,未能有效解决设备之间对上传带宽和服务器算力的竞争问题,所以难以满足这类场景的要求.本文设计了MASSIVE系统,能够在多设备协同场景中,全面提升实时视频分析的综合性能.首先, MASSIVE系统提出了适合多设备协同场景中度量视频流分析系统综合性能的评价体系.其次, MASSIVE系统设计了帕累托改进调度器来计算帕累托最优的系统调度策略,使得系统在3个维度上同时取得了相比已有系统更好的性能表现.最后, MASSIVE设计了虚拟流量整形器来保证各个设备在无线网络中按照调度策略上传视频流数据.实验结果表明, MASSIVE在多种典型的视频分析任务中,相比于当前的代表性系统,至少达到了122.7%的实时准确率、1.8倍的系统容量和更好的系统一致性,并达到了帕累托最优.
关键词 实时视频流分析; 边缘计算; 多设备协同; 多目标优化; 帕累托最优; real-time video analysis; edge computing; multi-agent cooperation; multi-objective optimization; Pareto optimal state;

计算机 图形图像 论文 Website Google Scholar

基于正交回归和特征加权的脑电情感特征选择方法

EEG emotional feature selection method based on orthogonal regression and feature weighting

徐雪远, 刘建红, 李子遇, 翟广涛, 邬霞
中国科学: 信息科学, 2023, 53(1): 33-45
摘要 颅内容积传导效应导致大量脑电特征之间具有高度相关性,而这些高度相关的脑电特征无法为情感识别提供额外的有用信息,并且会降低基于脑电信号的情感识别效率.为了去除冗余信息和挑选有判别力的脑电特征,本文提出了一种基于正交回归和特征加权的脑电情感特征选择方法.与传统特征选择方法相比,该方法利用正交回归在脑电特征映射空间中保留更多的判别信息,更加适合于非线性和非平稳脑电信号的分析处理.为了验证所提出方法的性能,我们采集了由视频诱发的多通道脑电情感数据,并将所提出方法与4种常用的脑电特征选择方法进行了比较.实验结果证明了本文所提出方法能有效降低脑电特征集内冗余信息,并挑选出具有判别力的脑电特征子集.此外,通过分析由该方法所挑选的脑电特征类型,我们发现中心频率特征是最具判别力的脑电情感特征.该发现将为未来脑电情感特征提取研究提供新的思路.
关键词 脑电; 特征选择; 情感识别; 正交回归; 特征加权; electroencephalogram; feature selection; emotion recognition; orthogonal regression; feature weighting;

计算机 图形图像 评述 Website Google Scholar

多模态认知计算

Multi-modal cognitive computing

李学龙
中国科学: 信息科学, 2023, 53(1): 1-32
摘要 人类利用视觉、听觉等多种感官理解周围环境,通过整合多种感知模态,形成对事件的整体认识.为使机器更好地模仿人类的认知能力,多模态认知计算模拟人类的“联觉”(synaesthesia),探索图像、视频、文本、语音等多模态输入的高效感知与综合理解手段,是人工智能领域的重要研究内容,也是实现“通用人工智能”的关键之一.近年来,随着多模态时空数据的海量爆发和计算能力的快速提升,国内外学者提出了大量方法,以应对日益增长的多样化需求.然而,当前的多模态认知计算仍局限于人类表观能力的模仿,缺乏认知层面的理论依据.本文从信息论角度出发,建立了认知过程的信息传递模型,结合信容(information capacity),提出了多模态认知计算能够提高机器的信息提取能力这一观点,从理论上对多模态认知计算各项任务进行了统一.进而,根据机器对多模态信息的认知模式,从多模态关联、跨模态生成和多模态协同这3个方面对现有方法进行了梳理与总结,系统地分析了其中的关键问题与解决方案.最后,结合当前阶段人工智能的发展特点,重点思考多模态认知计算领域面临的难点与挑战,并对未来发展趋势进行了深入分析与展望.
关键词 人工智能; 多模态; 认知计算; 联觉; 信容; artificial intelligence; multi-modal; cognitive computing; synaesthesia; information capacity;

计算机 图形图像 论文 Website Google Scholar

附加偏见预测器辅助的均衡化场景图生成

Balanced scene graph generation assisted by an additional biased predictor

王文彬, 王瑞平, 陈熙霖
中国科学: 信息科学, 2022, 52(11): 2075-2092
摘要 场景图是以场景中的物体为结点、以物体之间的关系为边构成的图结构,在视觉与语言交互理解和推理相关任务中具有广泛的应用前景.近年来,场景图自动生成逐渐受到关注,但生成结果中对于关系的描述受到长尾分布带来的偏见的影响,偏向于样本量较大的头部关系.然而头部关系往往过于空泛,描述不够准确,容易造成误解.由于这种关系价值不高,生成的场景图近似于退化为场景中物体信息的堆叠,不利于其他应用在图结构上进行结构化推理.为了使场景图生成器在这种不均衡的数据条件下,能够更均衡地学习,给出更加多样化的特别是尾部的更准确的关系,本文提出一种附加偏见预测器(additional biased predictor, ABP)辅助的均衡化学习方法.该方法利用一条有偏见的关系预测分支,令场景图生成器抑制自身对头部关系的偏好,并更加注重尾部关系的学习.场景图生成器需要为指定的一对物体预测关系,这是一种实例级的关系预测,与之相比,有偏分支以更简洁的方式预测出图像中的关系信息,即不指定任何一对物体,直接预测出图像中存在的关系,这是一种区域级的关系预测.为此,本文利用已有的实例级的关系标注,设计算法自动构造区域级的关系标注,以此来训练该有偏分支,使其具有区域级关系预测的能力.在不同场景图生成器上应用ABP方法,并在多个公开数据集(Visual Genome, VRD和OpenImages等)上进行实验,结果表明, ABP方法具有通用性,应用ABP方法训练得到的场景图生成器能够预测出更加多样化的、更准确的关系,进而生成更有价值、更实用的场景图.
关键词 场景图生成; 长尾分布; 附加偏见预测器; 均衡化学习; 区域级关系; scene graph generation; long-tailed distribution; additional biased predictor; balanced learning; region-level relationship;

计算机 图形图像 论文 Website Google Scholar

基于全局结构差异与局部注意力的变化检测

Damage assessment with global differences and local attention

梅杰, 程明明
中国科学: 信息科学, 2022, 52(11): 2058-2074
摘要 检测由自然灾害造成的不同变化,对于有效地指导人道主义援助和灾难响应行动来说至关重要.但是灾害发生的地区通常面积大、地面环境复杂,导致检测其变化具有较大的挑战性.现有的评估方法通常依靠人工来进行判别,不适用于多种灾害的检测.本文提出了一种新颖的变化检测模型(change transformer, CHTR),基于双时序遥感图像来同时进行建筑分割和多级变化检测两个任务.本文结合卷积神经网络擅长学习局部细节特征和Transformer可以建模长程依赖关系的优势,采用混合卷积神经网络和Transformer的架构作为编码器.考虑到自然灾害通常会对复杂环境中的建筑物造成不同程度的破坏,本文提出了一种全局差异模块,以捕获全局变化模式,提高对双时序图像之间变化的整体认识.进一步设计了一种局部门控注意力模块,以学习多级别变化之间的局部依赖性,增强对不同变化的判别能力.在目前最大的建筑物损毁评估数据集(xBD)上进行的大量实验表明,本文提出的方法在建筑分割和变化检测两个任务上都取得了更好的结果.
关键词 建筑物分割; 变化检测; 遥感图像; 全局和局部结构; Transformer; building segmentation; change detection; satellite imagery; global-local architecture; transformer;

计算机 图形图像 论文 Website Google Scholar

基于自判别循环生成对抗网络的人脸图像翻译

Self-discriminative cycle generative adversarial networks for face image translation

王清和, 曹兵, 朱鹏飞, 王楠楠, 胡清华, 高新波
中国科学: 信息科学, 2022, 52(8): 1447-1462
摘要 人脸跨域翻译是将人脸图像从一个图像域映射到另一个图像域的过程,常见的人脸图像翻译任务包括人脸照片–素描、人脸照片–线条画跨域翻译等,可以广泛应用于现实场景,如协助刑侦、电影制作、数字娱乐.但是成对的人脸图像数据有限,且不同域之间的颜色、纹理差异较大,导致人脸图像跨域翻译仍面临着巨大挑战.现有的方法通常会产生模糊、伪影、结构失真等问题,导致较差的视觉效果.为解决这一问题,我们提出了一个自判别循环生成对抗网络,其中,生成器部分采用编码器–解码器结构,生成器对应的判别器为翻译方向相反的编码器,通过自判别的形式,使编码器(即判别器)巧妙地融合了“真/假”语义判别能力与对像素改变的敏感性,从而增强了模型的稳健性和泛化能力.其次,我们提出了一个新颖的全向像素梯度损失函数,设计的卷积核计算了每个像素周围每个方向的梯度来提取图像的梯度信息,通过约束生成图像与对应真实图像的梯度信息保持一致,从而激励模型有效地学习像素间连续变化的模式,并且该损失函数可以灵活地应用于其他生成模型以提升性能.大量的实验表明本文提出的框架能够在公开的成对的人脸照片–素描数据集(CUFS, CUFSF)以及人脸照片–线条画数据集(APDrawing)上取得优异的结果.此外,通过泛化能力验证实验,我们进一步展示了模型在真实场景数据上的强泛化能力,以及自判别循环生成对抗网络结构在非成对人脸数据集上的出色性能.
关键词 人脸图像翻译; 自判别循环生成对抗网络; 梯度损失; 照片–素描; 照片–线条画; face image translation; self-discriminative cycle generative adversarial network; gradient loss; photo-sketch; photo-APDrawing;

计算机 图形图像 论文 Website Google Scholar

基于精细化多模态关联的自然语言句子在视频中的时序定位方法

Temporal sentence grounding in videos with fine-grained multimodal correlation

袁艺天, 王鑫, 朱文武
中国科学: 信息科学, 2022, 52(8): 1417-1446
摘要 通信技术和移动互联网的发展使多媒体数据逐渐渗透人们的生活,而视频作为其中一种最具表现力的内容表达方式,近年来受到了工业界和学术界的广泛关注.针对视频数据中背景信息较为冗余,所需分析浏览时间长的特点,本文介绍了自然语言句子在视频中的时序定位任务,即在视频中定位与给定自然语言句子语义相关的视频片段,这样人们可以通过提供明确简洁的文本描述在视频中迅速找寻所关注的特定内容,从而提高用户的视频浏览体验和搜索效率.传统方法往往以多模态匹配的框架来解决句子在视频中的时序定位问题,忽略了自然语言句子中的关键定位线索,更忽视了自然语言句子对于关联视频内部相关内容的重要指导作用,因而其时序定位准确率十分有限.为解决上述难题,本文提出了多模态共同注意力机制挖掘自然语言句子中与时序定位相关的重要语义细节,精细地构建句子中各单词和视频内容之间的语义关系.在此基础上,我们还提出了语义条件动态归一化机制,指导视频中与句子语义相关的局部视频内容紧密耦合,形成明确的视频片段边界,最后辅以细粒度的边界调整模块,进而获得更为精准和灵活的时序定位结果.在公开数据集上的实验验证了本文所提出的机制和方法的有效性.最后,本文还从引入视频中的音频信号、考虑弱监督环境下的时序定位问题,以及构建无偏见时序定位数据集这3个方面对自然语言句子在视频中的时序定位问题进行了未来研究方向的展望.
关键词 时序定位; 语义关联; 多模态共同注意力机制; 时序卷积网络; 语义条件动态归一化机制; temporal sentence grounding in videos; semantic correlation; multimodal co-attention mechanism; temporal convolutional network; semantic conditioned dynamic normalization;

计算机 图形图像 论文 Website Google Scholar

混合曲线曲面的 CG-LSPIA 拟合算法

Conjugate-gradient progressive-iterative approximation for least square fitting of curves and surfaces

蒋旖旎, 蔺宏伟
中国科学: 信息科学, 2022, 52(7): 1251-1271
摘要 混合曲线曲面的拟合常应用于计算机辅助设计与制造中,但传统的数据拟合方法缺乏明显的几何意义.最小二乘渐进迭代逼近算法(progressive-iterative approximation for least square fitting, LSPIA)能通过迭代地调整控制点得到原始数据点的最小二乘拟合结果,具有明显的几何意义,但收敛速度较慢.为解决这个问题,本文提出一种基于共轭梯度法的最小二乘渐进迭代逼近算法(conjugate-gradient progressive-iterative approximation for least square fitting, CG-LSPIA).该算法首先计算共轭曲线曲面,再更新混合曲线曲面,在没有数值误差的情况下,迭代至多n步即可生成给定数据点的最小二乘拟合曲线曲面.此外,本文给出了CG-LSPIA算法收敛性证明.最后,以B样条曲线曲面为例,与LSPIA算法进行了比较,实验表明该算法有效,并且减少了达到相同拟合误差限所需的迭代次数与时间.
关键词 渐进迭代逼近; 最小二乘拟合; 共轭梯度法; 数据拟合; 几何设计; progressive-iterative approximation algorithm; least square fitting; conjugate-gradient method; data fitting; geometric design;

计算机 图形图像 论文 Website Google Scholar

“千里阵云”的主观物象空间特征测量

Experimental framework to study the subjective materialized image space of horizontal calligraphy strokes

律睿慜, 张陶洁, 梅莉琳
中国科学: 信息科学, 2022, 52(7): 1221-1250
摘要 书法笔画能够产生丰富的主观意象,中国传统绘画也有类似的审美现象.于是,在古代的书画论著中,有大量关于笔画观感的记载,往往是将笔画引出的各种丰富拟物化意象进行描述.目前由于书法通常被归入艺术学研究的范畴,书法理论研究中还极少引入数理建模和科学实验的方法,因此对于笔画的意象空间还鲜有采取测量及实证的科学方法,还未能对其建立数理模型.本文设计了两项实验,用以探索书法笔画的意象空间.在第一项实验中,引入实验美学中常用的审美测量方法,选取了书法家写的15个“一”字作为测试样品,并选用21种拟物化感知维度,设计了视觉模拟量表,招募了252名普通群众对它们进行意象感受评测实验.然后,对数据进行主成分分析,展现出笔画“一”的意象空间的特征:其一,它的前二维占据主导,主轴对应于书法理论中探讨最多的“质与妍”的风格倾向问题、副主轴对应于“真与草”的书风倾向问题;其二,它的第三、四维的分布情况也不可忽略,其具体的意义有待进一步解释;其三,不同形态的笔画分布于该空间的不同位置,不同的感知维度对应于从空间原点出发的不同方向.基于第一项实验,设计了可视化方案,直观展现该意向空间中占主导的前二维的结构特征.第二项实验让测试者对实验一中的15个笔画样品评价其两两之间的主观差异.该实验结果经多维缩放分析,与实验一的结果互为支撑.不仅验证了书法理论中有关书风和书体的观点,还为关于“笔法”的审美感知实证研究提供了一种可拓展的数理模型和实验框架.
关键词 书法; 笔法; 笔画; 意象; 实验美学; 主成分分析; 多维尺度分析; 数据可视化; calligraphy; brushstrokes; calligraphic stroke; synesthesia; empirical aesthetics; principle component analysis; multidimensional scaling; data visualization;

计算机 图形图像 评述 Website Google Scholar

工业缺陷检测深度学习方法综述

Survey on industrial defect detection with deep learning

罗东亮, 蔡雨萱, 杨子豪, 章哲彦, 周瑜, 白翔
中国科学: 信息科学, 2022, 52(6): 1002-1039
摘要 基于深度学习的工业缺陷检测方法可以降低传统人工质检的成本,提升检测的准确性与效率,因而在智能制造中扮演重要角色,并逐渐成为计算机视觉领域新兴的研究热点之一.其被广泛地应用于无人质检、智能巡检、质量控制等各种生产与运维场景中.本综述旨在对工业缺陷检测的任务定义、难点、挑战、主流方法、公共数据集及评价指标等进行全面归纳,以帮助研究人员快速了解该领域.具体而言,本文首先介绍工业缺陷检测的背景与特点.接着,按照实际数据标注情况,划分出缺陷模式已知、缺陷模式未知与少量缺陷标注3种研究任务设置,并根据方法类型作进一步归纳与分析,探讨了各方法的性能优劣与适用场景,阐明了方法与实际应用需求的关联性.此外,本文还归纳了方法部署中的关键辅助技术,总结了现有方法在实际产业落地中存在的局限性.最后,本文对该领域未来的发展趋势和潜在研究方向进行了展望.
关键词 缺陷检测; 异常检测; 计算机视觉; 工业视觉; 深度学习; defect detection; anomaly detection; computer vision; industrial vision; deep learning;

计算机 图形图像 论文 Website Google Scholar

基于生成对抗网络和域一致性的MRI运动伪影校正方法

Motion artifact correction of MRI based on a generative adversarial network and domain consistency

曾宪华, 纪聪辉, 董倩
中国科学: 信息科学, 2022, 52(5): 822-836
摘要 在临床诊断中,磁共振成像(magnetic resonance imaging, MRI)运动伪影是一个常见的问题,运动伪影的存在会影响医生的诊断,虽然重新采集MRI可以避免这一问题,但这会提高医院和患者的经济成本和时间成本,因此,运动伪影的校正具备实用研究价值.现有的研究主要关注于空域的运动伪影校正或者K空间的运动伪影校正,缺乏对K空间和空域之间数据一致性的保持.为了解决这一问题,本文基于生成对抗网络提出了保持K空间和空域之间数据一致性的MRI运动伪影校正模型.该模型通过频域生成器对K空间数据进行初步校正,然后通过空域生成器对空域中的数据进行精细校正,在优化阶段则采用域间数据一致性损失来保持K空间和空域之间的数据一致性.在公开脑部MRI数据集ADNI, ABIDE, OASIS和Brain上的实验结果表明,本文提出的模型相较于其他方法分别在PSNR, SSIM以及RMSE上最高提升了3.4%, 3.07%和15.57%.
关键词 运动伪影校正; 生成对抗网络; 数据一致性; 深度学习; 医学图像; motion artifact correction; generative adversarial network; data consistency; deep learning; medical image;

计算机 图形图像 论文 Website Google Scholar

一种基于点标注的弱监督目标检测方法

A weakly supervised object detection approach using point annotation

姚洁茹, 韩军伟, 张鼎文
中国科学: 信息科学, 2022, 52(3): 461-482
摘要 近年来,弱监督目标检测在计算机视觉和机器学习领域获得了广泛的关注.点标注是弱标注的形式之一,它依赖人工标注,为图像中的每一个物体赋予一个标注点.尽管在过去的几年中,出现了许多基于深度学习的弱监督目标检测算法,但当前基于点标注的弱监督目标检测的探索仍处于空白.考虑到点标注可以为弱监督目标检测提供丰富的、与感兴趣物体相关的位置、类别、数量等信息,本文提出了一个基于点标注的弱监督目标检测算法.该算法通过探索标注点与目标、类别间、实例间的依赖关系弥补弱监督学习中监督信息的不足,提高弱监督目标检测性能.在该算法中,本文提出了3个网络分支用以充分挖掘标注点信息,改善弱监督目标检测学习过程:空间图分支(spatial graph branch,SGB)利用点标注与目标空间上的局部相关性,探索标注点与标注点空间上下文间关系;多语义分支(multi-semantics branch, MSB)利用类别间在语义上的共现概率,构建语义拓扑结构,探索标签间的全局语义关系;实例计数分支(count-guided instance branch, CIB)利用不同实例间在空间上的局部无关性和特征差异,推断每个目标的伪监督信息,实现实例级监督.用点标注训练弱监督目标检测算法,在节省人工标注成本的同时提供更多丰富的监督信息,从本质上提高弱监督目标检测性能.在PASCAL VOC 2007和PASCAL VOC 2012数据集上的实验结果表明,本文算法与基准模型相比,在均值平均精度上分别提高了7.9%和10.2%,在定位准确度上分别提高了9.7%和11.7%.
关键词 弱监督学习; 目标检测; 点标注; 依赖关系; 关系推理; weakly supervised learning; object detection; point annotation; dependency relationship; relationship reasoning;

计算机 图形图像 论文 Website Google Scholar

基于多尺度特征融合的人脸照片-素描合成

Face photo-sketch synthesis based on multi-scale feature fusion

梁昌城, 王楠楠, 朱明瑞, 杨曦, 李洁, 高新波
中国科学: 信息科学, 2022, 52(2): 334-347
摘要 从真实的人脸照片合成面部素描及其逆过程具有广泛的用途,例如数字娱乐与协助刑事案件的侦查.但是,由于照片与素描在纹理上的显著差异,它们之间的互相转换仍是一个具有挑战性的问题.最近基于生成对抗网络的方法已在图像间转换问题,特别是照片到素描的转换方面展现出令人鼓舞的结果,但它们大多会在面部关键组件产生不同的形变或者模糊,使得合成图像的真实性受影响.为了应对这一挑战,我们提出了一种新颖的基于多尺度特征融合的人脸照片–素描合成算法,来提高合成图像的结构完整性与纹理逼真度.首先使用编码器提取输入图像的多尺度编码特征,然后将最底层编码特征经过空洞卷积模块后传入解码器进行解码.解码过程中将不同尺度的解码特征与对应尺度的编码特征在通道维度上拼接,从而获得多尺度编解码融合特征.最后在解码器的输出端将不同尺度的编解码融合特征进一步融合,并通过一层卷积层产生最终合成结果.通过这种同时将编码–解码过程中不同尺度的特征在通道维度进行拼接的方式,能够保持较好的图像结构以及纹理细节,生成逼真的面部素描/照片图像.我们在多个具有挑战性的数据集中验证了所提方法的有效性.定量和定性评估表明,本文模型在生成具有高视觉质量的人脸素描(或照片)方面优于其他最新技术.
关键词 人脸照片–素描合成; 图像翻译; 生成对抗网络; 多尺度特征融合; 空洞卷积; face photo sketch synthesis; image-to-image translation; generative adversarial network; multi-scale feature fusion; dilated convolution;

计算机 图形图像 论文 Website Google Scholar

基于田字格变换的自监督汉字字体生成

Self-supervised Chinese font generation based on square-block transformation

曾锦山, 陈琪, 王明文
中国科学: 信息科学, 2022, 52(1): 145-159
摘要 近年来,汉字自动生成因其在艺术字体生成、个性化字体设计,以及书法作品生成等问题中的广泛应用而引起了大量关注.当前主流的汉字字体自动生成方法主要基于非配对数据和深度生成模型如生成对抗网络等.然而,这些主流的深度汉字字体生成方法通常忽略了汉字本身的结构信息,导致在提取特征时缺乏相应指导,且在训练过程中容易出现模式坍塌现象,从而在生成汉字质量方面亟待进一步提高.针对该问题,本文受汉字田字格书写的启发,提出一种基于田字格变换的自监督方法来指导网络模型提取更高质量的特征,进而提升汉字生成效果,需要特别指出的是所设计的田字格几何变换无需改变现有模型网络且不增加任何人工成本,因此潜在可嵌入许多已有深度汉字字体生成模型.所提自监督学习方法的有效性在一系列实验中得到验证.实验结果表明,在嵌入所提的自监督学习任务后,当前流行的基于CycleGAN的深度汉字生成模型在生成效果和训练稳定性等方面都有较大提升,并且模式坍塌现象得到改善.与现有其他深度汉字字体生成方法相比,所提基于田字格几何变换的自监督方法提高了生成汉字质量,并且在生成汉字内容准确率、FID值、L1损失和IOU这4个评价指标上均有一定提升.
关键词 汉字字体生成; 自监督学习; 生成对抗网络; 深度学习; 田字格变换; Chinese font generation; self-supervised learning; generative adversarial network; deep learning; square-block transformation;

计算机 图形图像 论文 Website Google Scholar

BeautyGAN+: 基于全新 PMT 数据集的美妆转移混合监督学习算法

BeautyGAN+: mixed-supervised makeup transfer learning algorithm based on new PMT dataset

白玉, 颜波, 谭伟敏
中国科学: 信息科学, 2022, 52(1): 129-144
摘要 作为改变人脸图像外观的重要方式之一,美妆转移任务在近年来获得了越来越多的关注.美妆转移网络可以将任意参考图像的妆容转移到任意人脸图像上,在节约时间和空间成本的同时帮助人们找到适合自己的妆容,并获得妆容得到美化的图像.美妆转移网络BeautyGAN成功展示了无监督方法妆容迁移的较好效果,然而此类无监督学习策略缺乏可以提供良好妆容细节的监督标签,导致实验结果中出现了背景变色、边缘不自然、容易受光照影响等问题.用素颜–美妆配对标签进一步约束BeautyGAN模型训练可以解决上述问题,但当前学术界缺乏此类精细标注的配对数据集.针对以上问题,本文提出了BeautyGAN+方法,贡献了一个用户详细标注的素颜–美妆配对数据集,即PMT数据集,在BeautyGAN的无监督基础上加入有监督损失进行训练,最终通过实验发现结合无监督(迁移性好)和有监督(细节修复好)的训练策略可以提供更好的迁移效果.实验结果中的图像结果和用户调研(14位)均表明本文方法显著提升了美妆转移效果,解决了美妆转移工作长期缺乏配对数据集及转移结果存在多种偏差的难题.
关键词 深度学习; 美妆转移技术; 生成式对抗网络; 有监督学习; 美妆数据集; deep learning; makeup transfer; generative adversarial network(GAN); supervised learning; makeup dataset;

计算机 图形图像 评述 Website Google Scholar

面向实时视频流分析的边缘计算技术

Edge computing technologies for streaming video analytics

杨铮, 贺骁武, 吴家行, 王需, 赵毅
中国科学: 信息科学, 2022, 52(1): 1-53
摘要 实时视频流分析在智能监控、智慧城市、自动驾驶等场景中具有重要价值.然而计算负载高、带宽需求大、延迟要求严等特点使得实时视频流分析难以通过传统的云计算范式进行部署.近年来兴起的边缘计算范式,将计算任务从云端下沉到位于网络边缘的终端设备和边缘服务器上,能够有效解决上述问题.因此,许多针对实时视频流分析的边缘计算研究逐渐涌现.本文首先介绍了智能视频流分析和边缘计算的背景知识,以及二者结合的典型应用场景;接着提出了现有系统所关注的衡量指标和面临的挑战;然后从终端设备层次、协作层次、边缘/云层次对本领域的关键技术分别进行了详细的介绍,重点涉及了模型压缩和选择、本地缓存、视频帧过滤、任务卸载、网络协议、隐私保护、查询优化、推理加速和边缘缓存技术.基于对上述各项核心技术的有机整合,本文提出了基于边缘计算的视频大数据智能分析平台Argus,从数据采集、推理分析,到数据挖掘、日志管理,对实时视频流分析全生命周期提供支持,并成功应用到智慧油田中.最后,本文讨论了本领域尚待解决的问题和未来研究方向,希望为今后的研究工作提供有益参考.
关键词 边缘计算; 视频分析; 模型压缩; 任务卸载; 查询优化; edge computing; video analytics; model compression; task offloading; query optimization;

计算机 图形图像 论文 Website Google Scholar

面向预防性保护的文物本体智能原位监测系统

An intelligent in-situ visual inspection system for preventive conservation of cultural heritages

冯伟, 张乾, 田飞鹏, 王小伟, 柴勃隆, 孙济洲, 苏伯民
中国科学: 信息科学, 2021, 51(12): 2102-2118
摘要 预防性保护是国际广泛认可并努力持续追求的先进保护理念,代表了文物保护的发展方向.预防性保护通过精细监测病征,识别病因,精准控制相关致病因素,从而达到有效抑制文物本体劣化的目的.整个过程,监测是起点和根本.目前,国内外对环境风险源感知已有很多技术和数据的积累.然而,由于文物本体劣化具有发展缓慢、变化细微、赋存环境多样等特点,目前国内外尚缺乏面向真实赋存环境下文物本体细微变化的快速、精准、可靠的监测方法,严重阻碍了文物预防性保护的发展和推广.本文聚焦该问题,首次提出了基于相机位姿主动式重现的原位监测思路,并在此基础上设计研发了功能完善、适用面广的文物本体智能原位监测系统.通过物理真实地重现相机六自由度位姿,实现了基于图像导引的文物本体真实细微变化的准确检测.目前该系统已成功在敦煌莫高窟、故宫、颐和园等10多个文化遗产地的多种保护业务中推广应用.
关键词 预防性保护; 成像条件原位重现; 相机重定位; 细微变化检测; 主动视觉; 原位监测; preventive conservation; imaging condition reproduction; camera relocalization; fine-grained change detection; active vision; in-situ inspection;

计算机 图形图像 论文 Website Google Scholar

基于三维深度神经网络的大规模神经元形态表征与检索方法

Large-scale neuron morphological representation and retrieval based on a threedimensional deep neural network

常令琛, 李钟毓, 樊夏玥, 商增谊, 景海婷
中国科学: 信息科学, 2021, 51(12): 2089-2101
摘要 高效准确的相似神经元检索方法是神经元形态分析的重要支撑.随着高精度显微成像、神经元示踪、人工智能等技术的发展,近些年出现了若干基于机器学习的神经元形态计算与分析方法,这些研究主要包括对传统神经元形态度量指标的统计分析,以及将神经元形态二维投影与深度学习结合的神经元量化表征方法,在神经元的特征提取、分类、相似检索等任务中均取得了不错的效果.不过随着越来越多的三维神经元数据被重建出来,以上方法都无法满足当前背景下对大规模神经元形态数据的细粒度表征、检索与分类需求.为此,本文提出了基于三维深度神经网络的大规模神经元形态表征与检索方法.首先,为了将神经元的三维空间拓扑结构转换成适用于深度神经网络的形式,我们设计了神经元空间形态的体素转换方法,将原始的神经元重构文件转换成三维体素的形式,极大地保留了神经元的三维空间拓扑结构.随后,考虑到当前神经元数据缺乏精细的分类标准,本文设计了基于三维卷积自动编码器的神经元形态表征算法,应用深度神经网络无监督地学习神经元体素数据的结构特点,得到神经元形态的量化表征,并以此设计端到端的相似神经元快速检索算法.最后通过实验验证本文所提出的方法,在9万余神经元数据中检索形态相似的神经元,实验结果显著优于其他基于神经元量化表征的检索方法.实验表明,本文方法可以更高效准确地检索相似神经元,为神经元的形态学分析、神经元单细胞分类等相关研究的关键问题提供支持.
关键词 神经元形态学; 深度神经网络; 三维体素; 特征表达; neuron morphology; deep neural networks; 3D voxels; feature representation;

计算机 图形图像 论文 Website Google Scholar

融合梯度信息和邻域点云分布的3D线特征提取与配准

Extraction and registration of 3D lines by fusing gradient information and neighboring point cloud distribution

缪永伟, 戴颖婷, 王海鹏, 刘复昌, 王金荣
中国科学: 信息科学, 2021, 51(12): 2069-2088
摘要 针对传统点云场景重建中由于场景区域缺乏纹理、场景物体遮挡等导致重建结果不准确的局限性,借助场景包含的几何特性和线结构信息,有效利用RGB-D数据的梯度信息和邻域点云分布信息,本文提出了一种针对点云场景的3D线特征提取、匹配和配准方法.首先,通过场景RGB图的梯度信息确定梯度方向相似的3D直线段支持域.然后,借助场景深度图呈现的邻域几何特性,根据当前点与其邻近点之间的分布关系判断点云中的直线型边界线点云和直线型折边线点云并拟合得到场景3D线特征.其次,以点云场景提取的3D线特征为轴线,构造等厚度同轴圆柱区域作为3D线段支持域,并统计支持域中各层圆柱壁内点云梯度作为描述符实现3D线特征匹配.最后,利用基于线–线的迭代最近线配准算法,迭代计算得到帧间场景的旋转与平移,从而实现帧间点云场景的高效配准.实验结果表明,与已有的点云场景线特征提取及点特征配准方法比较,本文直接基于线特征的方法配准效率高、计算量小、配准精准,方法具有较强的鲁棒性.
关键词 点云场景; 3D线特征; 线特征提取; 线特征配准; 三维重建; point cloud scenes; 3D lines; line feature extraction; line registration; 3D reconstruction;

计算机 图形图像 评述 Website Google Scholar

智能视频监控关键技术: 行人再识别研究综述

Key technology for intelligent video surveillance: a review of person re-identification

赵才荣, 齐鼎, 窦曙光, 涂远鹏, 孙添力, 柏松, 蒋忻洋, 白翔, 苗夺谦
中国科学: 信息科学, 2021, 51(12): 1979-2015
摘要 行人再识别(person re-identification, ReID)旨在解决跨摄像头跨场景下目标行人的关联与匹配,作为智能视频监控系统的关键环节,对维护社会公共秩序具有重大作用.为了深入了解行人再识别研究现状和加速推进国内行人再识别相关研究及技术落地,本文对该领域国家自然科学基金申报数量、资助力度以及地理分布情况进行统计,并针对近年来发表在国际顶级会议和期刊上的行人再识别研究进行全面梳理.具体地,首先阐述一个标准行人再识别算法流程,并总结其中3个关键技术:表征学习、度量学习和重排序优化.随后,列举了实际开放场景中面临的主要难点与挑战,并据此概括了7种开放行人再识别任务:遮挡、无监督、半监督、跨模态、场景行人搜索、对抗鲁棒和快速检索.此外,本文整理了标准行人再识别和开放行人再识别的代表性数据集,并且对一些代表性行人再识别算法进行比较.最后本文对行人再识别的未来发展趋势进行展望.
关键词 行人再识别; 智能视频分析; 深度学习; 表征学习; 度量学习; person re-identification; intelligent video analysis; deep learning; feature representation learning; metric learning;

计算机 图形图像 刊讯 Website Google Scholar

基于机器学习的可视计算专题简介

童欣, 周昆
中国科学: 信息科学, 2021, 51(11): 1965-1966
关键词 可视计算; 机器学习; 深度神经网络;

计算机 图形图像 评述 Website Google Scholar

可视化与人工智能交叉研究综述

A survey on interdisciplinary research of visualization and artificial intelligence

夏佳志, 李杰, 陈思明, 秦红星, 刘世霞
中国科学: 信息科学, 2021, 51(11): 1777-1801
摘要 随着人工智能技术的突破性进展,人工智能与可视化的交叉研究成为当前的研究热点之一,为人工智能和大数据分析领域的若干核心难题提供了启发式的理论、方法和技术.一方面,人工智能技术的创新应用提升了可视化的分析效率,拓展了分析功能,为大数据可视分析提供了强有力的工具.另一方面,可视化技术增强了以深度学习为代表的人工智能的可解释性和交互性,为可解释人工智能提供了可靠的技术基础.本文从面向人工智能的可视化技术和人工智能驱动的可视化技术两个方向,分别介绍了数据质量改善、可解释机器学习、智能特征提取、可视化自动布局与生成、智能交互、智能故事叙述等6个重要问题.对国内外的研究进展进行了分析,并对发展趋势进行了展望.
关键词 可视化; 可视分析; 人工智能; 可解释机器学习; 自动可视化; visualization; visual analytics; artificial intelligence; explainable machine learning; automatic visualization;

计算机 图形图像 论文 Website Google Scholar

二值图像超分辨率重建网络

Binary neural networks for image super-resolution

姜馨蕊, 王楠楠, 辛经纬, 李柯宇, 杨曦, 高新波
中国科学: 信息科学, 2021, 51(10): 1690-1705
摘要 近年来,深层卷积神经网络在图像超分辨率重建任务中取得了巨大成功,然而复杂的深度神经网络会消耗大量存储空间以及计算资源,严重限制了其在资源有限的移动端设备上的部署.因此降低模型的资源消耗将有助于扩展深度超分辨率网络的实际应用范围.二值神经网络占用存储空间小、计算效率高,激励我们将二值化算法应用于目前的深度超分辨率重建领域,满足现有移动设备对于超分辨率的实际应用需求.因此,本文关注于二值图像超分辨率重建网络的研究.为此,我们首先总结了现有二值化方法,并针对其技术细节和算法特点进行了详细介绍.随后,我们探索了目前二值化方法在超分辨率领域的实际应用效果,并面向图像超分辨率重建任务提出一种新的二值化算法,主要通过提高网络前向过程表达能力和减少网络反向过程训练损失提升二值超分辨率网络的性能.实验表明,无论对比现有基于分类任务的二值化算法还是对比基于超分辨率任务的二值化算法,我们的方法均可以取得最优的性能.
关键词 二值卷积神经网络; 图像超分辨率重建; 二值化; 量化; 模型压缩; binary neural network; single image super-resolution; binarization; quantization; model compression;

计算机 图形图像 论文 Website Google Scholar

基于深度学习的数字病理扫描系统单次曝光自动对焦方法

Whole slide imaging via one-shot deep autofocusing

李强, 刘贤明, 韩凯歌, 江俊君, 季向阳
中国科学: 信息科学, 2021, 51(10): 1675-1689
摘要 全切片数字成像(whole slide imaging, WSI)是病理切片数字化的核心技术,其自动对焦的速度和精度决定了WSI系统的性能.然而,传统的自动对焦方法需要拍摄多张离焦子图像创建图像堆栈,或者需要复杂的硬件调制光学系统,从而限制了WSI在实际场景中的应用.本文设计了基于深度学习的数字病理扫描系统单次曝光自动对焦方法,对子图像逐个进行网络虚拟自动对焦,将单张离焦子图像通过网络直接生成准焦子图像.本方法仅需要在任意离焦距离下的单次曝光拍照即可,从原理上避免了重复的对焦运动和相机曝光过程.实验结果表明,本方法具有高通量、高速度、低成本、实用性强、可线下处理等优点.
关键词 数字病理扫描系统; 自动对焦; 深度学习; 光学显微镜; 计算成像; digital pathological systems; autofocusing; deep learning; optical microscopes; computational imaging;

计算机 图形图像 论文 Website Google Scholar

基于前景与透明度联合求解的多层次仿射类抠像与合成方法

A multi-level affinity-based matting and compositing method based on a joint solution of foreground and transparency

姚桂林, 张必英, 张艳荣, 苏晓东
中国科学: 信息科学, 2021, 51(10): 1658-1674
摘要 数字图像抠像与合成问题是虚拟现实中的经典问题.抠像问题需要根据抠像公式,从输入图像准确地提取出前景物体的透明度(α)和前景物体的颜色值,而合成问题仅使用抠像结果与新背景图像进行结合,使其成为新的合成图像.然而,目前很多抠像算法仅局限于抠像部分的α值的计算,忽略了用于后续合成步骤的前景颜色的计算.这实际上仅限于理论研究,脱离了抠像问题的合成应用层面.同时,其他一些兼顾计算前景颜色算法的效果仍然不理想,而且也仍然缺乏合成图像数据集和对合成图像的比较.本文充分利用仿射类方法中搜索范围灵活可变的优势,采用实体像素与混合像素进行分级处理的3层次结构,联合求解出最终的α值和前景颜色.其中,每个层次均利用前向层次的先验,结合仿射类方法的像素相关性以及颜色拟合性约束,采用闭合形式进行求解.在实验中,本文不仅针对α层面进行比较,而且在数字抠像领域中首次引入针对合成图像层面的比较.在合成层面中,本文针对输入图像及各型号的三分模板(Trimap),均引入了白色背景和相应的自然图像背景.同时各方法的真实的α值和前景颜色不仅与这些背景进行了常规合成,而且也进行了一种单纯α层面的合成.实验结果表明,在数值评价结果和视觉效果方面,本文方法的最终α结果与上述各种合成效果均优于目前已有的抠像与合成方法及一些新生成的方法.
关键词 图像抠像; 图像合成; 仿射类抠像; 闭合形式解; 实体像素与混合像素; image matting; image compositing; affinity-based matting; closed form solution; opaque and mixed pixels;

计算机 图形图像 论文 Website Google Scholar

认知规律启发的物体分割评价标准及损失函数

Cognitive vision inspired object segmentation metric and loss function

范登平, 季葛鹏, 秦雪彬, 程明明
中国科学: 信息科学, 2021, 51(9): 1475-1489
摘要 物体分割技术是计算机视觉中的研究热点,在多个领域都有广泛的应用.本文从人类视觉系统对场景中的全局信息和局部细节非常敏感的角度出发,设计了一种新颖、高效且易于计算的增强匹配标准(E_ξ)来评估物体分割模型的性能. E_ξ将局部像素值与全局平均值有机结合,以便评估分割结果与标准结果在图像级和像素级的相似度.在国际主流的4个公开数据集上的大量实验表明, E_ξ在多个方面,如应用关联度、随机偏好度、噪声偏好度、感知度上相比现有广泛采纳的评价标准(IoU和F_β)均有大幅相对提升.通过利用加权二值交叉熵损失函数、本文的增强匹配损失函数以及加权交并比损失函数,本文进一步设计了一套组合损失函数(Hybrid-E_(loss))来促进网络学习到像素级、对象级和图像级的分割特征.定性和定量的结果表明,在3个不同领域的分割任务中使用这一组合损失函数能够进一步提高物体分割的精度.
关键词 物体分割技术; 评价标准; 视觉感知; 增强匹配标准; 损失函数; object segmentation; metric; cognitive vision; enhanced-alignment measure; loss function;

计算机 图形图像 论文 Website Google Scholar

可视身份深度伪造与检测

Deep visual identity forgery and detection

彭春蕾, 高新波, 王楠楠, 李洁
中国科学: 信息科学, 2021, 51(9): 1451-1474
摘要 随着深度学习技术在视频和图像生成领域的广泛应用,视频和图像中的可视身份伪造,特别是人脸伪造结果的逼真程度越来越高,对于身份伪造数据的检测在国家安全和社会稳定等方面均具有重要的研究和应用价值,近年来已成为研究的热点问题.本文从有目标身份伪造和无目标身份伪造两个方面归纳和介绍了可视身份深度伪造的研究方法,并从基于空域线索、时域线索的面向已知伪造类型检测方法、面向未知伪造类型的泛化能力研究,以及面向对抗样本攻击的可信伪造检测研究等多个方面阐述了伪造检测的关键技术,并在总结现有数据集和代表性算法的性能分析基础上,进一步讨论了可视身份深度伪造与检测的关键问题和面临的挑战.
关键词 深度伪造; 人脸替换; 人脸编辑; 表情重演; 人脸生成; 伪造检测; deepfake; face swap; face manipulation; expression reenactment; face generation; forgery detection;

计算机 图形图像 论文 Website Google Scholar

大场景多对象的深度社交分组网络

Deep social grouping network for large scenes with multiple subjects

李坤, 李万鹏, 孙晓琨, 方璐
中国科学: 信息科学, 2021, 51(8): 1287-1301
摘要 在计算机视觉中,群体分析越来越受到人们的关注,对图像中复杂人群进行分组是群体分析领域的基础技术需求.现有的人群社交分组方法只针对固定人数的小范围场景,不能处理真实世界中的大场景图像.本文提出首个面向十亿像素大场景图像的基于深度学习的细粒度人群社交分组框架,由一种图引导的全局到局部的划分策略与一个学习隐函数表示社交对交互模式的深度社交分组网络组成.该框架可在大范围场景图像上实现准确的人群分组.本文方法同样适用于小场景图像,在小场景图像数据集上的实验结果表明,本文提出的框架相比于现有方法取得了显著的性能提升.相关代码与训练数据即将开源.
关键词 群体; 大场景图像; 深度学习; 社交分组; 图引导; group; large-scene image; deep learning; social grouping; graph-guided;

计算机 图形图像 论文 Website Google Scholar

基于边缘和距离约束的有理多项式图像放大

Rational polynomial image magnification based on edge and distance constraints

张帆, 王桦, 范辉, 张彩明
中国科学: 信息科学, 2021, 51(8): 1270-1286
摘要 曲面拟合是最有效的图像放大方法之一,其关键是构造对图像拟合的曲面.图像细节和边缘等特征对图像的视觉效果起着关键作用,因此,构造拟合曲面的关键之一是保持图像细节和边缘.基于样条和多项式方法构造的拟合曲面不能有效地保持图像的边缘信息,从而使放大图像在边缘处锯齿状明显.本文提出了以边缘和距离为特征约束的图像放大新算法.算法以边缘和距离为约束,在每个像素的邻近区域上构造一张对邻域上像素点拟合的二次多项式曲面片,并在每个四边形网格上构造一张二次多项式中间曲面片.在每个四边形网格上由五张曲面片加权平均生成有理多项式曲面片.该曲面片具有二次多项式逼近精度,产生的图像具有较好的视觉效果.通过构造误差曲面片对二次多项式曲面片进行修正,提高了放大图像的精度和视觉效果.新算法把二次多项式的常数项、一次和二次项采用不同方法分别计算,为构造带约束的多项式函数提供了新技术.实验结果表明,相比于其他算法,本文算法不仅有较高的逼近精度,而且放大图像的视觉效果也较好.
关键词 二次多项式; 边缘和距离约束; 逼近曲面; 逼近精度; 图像放大; quadratic polynomial; edge and distance constraints; approximation surface; approximation accuracy; image magnification;

计算机 图形图像 论文 Website Google Scholar

基于稀疏表示的G1圆弧样条自动逼近方法

Automatic G1 arc spline approximation via sparse representation

徐琳琳
中国科学: 信息科学, 2021, 51(8): 1255-1269
摘要 圆弧样条普遍用于数控机床的刀具轨迹设计中,希望用尽可能少的圆弧段逼近曲线.现有方法大多是启发式的,圆弧样条曲率的分段常值性质还没有引起足够的重视.本文基于这个内在的稀疏性质,提出基于稀疏表示的G~1圆弧样条自动逼近方法,主要分两步:稀疏优化问题自动检测圆弧间连接点的全局初始化和重新调整连接点位置保证G~1连续性的局部修正.实验结果显示新方法对对称性比较敏感,部分尖锐特征、自交数据也可以逼近得很好,充分说明了新方法的优越性.
关键词 圆弧样条; 稀疏表示; 逼近; G~1连续; arc spline; sparse representation; approximation; G~1 continuity;

计算机 图形图像 论文 Website Google Scholar

互联网图像驱动的语义分割自主学习

Autonomous learning of semantic segmentation from Internet images

侯淇彬, 韩凌昊, 刘姜江, 程明明
中国科学: 信息科学, 2021, 51(7): 1084-1099
摘要 针对目标任务收集新类别的海量标注数据通常需要大量时间和人力成本,并已成为语义分割技术投入实际产业应用过程的主要瓶颈.本文旨在以"网络监督"的方式,在仅利用用户提供的目标类别关键词以及相应自动搜索到的网络数据的条件下实现语义分割模型的自主学习.该任务的核心挑战在于网络爬取的图像中存在一定量的类别噪声,从而影响自主学习的可靠性.为了解决类别噪声问题,本文设计了一种新颖的噪声擦除模型.该模型通过每次从小批次样本的置信注意力区域中以跨样本的方式学习语义信息来擦除训练图像中与搜索关键词无关的区域.基于该模型,本文同时提出了一种能够用于训练语义分割模型的高质量伪标注生成方法.在国际主流的公开数据集(PASCAL VOC2012)上的大量实验表明,基于该方法的语义分割模型在利用网络监督与弱监督的条件下均取得了良好结果 (mIoU=62.0%以及66.1%).
关键词 语义分割, 网络搜索, 类别噪声, 噪声擦除网络, 网络监督

计算机 图形图像 评述 Website Google Scholar

从传统渲染到可微渲染: 基本原理、方法和应用

From traditional rendering to differentiable rendering: theories, methods and applications

叶子鹏, 夏雯宇, 孙志尧, 易冉, 余旻婧, 刘永进
中国科学: 信息科学, 2021, 51(7): 1043-1067
摘要 近年来随着图形硬件的快速发展,渲染技术和深度学习技术都飞速发展,可微渲染作为二者之间的桥梁受到了广泛关注.随着许多可微渲染方法的提出,逆渲染等借助可微渲染工具的应用也随之蓬勃发展.本文从传统渲染管线开始介绍,逐步引入可微渲染的主要思想、基本原理和方法,对它们进行介绍、分析和比较.并介绍基于路径跟踪的可微渲染,随后列出开源的可微渲染工具供大家参考并进行比较.本文后半部分介绍可微渲染的广泛应用,分为人脸、人体、人手和物体4个方面.最后列举了一些可微渲染可能的发展方向.
关键词 可微渲染, 逆渲染, 三维重建, 人脸重建, 渲染

计算机 图形图像 论文 Website Google Scholar

五次间接PH曲线的几何特征

Geometric characteristics of quintic indirect-PH curves

李毓君, 方林聪
中国科学: 信息科学, 2021, 51(5): 808-821
摘要 针对五次间接PH曲线的判别问题,本文结合高斯消元法与几何方法给出Bézier控制多边形满足的充分必要条件.间接PH曲线通过一个二次有理参数变换后,其等距线是有理形式的.间接PH曲线的代数充分必要条件本质是其一阶导数的因式分解满足特定条件,是一种积的形式.考虑到Bézier曲线的表示是Bernstein多项式形式,是一种和的形式.通过这两种形式的相容性引出待求解的非线性方程组并讨论求解问题,最后将所得结果应用在控制多边形上,得到五次间接PH曲线的几何特征.
关键词 Bézier曲线; 等距曲线; 几何特征; 有理参数化; Bézier curves; offsets; geometric characteristic; rational parameterization;

计算机 图形图像 论文 Website Google Scholar

面向光流估计的高效加速器架构设计

Efficient accelerator architecture for optical flow estimation

刘博生, 陈晓明, 韩银和, 常亮
中国科学: 信息科学, 2021, 51(5): 795-807
摘要 光流(optical flow)为同一对象在视频中运动到下一帧的移动量.从视频中估计光流已广泛应用于各类移动智能系统,如运动估计和机器人导航.最近的研究表明,卷积神经网络(convolutional neural network, CNN)能提供可靠的光流估计结果.然而,现有的硬件加速器无法支持面向光流估计的CNN复杂计算.具体而言,这些类型的CNN不仅包括常规的卷积(convolution)和反卷积(deconvolution)运算,还包括双线性插值(bilinear interpolation)和/或关联(correlation)运算.双线性插值和关联操作主要探索两个连续图像帧之间的关联关系.为解决这一问题,本项工作提出面向光流的CNN硬件加速设计方案(称为Swan-AOE),即通过支持卷积、反卷积、双线性插值和关联操作解决这类神经网络的硬件加速计算问题. Swan-AOE包括可配置的硬件计算架构和自适应的调度策略,通过提供灵活的并行调度实现最优化吞吐量计算.此外, Swan-AOE还进行设计空间探索,探索可用片上缓存资源在提高能耗–面积效率的潜在能力.实验结果表明,与基准加速器相比,所提出的设计能有效提升性能、能效和面积效率.
关键词 加速器; 光流估计; 能效; 卷积神经网络; accelerator; optical flow estimation; energy efficiency; convolutional neural networks;

计算机 图形图像 评述 Website Google Scholar

视频萃取

Video distillation

李学龙, 赵斌
中国科学: 信息科学, 2021, 51(5): 695-734
摘要 视频数据是人们日常生活中最重要的信息载体之一.视频萃取(video distillation)通过研究视频数据的时空和语义特性,探索简洁高效的数据展示形式和信息感知模态,是计算机视觉和人工智能的重点研究内容.近年来,随着视频获取方式的快速革新和拍摄需求的多样化发展,视频数据的智能化分析任务面临着新的机遇与挑战,涌现出众多的视频萃取方法.本文创新性地从信息论的角度,解释了数据、信息和知识之间的关系,确立了视频萃取的核心是提高单位数据量的信息提供能力这一基本原则,并依据数据信容(information capacity)分析,从理论上对视频萃取中的各项任务进行了统一.进一步地,分类讨论了视频时空表征中的关键问题与解决方案,系统地分析了从内容、目标和语义角度进行视频萃取的方法,结合视频摘要、浓缩和描述任务,梳理出三条发展主线,展现了视频萃取的发展态势.更重要的是,本文对现有方法的优势与缺陷进行了深入的思考与讨论,指出了尚未解决的若干关键科学问题,并对解决方案进行了初步探讨.同时,本文对视频萃取研究所面临的挑战与未来发展趋势进行了系统的分析与展望.
关键词 视频萃取; 视觉表征; 视频摘要; 视频浓缩; 视频描述; 计算机视觉; 人工智能; video distillation; visual representation; video summarization; video synopsis; video captioning; computer vision; artificial intelligence;

计算机 图形图像 评述 Website Google Scholar

像素级语义理解: 从分类到回归

Pixel level semantic understanding: from classification to regression

李学龙, 赵致远
中国科学: 信息科学, 2021, 51(4): 521-564
摘要 近年来,随着科学技术的快速发展和硬件设备的不断迭代,人工智能在各种领域(如安防监控、医疗辅助、健康诊断、智能推荐、遥感监测、目标定位等)都得到了广泛的应用.随着人们对智能处理任务的要求逐步提高,人工智能算法所需要理解的语义信息层次和输出数据精准度要求也步步攀升.因此,像素级语义理解任务也因其精准度要求远高于图像级理解而越来越受到重视.与图像级理解相比,像素级语义理解具有输出数据量大、逐像素输出精度高的优点,相应地其难度也更大,内部成因更值得关注与研究.为此本文从信息度量的角度出发,结合像素级语义理解任务的特有属性,给出了像素级语义理解任务的定义与优化目标,进一步依据实际任务的特性从初始定义衍生出像素级语义分类和像素级语义回归两类任务;随后分别讨论了在这两类任务中优化目标的退化和演变,并通过详尽的调研总结了常见像素级语义理解任务的发展现状;紧接着探究了当前像素级语义理解的难点和未来发展方向,针对亟待解决的问题给出了深入的分析思考以及可行的解决方案;最后重点反思了后深度学习时代像素级语义理解乃至人工智能领域所面对的机遇与挑战,提出知识的方向指导和数据的优化驱动是未来人工智能发展的重点关注目标.本文意图从像素级语义理解的定义与发展现状出发,延伸出对当前工作的思考以及对整个领域的反思,强调整个领域面临的风险;在介绍像素级语义理解基础认知的同时对相关技术的发展方向和路径进行深入的思考与深度的展望.
关键词 像素级语义理解; 人工智能; 深度学习; 分类; 回归; pixel level semantic understanding; artificial intelligence; deep learning; classification; regression;

计算机 图形图像 论文 Website Google Scholar

面向群体行为识别的注意力池化机制

Attentive pooling for group activity recognition

李定, 张文生
中国科学: 信息科学, 2021, 51(3): 399-412
摘要 视频行为识别近年来逐渐成为计算机视觉领域学者的研究热点,按照识别对象进行划分,视频行为识别任务可分为个体行为识别与群体行为识别.本文聚焦于群体行为识别,识别与分析视频场景中整体人群的行为.已有的群体行为识别方法大多采用多层时序网络模型,学习得到表征时序变化的个体行为特征并对其进行聚合形成群体行为特征.但是,在个体特征聚合过程中,以往方法未能有效考虑个体对群体行为贡献程度的差异性,影响识别性能.为此,本文提出一种针对个体行为特征聚合的注意力池化机制,并依此建立了新型群体行为识别模型,以自底向上的方式同时实现个体行为与群体行为分层识别.首先利用卷积神经网络提取视频中人体图像区块的个体静态特征,并将其作为多层递归神经网络时序模型的输入,从而得到个体动态特征.随后通过注意力池化机制对个体特征完成聚合,得到相应的群体行为特征;最后依托个体、群体行为特征同时完成个体行为与群体行为的识别.未验证所提方法的有效性,本文依托广泛使用的The Volleyball Dataset数据集上开展了一系列实验验证.结果显示,本文所提出的模型取得了较好的分类准确率,分类性能优于当前先进模型.
关键词 群体行为识别; 表示学习; 注意力机制; 深度学习; group activity recognition; representation learning; attention mechanism; deep learning;

计算机 图形图像 论文 Website Google Scholar

基于多视角聚类分析的汉字字体审美偏好挖掘

Esthetic preference mining of Chinese typefaces using multiview cluster analysis

张艳, 谢源, 洪辰, 曲延云, 李睿, 张俊松, 李翠华
中国科学: 信息科学, 2021, 51(3): 383-398
摘要 在神经美学研究中已经证明,中文字体审美偏好的情绪刺激可以通过观察3种偏好(喜欢、不喜欢和中性)之间的事件相关电位(event related potential, ERP)波动获得.本文通过引入一种核化张量奇异值分解的多视角聚类方法分别构建了基于脑电图(electroencephalogram, EEG)和ERP的审美偏好识别模型,通过这些模型首次确认了该结论.本文方法将来自不同频段的数据视为描述中文字体审美偏好的不同视角,通过张量多秩最小化的约束探索所有视角特征的一致性和关联性,并通过之后的聚类获取审美偏好的识别结果.采用多视角无监督聚类方法得到的识别精度达到97.1%.此外,通过输入–扰动关联方法将电极的振幅与不同种类的审美偏好相关联,可视化关键频段组合以及电极之间的关系,分别取出与喜欢、不喜欢、中性最相关的3个电极,包含次相关的6个电极,包含第三相关的9个电极,包含第四相关的12个电极,分别形成4种不同组合的脑电特征.通过比较实验,验证了相对于62个电极信号,上述4种组合方式在字体美学分类上更具有优势,并且最相关的3个电极的组合特征对审美偏好最具判别性.实验结果表明,基于多视角聚类的方法能够解决神经信号与审美偏好的相关分析,并能挖掘出与字体审美偏好最相关的电极.
关键词 中文字体; 审美评价; 计算美学; 事件相关电位; 核化张量奇异值分解; 数据挖掘; Chinese typeface; esthetic evaluation; computational esthetics; event-related potentials; kernelized tensor-SVD; data mining;

计算机 图形图像 论文 Website Google Scholar

基于隐空间约束生成对抗网络的活体检测

Latent regularized generative adversarial network for face spoofing detection

陈成伟, 院旺, 陈攀, 丁守鸿, 谢源, 宋海川, 马利庄
中国科学: 信息科学, 2021, 51(3): 367-382
摘要 近年来,人脸识别技术飞速发展,其主要应用于门禁系统和公共安防系统.然而现有的人脸识别系统容易受到仿冒攻击(也称为呈现攻击),例如尝试使用用户的脸部照片、视频或者伪造的3D人脸去攻击人脸识别系统.这些攻击手段给人脸识别系统带来了极具挑战性的安全问题.因此活体检测技术的研究十分重要,其可以使人脸识别系统免于攻击假脸的安全威胁.目前,大部分活体检测的方法将活体检测任务视作有监督的二分类问题,进而努力充分提取真实人脸和攻击人脸的特征,在单个数据集内部训练和测试可以达到很高的准确率,但是在交叉数据集之间训练和测试往往效果不佳.本文将活体检测任务定义为异常检测任务,并基于此来解决之前活体检测方法存在的泛化能力差的问题.因此本文提出了一种新颖的基于隐空间约束的深度对抗网络,它通过半监督学习的方式进行对抗训练,在此过程中模型不仅仅可以获得正常样本在隐空间中的分布,还可以通过一种惩罚的方式对隐空间中正常样本的特征进行约束,这将带来更加有效和鲁棒的活体检测效果.测试过程中,攻击人脸样本将被视作离群的样本,它们相对于正常样例在隐空间中的表达具有更高的重构差.实验表明提出的模型相较于前沿的半监督异常检测方法具备明显的优势,并且在活体检测跨数据集和单数据集内达到了可比的效果或者目前最好的效果.
关键词 对抗网络; 活体检测; 弱监督学习; 异常检测; 人脸仿冒攻击; adversarial networks; live face detection; semi-supervised learning; anomaly detection; face spoofing attacks;

计算机 图形图像 论文 Website Google Scholar

三维标架场可控去旋方法

Controllable curl-correction of 3D frame fields

方贤忠, 金耀, 黄劲, 鲍虎军
中国科学: 信息科学, 2021, 51(2): 263-278
摘要 六面体网格因其良好的数值性能成为有限元分析等领域中重要的一种离散化方法,而基于标架场导引的重网格化是实现可控六面体网格剖分的重要技术.现有的标架场生成技术由于所获得的标架场往往存在拓扑矛盾,难以运用于纯六面体网格的生成,但较易用于六面体主导混合网格的生成.然而,这种六面体主导网格的质量容易受到标架场旋度的影响.针对这一问题,本文提出了一种三维标架场保向且长度可控去旋方法.该方法通过分析三维向量场的旋度,构造针对四面体网格的离散旋度能量,并将其推广至三维标架场的旋度能量.为保持原标架场方向并控制其长度,引入了表达三维标架场3个子向量场长度伸缩量的标量场,并将新标架场表示为标量场和原标架场的合成,最后通过极小化合成场的旋度得到优化后的标架场.实验结果表明,通过约束标量场的变化范围,能在保持其方向不变的情况下,有效地控制去旋程度;将该标架场运用于已有重网格化方法,可得到方向和密度可控的六面体主导的混合网格.此外,该方法只需求解一个带界约束的二次凸规划问题,鲁棒性强且易于计算.
关键词 三维标架场; 去旋; 长度可控; 六面体主导网格; 3D frame field; curl correction; length-controllable; hexahedral dominant mesh;

计算机 图形图像 论文 Website Google Scholar

基于强化学习的舰载机保障作业实时调度方法

Real-time scheduling for carrier-borne aircraft support operations: a reinforcement learning approach

李亚飞, 吴庆顺, 徐明亮, 吕培, 姜晓恒, 朱睿杰, 周兵
中国科学: 信息科学, 2021, 51(2): 247-262
摘要 衡量航母作战性能的重要指标是舰载机出动架次率,而影响舰载机出动架次率的关键因素是舰载机保障作业调度效率.舰载机保障作业调度是指在有限时间、空间和资源约束的前提下合理安排舰载机所需保障作业顺序并高效完成舰载机的作业保障.现有基于最优化方法 (动态规划、线性规划等)和启发式方法 (如遗传算法、粒子群等)的求解策略仅适用于保障作业可预知情况下的作业调度,很难满足高动态作战场景下的实时保障作业调度需求.基于此,本文提出了一种新的基于DQN (deep Q-network)的舰载机保障作业实时调度方法,将舰载机保障作业调度问题建模成部分可观测马尔科夫决策过程(partially observable Markov decision processes)问题,利用全局与长期收益对保障作业调度过程进行优化,并通过离线学习和在线调配的学习决策框架进行解决.经过仿真实验验证,该方法能显著提高舰载机保障作业调度效率并满足实时决策环境的需要.
关键词 舰载机; 保障作业; 实时调度; 强化学习; 仿真验证; carrier-borne aircraft; support operations; real-time scheduling; reinforcement learning; simulations;

计算机 图形图像 论文 Website Google Scholar

基于设备性能的 Web3D 动态实时光影云渲染系统

A Web3D cloud rendering system for dynamic real-time lighting and shadow based on device power

刘畅, 刘小军, 贾金原, 徐识溥, 张乾, 黄晨曦, 黄欣
中国科学: 信息科学, 2021, 51(2): 231-246
摘要 本文面向多种硬件平台提出了一套Web3D实时动态光影的协同式渲染系统,该系统把Web前端的硬件性能作为整个云渲染系统中光影渲染任务分配的关键因素.对于Web前端性能较强的硬件设备,系统分配复杂度较高的光影渲染任务给前端,相应的云后端的渲染负担则有所降低;反之,系统则分配复杂度较低的光影渲染任务给前端,相应的云后端承担大部分的渲染任务.在上述机制的引导下,该系统的前后端部署了4类关键的实时光影渲染算法,最终通过对算法运行帧率、算法所在设备的运行效率以及光影渲染结果等多种数据的分析,验证了部署的合理性.
关键词 云渲染; Web3D; 实时绘制; 动态光影; 全局光照; cloud rendering; Web3D; real-time rendering; dynamic lighting and shadow; global illumination;

计算机 计算机理论 论文 Website Google Scholar

理论计算机科学专题

创作者经济中的去中心化审查机制设计

Decentralized content censorship for creator economy

陈宏崟, 邓小铁, 孔雨晴, 陆宇暄
中国科学: 信息科学, 2022, 52(6): 992-1001
摘要 创作者经济的兴起以及相应去中心化平台的搭建加速了权力向个体创作者的转移,然而由于去中心化平台缺乏中心内容审查和监管,创作者可能滥用权力,传递可能造成社会损害的信息.已有的去中心化审查机制缺乏对创作内容社会损害的严谨刻画,同时对于该问题的解决方案也缺乏相应的理论支撑.我们提出了一套去中心化平台的审查机制:创作者上传的作品将首先由去中心化的审查者进行损害评估,根据评估结果,创作者在上传作品的同时需要支付一定押金,为了防止在随机环境下较坏情况发生,我们将引入去中心化的担保者进行担保,在此基础上通过中心化的资金池解决极端情形下的社会损害赔付.我们证明:(1)在损害评估阶段,审查者们诚实地给出自己对作品社会损害的评估是一个支配性策略;(2)审查机制以极高的概率保证作品的社会损害会低于担保者的赔偿上限和创作者的押金之和.
关键词 创作者经济; 互联网3.0; 去中心化审查; 区块链; 社交媒体; creator economy; Web3.0; decentralized censorship; blockchain; social media;

计算机 计算机理论 论文 Website Google Scholar

理论计算机科学专题

基于区块链和贝叶斯博弈的联邦学习激励机制

Incentive mechanism for federated learning based on blockchain and Bayesian game

张沁楠, 朱建明, 高胜, 熊泽辉, 丁庆洋, 朴桂荣
中国科学: 信息科学, 2022, 52(6): 971-991
摘要 联邦学习通过聚合多方本地模型成为数据共享的新模式.现有的联邦学习激励机制有效缓解了完全信息下的数据供给不足问题,但仍面临搭便车、不公平、不可信等挑战.为此,本文提出了一种基于区块链和贝叶斯博弈(Bayesian game)的不完全信息联邦学习激励机制,通过量化数据供给方的成本效用与数据需求方的支付报酬对数据交易过程建模,采用沙普利值(Shapley value)实现了数据供给方报酬分配的公平性.在交易模型中考虑到参与个体的异质性与隐私保护,将数据供给方的资源配置策略构建为不完全信息的贝叶斯博弈模型,通过优化本地模型训练策略实现对数据供给方的激励作用.本文进一步分析了激励机制的有效性与行动策略的可信性,提出一种隐私保护的贝叶斯博弈行动策略共识算法(privacy-preserving Bayesian game action strategy consensus algorithm, PPBG-AC),该算法使数据供给方在基于区块链的数据交易平台下实现了贝叶斯纳什均衡.方案对比与理论分析表明本文提出的不完全信息联邦学习激励机制保障了数据供给方利益分配的公平性与资源配置的可信性,基于实际公开数据集的仿真实验与性能评估验证了激励机制的有效性.
关键词 联邦学习; 激励机制; 区块链; 贝叶斯博弈; 沙普利值; 不完全信息; 隐私保护; federated learning; incentive mechanism; blockchain; Bayesian game; Shapley value; incomplete information; privacy protection;

计算机 计算机理论 论文 Website Google Scholar

理论计算机科学专题

最小最大圈覆盖问题的精确算法

Exact algorithms for the min-max cycle cover problem

袁森, 陈开奇, 李江坤, 张鹏
中国科学: 信息科学, 2022, 52(6): 960-970
摘要 最小最大圈覆盖问题是旅行售货商问题的推广,该问题在无线传感器网络和无人机救灾等领域有着广泛的应用.目前关于最小最大圈覆盖问题的研究主要集中在近似算法方面,而缺少精确算法方面的结果.本文根据最小最大圈覆盖问题的组合特征,对该问题设计了基于动态规划策略的首个精确算法,时间复杂度为O~*(3~n).本文将对最小最大圈覆盖问题的求解分为两个阶段,第一个阶段是对问题的输入进行预处理,第二个阶段是在预处理的基础上求问题的最优解.有趣的是,两个阶段的方法都是基于动态规划策略设计的,这是本文处理最小最大圈覆盖问题的一个主要的特色.本文所证明的求到最优解的时间O~*(3~n),显著优于基于暴力搜索策略的枚举算法的时间.
关键词 最小最大圈覆盖问题; 动态规划; 分支定界; 精确算法; min-max cycle cover; dynamic programming; branch and bound; exact algorithm;

计算机 计算机理论 论文 Website Google Scholar

理论计算机科学专题

平面上带次模惩罚费用的最小能量部分覆盖问题

k-prize-collecting minimum power cover problem with submodular penalties on a plane

刘晓非, 代涵, 李思哲, 李伟东
中国科学: 信息科学, 2022, 52(6): 947-959
摘要 给定平面上的n个用户、m个传感器和一个正整数k (n),任意传感器s均可以通过提供能量p(s)产生一个圆形的覆盖区域,覆盖区域的半径r(s)与p(s)满足p(s)=r(s)~α,其中, α1为衰减系数.平面上带次模惩罚费用的最小能量部分覆盖问题尝试寻找传感器的一个能量供应方案,使得至少有k个用户被覆盖且总能量与未覆盖用户的惩罚费用之和达到最小,其中惩罚费用由一个次模函数确定.该问题推广了最小能量覆盖问题、最小能量部分覆盖问题和带惩罚费用的最小能量部分覆盖问题.通过深入挖掘平面上半不相交圆盘集合的几何性质,本文设计了一个基于原始对偶框架的两阶段多项式时间(5·2~α+1)-近似算法.当惩罚费用函数是线性函数时,此算法的近似比为5·2~α.
关键词 能量部分覆盖问题; 次模惩罚费用; 原始对偶方法; 半不相交; 近似算法; k-prize-collecting power cover problem; submodular penalties; primal-dual method; semi-disjoint; approximation algorithm;

计算机 计算机理论 论文 Website Google Scholar

理论计算机科学专题

无权重物品的几乎无忌妒分配

Almost envy-free allocations of unweighted items

张智杰, 应东昊, 张家琳, 孙晓明
中国科学: 信息科学, 2022, 52(6): 935-946
摘要 公平分配研究如何把m个不可分的物品公平地分配给n个玩家.每个玩家关于物品有一个可加的估值函数.物品是无权重的,如果他们的取值范围为{1, 0,-1}.非负估值的物品称为奖品,非正估值的物品称为苦差.本文考虑寻找无权重物品的分配,并满足“相差任意物品下是无忌妒的”(envy-free up to any item, EFX0). EFX_0是本领域内最受关注的公平性度量.一般可加估值函数下的EFX_0分配的存在性仍然是开放的.本文提出寻找无权重物品的EFX_0分配的多项式时间算法.为了达到这个目的,本文分别提出了寻找无权重奖品和无权重苦差的EFX_0分配的算法.然后,通过将二者小心地结合起来,本文得到了最终的算法.本文的结果完整刻画了无权重情况下寻找EFX_0分配的解决方案.
关键词 公平分配; 无忌妒性; 不可分物品; 奖品; 苦差; fair allocation; envy-freeness; indivisible items; goods; chores;

计算机 计算机理论 评述 Website Google Scholar

图数据中极大团枚举问题的求解: 研究现状与挑战

Maximal clique enumeration problem on graphs: status and challenges

许绍显, 廖小飞, 邵志远, 华强胜, 金海
中国科学: 信息科学, 2022, 52(5): 784-803
摘要 随着大数据时代的到来,图数据挖掘成为了一个热门的研究方向.极大团枚举(maximal clique enumeration, MCE)作为图论中的一个基本问题,在很多领域都有着广泛的应用.然而,鉴于极大团枚举问题本身的复杂性以及现实图数据规模的飞速增长,在现实图数据上进行极大团枚举是很耗时的.目前已经有大量的工作对该问题的求解算法进行改进,或采用各种计算优化方法减少算法的运行时间.本文就极大团枚举问题做了如下工作:对现有的极大团枚举问题的研究工作进行了分类归纳;对极大团枚举问题的研究现状进行了详细介绍;对该问题进一步发展所面临的挑战和发展方向进行了讨论和展望.
关键词 极大团枚举; 图论; 图数据挖掘; 图划分; 并行计算; maximal clique enumeration; graph theory; graph mining; graph partition; parallel computing;

计算机 计算机理论 论文 Website Google Scholar

分布式梅特罗波利斯算法: 收敛条件与最优并行加速

Distributed Metropolis algorithm: convergence condition and optimal parallel speed-up

凤维明, 尹一通
中国科学: 信息科学, 2022, 52(2): 287-313
摘要 梅特罗波利斯算法(Metropolis algorithm)是一种基本的马尔可夫链蒙特卡罗(Markov chain Monte Carlo, MCMC)采样技术,可用于从概率图模型所表示的高维概率分布(即吉布斯(Gibbs)分布)中进行随机采样.传统的梅特罗波利斯算法是一个串行算法.关于其快速收敛性的一个经典结论是:当满足梅特罗波利斯算法的Dobrushin-Shlosman条件时,该算法在O(n log n)步内快速收敛,其中n是随机变量的个数.本文研究了梅特罗波利斯算法的分布式版本——局部梅特罗波利斯算法.对该算法的正确性与收敛速度进行了分析,证明了该算法总是收敛于正确的吉布斯分布;并且对于一类自然的不包含三角形(triangle-free)概率图模型,如果满足相同的Dobrushin-Shlosman条件,则局部梅特罗波利斯算法在O(log n)轮内快速收敛.相比于传统的串行算法,实现了?(n)倍的渐进最优并行加速比.具体应用包括图染色、硬核模型和伊辛(Ising)模型的分布式采样算法.
关键词 分布式采样; 马尔可夫链蒙特卡洛; 混合时间; 自旋系统; 耦合; distributed sampling; Markov chain Monte Carlo; mixing time; spin system; coupling;

计算机 计算机理论 刊讯 Website Google Scholar

人工智能中的约束求解和优化专题简介

蔡少伟, Fred W. GLOVER, 殷明浩, 高健
中国科学: 信息科学, 2021, 51(5): 867-868
关键词 约束求解; 人工智能; 优化算法;

计算机 高性能计算 论文 Website Google Scholar

代际交错背景下移动蜂窝系统的近因现象与自调控设计: 速度、能耗与可靠性

Recency effect and self-regulating design of mobile cellular systems in the context of interlaced generations: network bandwidth, power efficiency, and connection reliability

刘云浩, 李振华, 李洋, 林灏, 宫良一, 郑雅文
中国科学: 信息科学, 2022, 52(12): 2290-2305
摘要 移动蜂窝系统正经历着从2G/3G/4G到5G的交错式代际进化过程,多样化的信号与协议长期共存.如何在庞大、异构、高动态的蜂窝环境中保证服务的高速(传输快)、高能效(耗电少)和高可靠性(不断网)成为至关重要但又非常困难的问题,该问题同时涉及手机制造商、网络服务提供商、操作系统和应用软件开发商.我们研究和综述了近年来针对该问题的代表性工作,发现蜂窝系统表观层面的多个反常性能问题,实际上归因于核心机制层面隐蔽而深刻的“近因现象”:受社会舆论和商业宣传影响,在选择使用移动网络时,存在非理性的代际偏颇和不自觉的速度至上倾向,进而引发了偏向5G的“亏损迁移”、网络容量的“饱和饥饿”以及基站连接的“乒乓跳跃”等连锁效应.为修复上述缺陷,我们提出基于4G/5G双连接以及非齐次时变马尔可夫过程的自调控技术设计,将5G设备的故障发生率降低40%并将所有设备的平均故障持续时间缩短36%,同时探讨我们基于大规模工业合作实践的洞察和创新.
关键词 代际交错; 5G; 近因现象; 亏损迁移; 自调控技术; interlaced generations; 5G; recency effect; loss-making migration; self-regulating design;

计算机 高性能计算 论文 Website Google Scholar

面向机器学习系统的张量中间表示

A tensor intermediate representation for machine learning systems

庄毅敏, 文渊博, 李威, 郭崎
中国科学: 信息科学, 2022, 52(6): 1040-1052
摘要 随着各类机器学习算法的广泛应用,高能效地定制机器学习系统受到越来越多的关注.定制机器学习系统高效部署的关键在于其编程与编译环境.中间表示是编程与编译环境的核心,用于连接上层编程语言和底层硬件指令.当前的中间表示或是面向上层算法或是面向以标量处理为核心的传统处理器,难以高效应对以张量处理为核心的机器学习系统.本文提出了面向机器学习系统的张量中间表示,以提升机器学习系统的编程和运行效率.具体而言,我们定义了一系列张量类型,张量操作及张量存储空间,并在此基础上进行张量处理优化.我们将所提出的张量中间表示对TVM的底层标量中间表示进行了扩展并在典型机器学习系统上进行了实验.我们探索了原有中间表示没有发掘的优化并取得了1.62~2.85倍的性能提升,同时在典型算子的开发效率上平均提升了5.46倍.
关键词 机器学习系统; 编程与编译; 张量处理; 中间表示; 编程效率; machine learning systems; programming & compiling; tensor processing; intermediate representation; programming efficiency;

计算机 高性能计算 评述 Website Google Scholar

下一代互联网互联设备关键技术专利导航研究综述

Patent navigation on key technologies of next generation Internet interconnection technologies: a review

贾宏君, 周静, 乔开文, 张丹, 谢祥, 刘杰, 娄颖, 张铭, 马跃, 张柏秋, 何笑冬, 张凌宇, 郑晔晴, 邹昊, 刘科
中国科学: 信息科学, 2022, 52(5): 765-783
摘要 下一代互联网是全球各国推动科技产业革命和重塑国家长期竞争力的基础设施和先导领域,同样也是高科技密布、专利密集的战略性新兴产业领域,技术研发与创新竞争异常激烈.本文运用专利导航方法对全球下一代互联网互联设备相关技术进行了分析,通过对本导航领域多位技术专家的访谈,澄清和界定了下一代互联网互联设备关键技术的基本定义与范畴,从总体趋势、地域、核心申请人、核心发明人、专利强度、我国向国外申请专利,以及技术分支等方面分析了全球及我国下一代互联网互联设备关键技术的专利布局现状、竞争前沿和未来趋势,结合本导航领域国内外典型案例的总结,对研发创新和专利运用提出了相应的导航建议.
关键词 下一代互联网; 未来网络; 互联技术; 专利导航; next generation Internet; future network; interconnection technologies; patent navigation;

计算机 高性能计算 评述 Website Google Scholar

计算体系架构研究综述与思考

Review and thoughts on the development of computing architecture

高彦钊, 邬江兴, 刘勤让, 沈剑良, 宋克, 张帆
中国科学: 信息科学, 2022, 52(3): 377-398
摘要 随着摩尔定律(Moore’s law)与迪纳德(Dennard)缩放定律逐步走向终结,依靠集成电路制程工艺的进步提升计算系统性能与效能越来越困难,计算体系架构的演进成为了未来计算系统发展的重要技术途径.本文首先从应用适应性、计算驱动方式、系统重心变化、计算核心构成,以及计算逻辑使用等不同的角度回顾了体系架构的发展历程,总结了不同体系架构的优缺点;然后着重分析了在人工智能、大数据等应用飞速发展的条件下未来计算系统的能力需求特征;最后提出了软件定义计算体系架构,并梳理了其重点研究内容与关键技术,为未来计算体系架构的发展提供了一条可行的技术途径.
关键词 体系架构; 软件定义计算; 领域专用架构; 异构计算; 可重构计算; architecture; software-defined computing; domain-specific architecture; heterogeneous computing; reconfigurable computing;

计算机 高性能计算 观点与争鸣 Website Google Scholar

专用处理器比较分析

Comparative study of the domain-specific processors

鄢贵海, 卢文岩, 李晓维, 孙凝晖
中国科学: 信息科学, 2022, 52(2): 358-375
摘要 微处理器是现代信息系统的核心基础设施.大数据、人工智能、5G等技术的快速发展催生了数据量的爆发性增长,随之对数据处理能力的需求也急剧增长.专用计算技术被广泛认为是后摩尔时代的计算机体系结构演化的重要方向.专用处理器技术的发展一直伴生着通用处理器的发展,数字信号处理技术甚至早于传统意义上的通用处理器.通用处理器技术的发展,不仅在商业上取得了巨大的成功,很多关键技术也被专用处理器吸收借鉴用于提升专用计算的性能、优化可编程性等.本文主要分析了数字信号处理器(DSP)、图像处理器(GPU)、深度学习处理器(AI芯片)和网络处理器(NPU)的关键技术特征,并进一步对专用计算架构未来发展可能涉及的关键点作出了简要的评述.
关键词 专用处理器; 数字信号处理; 图像处理; 深度学习; 网络处理; domain-specific processor; digital signal processing; graphic processing; deep learning; network processing;

计算机 高性能计算 论文 Website Google Scholar

FJoin: 一种基于FPGA的流连接并行加速器

FJoin: an FPGA-based parallel accelerator for stream join

林力韬, 陈汉华, 金海
中国科学: 信息科学, 2022, 52(2): 314-333
摘要 流连接广泛应用于提取多源流数据之间的关键信息,是大数据处理的重要支撑技术.但连接两条大数据流时大规模的连接谓词计算,使其易成为性能瓶颈.为提高处理性能,流连接系统常采用并行和分布式两种方式扩展.然而,采用多核并行的流连接系统的扩展性受到CPU核数限制,无法应对大规模数据流.采用分布式扩展的流连接系统由于引入分布式框架运行的开销,导致硬件处理效率严重下降.为实现高效大规模扩展,本文提出一种利用FPGA加速器外设向上扩展的流连接系统FJoin.加速器可进行高并行的流动连接,载入多个流元组后,连接窗口中的数据流经一次即可完成所有连接计算.对于逻辑容易在FPGA实现的连接谓词,通过大量基本连接单元串联构成深度连接流水线,实现大规模并行.通过主机CPU和FPGA设备协同进行连接控制,将连续的流连接计算划分为独立的小批量任务,高效地保证并行化流连接的完整性.在装备FPGA加速卡的平台实现了FJoin,基于大规模真实数据集的测试结果表明,对比部署在40个节点集群上的目前最好的分布式流连接系统,本文提出的流连接加速器FJoin可在单一FPGA加速卡上将连接计算速度提升16倍,达到5倍的系统吞吐,且时延满足实时流处理要求.
关键词 流连接; FPGA; 流处理; 硬件加速; 并行计算; stream join; FPGA; stream process; hardware accelerate; parallel computing;

计算机 高性能计算 论文 Website Google Scholar

一种高效的面向高并发图分析任务的存储系统

An efficient storage system towards high throughput of concurrent graph processing jobs

赵进, 姜新宇, 张宇, 廖小飞, 金海, 刘海坤, 杨赟, 张吉, 王彪, 余婷
中国科学: 信息科学, 2022, 52(1): 111-128
摘要 随着现实世界中图计算需求的快速增长,同一平台上往往并发运行着大量迭代图分析任务.然而,现有的图计算系统主要是为了高效执行单个图分析任务而设计的.因此,当多个并发图分析任务同时在同一个底层图上并行执行时,现有图计算系统会面临巨大的数据访问开销.为了提高并发图分析任务的吞吐量,现有的核外并发图处理方案通过共享图数据减少并发任务的数据存储与访问开销.但是,由于现实世界中图的图顶点度数幂律分布特性以及图分析任务之间的差异性,现有方案在访问数据时依旧存在着大量的不必要的冗余I/O开销.这是因为即使静态图分区中绝大部分顶点处于非活跃状态或者只被少数图分析任务共享,现有方法也依旧会将整个分区加载入内存供并发图分析任务处理.为解决上述问题,本文提出了一个面向并发图分析任务的高效存储系统GraphDP.它能够插入到现有核外图计算系统中来透明有效地减少现有图计算系统执行并发图分析任务时的存储消耗与数据访问开销,从而提高并发图分析任务的吞吐量.具体来说, GraphDP使用一种新颖的动态I/O调度策略,能够使系统以最优的I/O访问方式完成图数据的加载,并有效地减少加载到内存和cache的数据.同时, GraphDP通过高效的缓存机制在内存中优先缓存被频繁访问的图数据,从而进一步减少数据访问开销.为证明GraphDP的有效性,我们将GraphDP插入到目前流行的核外图计算系统中,包括GridGraph, GraphChi和X-Stream.实验结果表明, GraphDP分别将GridGraph, GraphChi和X-Stream的吞吐量提高了1.57~2.19倍, 1.86~2.37倍和1.62~2.21倍.
关键词 迭代图处理; 并发任务; 存储系统; I/O开销; 吞吐量; iterative graph processing; concurrent jobs; storage system; I/O overhead; throughput;

计算机 高性能计算 论文 Website Google Scholar

基于流量工程的LEO巨型星座主动容错方法

A proactive failure tolerance method for LEO mega-constellation based on traffic engineering

王少清, 孙富春, 赵有健
中国科学: 信息科学, 2021, 51(11): 1840-1852
摘要 LEO巨型星座因其广覆盖、高通量及低延时的通信潜力而受到越来越多的关注.然而由于所处空间环境复杂及自身特点等原因, LEO巨型星座容错问题亟待研究.为此,本文关注如下问题:如何保证卫星失效后,网络流量依然无拥塞正常转发?本文提出了基于流量工程的主动容错方法 SN-FFC,主要思想是通过合理的链路冗余,使得对于至多k (k为可调参数)个卫星失效,网络流量依然能无拥塞正常转发. SN-FFC首先设计基于流量工程的容错建模方法,随后针对模型计算复杂度高的问题,提出基于对偶理论的算法,使得复杂度从O(C_n~k)降低到O(n).基于Starlink第一阶段星座模型的仿真实验表明SN-FFC相较现有方案,能实现故障下的无拥塞转发,并且计算时间和吞吐量开销较低.
关键词 LEO巨型星座; 容错; 流量工程; 对偶理论; 线性规划; LEO mega-constellation; fault tolerance; traffic engineering; duality theory; linear programming;

计算机 高性能计算 论文 Website Google Scholar

方舱计算

Cabin computing

蒋昌俊, 丁志军, 喻剑, 章昭辉, 闫春钢, 张亚英, 王鹏伟
中国科学: 信息科学, 2021, 51(8): 1233-1254
摘要 随着信息技术创新日新月异,数字化、网络化、智能化深入发展,新应用层出不穷、新业态蓬勃发展,对业务系统的敏捷构造和持续运维提出了更高的要求.为此,本文提出了一种新的计算模式:方舱计算.所谓方舱计算,是通过网络访问的,面向IT任务全生命周期的跨域资源配置和协同的计算集成环境.其核心是"方舱专用机动、资源跨域伸缩、系统运维自治".本文给出了方舱计算系统结构及其工作原理,方舱计算系统主要由方舱生成与管理系统、跨域资源管理系统、虚拟数据中心系统和若干网关(方舱网关、虚拟数据中心网关、跨域资源网关等)组成.进而,给出了适于方舱计算的资源分配最优化问题定义,在兼顾数据资源、计算资源和存储资源等的基础上,实现最小化资源成本.通过规划求解器与近似优化算法仿真实验,表明本文的方法能够兼顾数据资源和物理资源的分布,实现方舱资源的优化配置.
关键词 方舱; 虚拟数据中心; 跨域资源管理; 资源分配; 资源分布图; 资源目录; cabin; virtual data center; cross-domain resource management; resource allocation; resource distribution map; resource directory;

计算机 高性能计算 评述 Website Google Scholar

非易失主存的系统软件研究进展

Development of system software on non-volatile main memory

舒继武, 陈游旻, 胡庆达, 陆游游
中国科学: 信息科学, 2021, 51(6): 869-899
摘要 互联网和物联网规模的迅速扩张促使全球数据存储总量呈现爆炸式的增长,导致数据系统从计算密集型向数据密集型方向发展.如何构建可靠高效的数据存储系统,成为大数据时代迫切需要解决的问题.相比传统磁盘,非易失主存具有性能高以及字节寻址等优点,这些独特的优势为高效存储系统的构建提供了新的机遇.然而,传统存储系统的构建方式不适用于非易失主存,无法发挥出非易失主存的性能优势,并且容易造成一致性开销高、空间利用率低、编程安全性低等问题.为此,本文分析了基于非易失主存构建存储系统面临的挑战,在系统软件层次分别综述了空间管理机制、新型编程模型、数据结构、文件系统和分布式存储系统等方面的研究进展,并展望了基于非易失主存构建存储系统的未来研究方向.
关键词 非易失主存, 系统软件, 空间管理机制, 编程模型, 数据结构, 文件系统, 分布式系统

计算机 高性能计算 论文 Website Google Scholar

三值光学计算机中并行MSD整数除法器的设计与实现

Design and implementation of parallel MSD integer divider in ternary optical computer

江家宝, 沈云付, 陈迅雷, 王哲河, 刘拥, 陈丽萍
中国科学: 信息科学, 2021, 51(5): 750-763
摘要 除法运算是基本四则运算之一,如何进行快速除法一直是电子计算机、嵌入式系统和其他新型计算系统广受关注的问题.充分发挥三值光学处理器位数众多、运算功能可重构、按位可分配等优势,设计出高效并行MSD (modified signed digit)数除法器对提高大数据除法的运算效率、促进三值光学计算机(ternary optical computer, TOC)在数值计算领域的应用意义重大.本文首次提出MSD数的符号判定算法,并基于SRT算法首次提出利用一个并行无进位SJ-MSD加法器和一个MSD数比较器实现单组MSD整数除法或多组MSD整数并行除法方案——并行MSD整数除法,该算法对于被除数等长的多组与单组MSD整数除法需要的机器周期是相同的.实验表明,并行MSD整数除法方案是可行的,它将有效地提高大数据处理效率并加速TOC进入数值计算等实际应用领域.
关键词 并行MSD整数除法器; SJ-MSD加法器; 比较器; SRT除法; 三值光学计算机; parallel MSD integer divider; SJ-MSD adder; comparator; SRT division; ternary optical computer(TOC);

计算机 高性能计算 论文 Website Google Scholar

面向多租户数据中心资源回收利用的能效激励机制

An energy-efficient incentive mechanism for resource recycling in multi-tenant datacenters

周知, 刘方明
中国科学: 信息科学, 2021, 51(5): 735-749
摘要 多租户公有云是云计算的一种重要组成形式.近年来,多租户公有云数据中心在如火如荼发展的同时,其过低资源使用率所导致的巨大能耗浪费也引起了社会的高度关注.然而,由于多租户公有云的资源通常以"包年包月"的租赁形式预留给租户,云服务提供商无法通过关闭空闲服务器等常用能耗管理方法来降低数据中心能耗.针对这一难题,本文提出了面向多租户数据中心资源回收利用的激励机制来提升多租户数据中心能效.该机制以经济激励的形式来回收利用租户空闲预留型资源,即云服务提供商向租户支付合适的经济补偿,从而回收租户空闲预留型资源,并充分利用其运行其他云计算服务(如电商和搜索服务).基于Lyapunov方法,本文设计并分析了一种面向租户预留资源回收利用的动态定价算法,该算法无需预测系统未来信息便可作出在线定价决策,并且在保障系统稳定性的同时使得云服务提供商长期成本无限接近于理论最低值.通过严格的数学证明以及由真实数据驱动的仿真实验,本文验证了所提出的激励机制在回收利用租户空闲资源方面的有效性.
关键词 多租户数据中心; 能耗管理; 资源回收; 激励机制; 在线算法; multi-tenant datacenter; energy management; resource recycling; incentive mechanism; online algorithm;

计算机 高性能计算 评述 Website Google Scholar

内存计算研究进展

Development of processing-in-memory

毛海宇, 舒继武, 李飞, 刘喆
中国科学: 信息科学, 2021, 51(2): 173-206
摘要 随着应用数据处理需求的激增,在传统冯·诺依曼(von Neumann)体系结构中,处理器到主存之间的总线数据传输逐渐成为瓶颈.不仅如此,近年来兴起的数据密集型应用,如神经网络和图计算等,呈现出较严重的数据局部性,缓存命中率低.在这些新兴数据密集型应用的处理过程中,中央处理器到主存间的数据传输量大,导致系统的性能不佳且能耗变高.针对传统冯·诺依曼体系结构的局限性,内存计算通过赋予主存端一定的计算能力,以缓解因数据量大以及数据局部性差带来的总线拥堵和传输能耗高的问题.内存计算有两大形式,一种是以高带宽的连接方式将计算资源集成到主存单元中(近数据计算),另一种是直接利用存储单元做计算(存内计算).这两种形式有各自的优缺点和适用场景.本文首先介绍并分析了内存计算的提出和兴起原因,然后从硬件和微体系结构方面介绍内存计算技术,接着分析和总结了内存计算所面临的挑战,最后介绍了内存计算给目前流行的应用带来的机遇.
关键词 内存计算; 近数据计算; 存内计算; 神经网络; 图计算; processing-in-memory; near-data computing; computing-in-memory; neural network; graph computing;

计算机 高性能计算 论文 Website Google Scholar

基于改进深度卷积神经网络的网络流量分类方法

Network traffic classification method based on improved deep convolutional neural network

张小莉, 程光, 张慰慈
中国科学: 信息科学, 2021, 51(1): 56-74
摘要 机器学习方法对网络流量分类的前提是假设流量具有独立同分布性,而实际情况下流量特征不断发生变化,导致该方法在处理海量、不具备独立同分布的流量数据时开销较大,计算复杂度较高,精度较低.针对上述问题,本文提出一种新的分类模型.该模型将PCA算法与改进的深度卷积神经网络分类模型(improved deep LeNet-5 convolutional neural networks, LCNN)相结合进行流量分类.前者进行降维分析,发现影响检测精度的关键特征,后者采用自主特征学习方式提升分类精度.实验表明,本文方法的内存开销较之前方法降低了3.2%,检测精度提升了5%~8%.
关键词 网络流量分类; 深度卷积神经网络; PCA; 多分类器; 特征选择; Tensorflow; network traffic classification; deep convolutional neural network; PCA; multi-classifier; feature selection; Tensorflow;

计算机 信息安全 论文 Website Google Scholar

面向车联网的抗设备捕获认证密钥协商协议

Device capture resilient authentication and key agreement protocol for IoV

姜奇, 杨雪, 王金花, 程庆丰, 马鑫迪, 马建峰
中国科学: 信息科学, 2022, 52(12): 2351-2370
摘要 随着汽车保有量的持续增长和道路交通的饱和,车联网被视为有效提高交通效率,改善驾乘体验的有效技术之一.认证密钥协商协议是保证车载单元(onboard unit, OBU)与各种信息服务器安全交互的关键手段.通常,认证密钥协商协议所需的密钥被存储于OBU中.然而,由于车辆常处于无人值守状态, OBU失盗事件时有发生.因此,如何确保私钥的存储安全是一个具有挑战性的难题.为了解决上述问题,本文提出了基于不经意伪随机函数(oblivious pseudorandom functions, OPRF)和两方协同签名的抗捕获认证密钥协商协议.借助于两方协同签名,私钥被分成两个部分,一部分使用辅助设备的公钥加密,另一部分通过OBU和辅助设备运行OPRF协议才能恢复.由于OBU中没有存储任何秘密信息,即使OBU被盗取,攻击者仍然无法获取私钥.本文对提出的方案进行了全面的安全性分析和性能比较.结果表明所提出的方案可以抵抗各种已知的攻击,特别是设备被捕获导致的密钥泄露.此外,所提出的方案可以实现计算开销和通信开销的平衡.
关键词 车联网; Schnorr协同签名; OPRF; 认证密钥协商; 抗设备捕获; Internet of vehicle; Schnorr collaborative signature; OPRF; authentication key agreement; capture resilient;

计算机 信息安全 论文 Website Google Scholar

一种基于PUF的可证明安全消息认证算法及应用

A PUF-based provably secure message authentication algorithm and application

张效林, 谷大武
中国科学: 信息科学, 2022, 52(12): 2336-2350
摘要 消息认证码(message authentication code, MAC)是一种对称密码算法,能检查消息的完整性与来源合法性,可广泛用于各类信息系统.然而,当运行MAC算法的设备受到物理攻击时,攻击者可通过读取存储器或电路调试等手段获取算法密钥并生成合法的消息认证码,从而危害系统安全.为此,本文提出了PUF-MAC,一种基于物理不可克隆函数(physically unclonable function, PUF)和Hash函数的MAC算法. PUF是一种具有结构不可克隆性与输出不可预测性的数据映射实体,不同PUF实体映射间的差异来源于生产时物理环境的微小变化.通信双方可使用PUF生成共享密钥.在标准模型下,本文归约证明了PUF-MAC算法在适应性选择消息攻击下满足存在性不可伪造(existential unforgeability under chosen message attack, EUF-CMA),且算法的EUF-CMA安全性依赖于Hash的弱抗碰撞性以及PUF的EUF-CMA安全性.同时,本文基于PUF-MAC算法设计了一种满足前后向安全性的密钥协商方案和双向身份认证协议,体现了PUF-MAC良好的实用性.理论分析表明,与其他MAC算法相比, PUF-MAC结构轻量且实现简单,无需预先存储大量的PUF响应. PUF的引入使攻击者即使获取算法密钥,也无法生成合法的消息认证码,保证了通信系统的安全.
关键词 消息认证码; 密钥管理; 物理不可克隆函数; 身份认证; MAC; key management; PUF; authentication;

计算机 信息安全 论文 Website Google Scholar

基于国产密码SM2的实用公钥广播加密方案

An efficient public-key broadcast encryption scheme based on SM2

陈泌文, 向涛, 何德彪, 黄欣沂
中国科学: 信息科学, 2022, 52(12): 2321-2335
摘要 近年来网络攻击与数据泄露事件层出不穷,网络安全受到国家及相关部门的高度关注.国产密码算法作为保障我国网络与信息安全的关键技术,推动其应用与实施既符合构建我国网络强国的战略需求,又能保障实际应用的健康发展. SM2公钥加密算法是我国自主设计的国产商用密码之一,可有效保障数据在通信过程中的安全性.然而,经典SM2公钥加密算法适合“一对一”通信场景,在“一对多”通信场景中需承担较大的计算与通信开销.为提升SM2公钥加密算法在“一对多”通信场景中计算与通信效率,扩展我国商用密码的应用范围,本文将我国商用密码SM2公钥加密算法和广播加密概念相结合,利用Diffie-Hellman密钥交换和多项式秘密分享的思想,设计了基于SM2的公钥广播加密方案.所构造方案最大程度地保留原有SM2公钥加密算法结构,通过简单地扩展即可实现在多用户场景下消息安全广播的自主可控.与现有广播加密方案相比,所构造方案的系统参数大小与接收者数量无线性关系,以及系统无需指定数据发送者广播消息.所构造方案的安全性分析表明,本文方案与SM2公钥加密算法具有相同安全强度.理论分析与实验仿真表明,所构造方案具有较好的性能,显著增强了我国商用密码的实用性.
关键词 公钥加密; SM2公钥密码算法; 广播加密; Diffie-Hellman密钥协商; publi-key encryption; SM2 public key cryptography; broadcast encryption; Diffie-Hellman key exchange;

计算机 信息安全 论文 Website Google Scholar

满足本地化差分隐私的推荐系统中隐私预算的优化设置

Optimized setting of privacy budget in a recommendation system with local differential privacy

暴婷, 徐蕾, 祝烈煌, 王丽宏
中国科学: 信息科学, 2022, 52(8): 1481-1499
摘要 推荐系统可帮助用户从众多的数据中发现用户所需数据,与此同时,上传用户原始数据给服务器也可能泄露用户隐私.本文使用本地化差分隐私技术为推荐系统中的用户数据提供隐私保护.在本地化差分隐私模型中,隐私预算控制用户数据的隐私保护程度,较高的隐私预算通常意味着较高的分析准确性.为在最小化隐私损失的同时最大化推荐准确性,我们将隐私预算设置问题建模为多臂赌博机问题,并提出基于置信度上界的学习策略帮助用户选择最优的隐私预算.考虑到用户对不同数据的敏感程度不同,我们对学习策略进行了改进.真实数据集上的实验结果表明,所提策略可以帮助用户选出合适的隐私预算,可有效提高用户的累计收益.
关键词 推荐系统; 本地化差分隐私; 隐私预算; 强化学习; 多臂赌博机; recommendation system; local differential privacy; privacy budget; reinforcement learning; multiarmed bandit;

计算机 信息安全 论文 Website Google Scholar

基于序列特征提取的溯源图上APT攻击检测方法

Sequence feature extraction-based APT attack detection method with provenance graphs

梁若舟, 高跃, 赵曦滨
中国科学: 信息科学, 2022, 52(8): 1463-1480
摘要 在真实场景,特别是工业场景下的高级持续性威胁(advanced persistent threat, APT)具有复杂性和长期性,但当前方法无法有效提取攻击中的长期关联关系.针对这一问题,本文提出一种基于溯源图的APT攻击检测方法 SeqNet. SeqNet采用序列特征提取方式,实现APT攻击检测.在SeqNet中,首先将描述系统运行状态的溯源图序列转化为特征向量序列,然后使用GRU (gate recurrent unit)模型提取系统状态变化特征,并使用结合局部注意力机制的编解码器模型训练GRU模型,最后利用K-means聚类方法对系统正常行为进行建模.本文在5个公开数据集StreamSpot, wget, shellshock,ClearScope和CADETS上进行了实验,并与当前具有代表性的方法进行了对比.本文方法在5个数据集上都取得了相似或更好的效果.实验结果证明本文方法能够实现真实场景下的APT攻击检测.
关键词 APT攻击检测; 溯源图; 异常检测; 序列特征提取; 局部注意力机制; APT attack detection; provenance graphs; anomaly-based detection; sequence feature extraction; local attention mechanism;

计算机 信息安全 论文 Website Google Scholar

云与用户之间交互式抗屏摄密文水印协议

Interactive screen-shooting resilient ciphertext watermarking protocol between the cloud and the user

董晓娟, 张卫明, 方涵, 俞能海
中国科学: 信息科学, 2022, 52(7): 1272-1286
摘要 现有的云存储服务普遍推出了浏览文件的功能,这为用户通过拍摄屏幕上的文件来窃取信息带来极大的便利,同时也加重了信息泄露的风险.因此,用户通过拍照窃取信息对云存储服务来说是一个潜在的安全性问题.现有的办法是云端在推送图像至用户端前,先嵌入与用户身份相关的抗屏摄水印,那么云端能从拍摄的图像检测到水印,发现用户身份.然而云端和用户端都有含用户水印的图像,我们无法确认被泄露的图像是从云端流出的还是从用户端流出的.为了消除泄露源的二义性,使用密文水印,云端将用户的密文水印嵌入到明文图像,生成含用户水印的密文图像.只有用户端能将之解密,获得相应的明文图像.一旦该图像被偷拍泄露,我们可断定该图像一定是从用户端流出的.但是目前的抗屏摄水印算法不支持上述功能,仅支持明文水印的嵌入.为此,本文提出一个云与用户之间的抗屏摄密文水印协议,旨在保护版权用户对其图像的版权,防止使用图像的用户通过偷拍窃取图像.通过理论分析和仿真实验,本文验证了所提出协议在实施过程中的安全性和有效性.
关键词 云存储; 密文水印协议; 抗屏摄水印; 版权保护; 泄露追踪; cloud storage; ciphertext watermark protocol; screen-shooting resilient watermark; copyright protection; leakage tracking;

计算机 信息安全 论文 Website Google Scholar

基于区块链和去中心不可否认属性签名的分布式公钥基础设施方案

Distributed public key infrastructure scheme based on blockchain and decentralized undeniable attribute-based signature

袁和昕, 刘百祥, 阚海斌, 陈泽宁
中国科学: 信息科学, 2022, 52(6): 1135-1148
摘要 灵活有效的身份体制方案一直是信息时代的核心需求之一.传统的中心化公钥基础设施存在诸多缺陷,而已有的运行在区块链上的分布式的公钥基础设施同样存在诸如性能、鲁棒性、不可否认性、身份灵活性等方面的问题.本文创新地将区块链与去中心不可否认属性签名结合,提出一种新型分布式公钥基础设施方案,方案利用门限算法和属性签名对身份进行细粒度的管理,并引入非交互式零知识证明使得证书具有不可否认的性质,利用区块链的共识机制进行证书库的同步以实现分布式的身份认证.本文通过实验仿真和分析并结合具体场景,证明了该方案在安全性和可用性上都满足实际落地的需求.
关键词 区块链; 公钥基础设施; 属性签名; 门限算法; 零知识证明; 身份认证; blockchain; public key infrastructure; attribute-based signature; threshold algorithm; zero-knowledge proof; identity authentication;

计算机 信息安全 论文 Website Google Scholar

中本聪共识安全性质研究方法

Methods of security analysis for Nakamoto consensus

周子钰, 张宗洋, 刘建伟
中国科学: 信息科学, 2022, 52(5): 837-855
摘要 中本聪共识是区块链共识机制中最基础和研究最广泛的一种共识机制,其安全性对整个区块链领域的发展具有重要的理论意义和应用价值.现有大量研究在各种模型假设下对中本聪共识进行了安全性分析和证明.本文首先详细描述了中本聪共识的执行模型,包括时间模型、网络模型、敌手模型等.其次,系统总结了中本聪共识安全性的形式化定义.再次,根据时间模型将中本聪共识研究方法分为基于离散时间模型和连续时间模型两类,并指出不同方法的优缺点.最后对中本聪共识的安全性研究进行展望,旨在为区块链共识机制的研究提供技术支撑.
关键词 中本聪共识; 区块链; 安全性证明; 数字货币; 工作量证明; Nakamoto consensus; blockchain; proof of security; cryptocurrency; proof-of-work;

计算机 信息安全 论文 Website Google Scholar

抗泄露的无证书密钥封装机制及应用

Leakage-resilient certificateless key-encapsulation mechanism and application

周彦伟, 杨波, 乔子芮, 夏喆, 张明武
中国科学: 信息科学, 2021, 51(12): 2119-2133
摘要 泄露攻击的出现,导致在传统理想安全模型下已证明安全的密码机制在实际应用中不再保持其所声称的安全性;并且现有基于双线性映射构造的抗泄露无证书密钥封装机制(certificateless keyencapsulation mechanism, CL-KEM)的计算效率较低.针对上述不足,在不使用双线性映射的前提下本文设计了抗连续泄露的CL-KEM,并基于经典的判定性Diffie-Hellman假设对构造的安全性进行形式化证明.在我们的CL-KEM实例中,封装密文的所有元素对敌手而言是随机的,确保任意敌手均无法从封装密文中获知关于用户私钥的泄露信息;并且泄露参数是固定的常数,不受封装密钥空间大小的限制.为了进一步增强CL-KEM的抗泄露攻击的能力,本文构造了一个泄露量达到l_(sk)(1-O(1))的新颖抗泄露CL-KEM,其中l_(sk)表示私钥的长度,分析表明该机制在具有上述优势的同时,将抵抗泄露攻击的能力提升到最佳.最后,基于抗泄露CL-KEM提出抗泄露无证书混合加密机制和抗泄露无证书密钥协商协议的通用构造方法.
关键词 无证书公钥密码; 密钥封装机制; 泄露容忍; 连续泄露容忍; DDH安全性假设; certificateless public-key cryptography; key-encapsulation mechanism; leakage resilience; continuous leakage resilience; DDH security assumption;

计算机 信息安全 论文 Website Google Scholar

国密SM9数字签名和密钥封装算法的安全性分析

Security analysis of SM9 digital signature and key encapsulation

赖建昌, 黄欣沂, 何德彪, 伍玮
中国科学: 信息科学, 2021, 51(11): 1900-1913
摘要 安全性分析为密码方案的安全性提供重要依据和有力保障.我国自主设计的商用标识密码SM9已成为国家标准,其中, SM9数字签名算法和加密算法已成为ISO/IEC国际标准.然而,现有关于SM9标识密码算法安全性分析的公开发表研究成果较少. Cheng在Inscrypt 2018基于Gap-q-BCAA1假设,给出了SM9密钥交换协议、密钥封装机制和公钥加密算法的安全性证明.本文首先基于q-SDH假设和随机谕言模型,证明SM9数字签名算法具有EUF-CMIA的安全性.其次,为了消除对Gap类困难假设的依赖,采用Twin-Hash-ElGamal技术,提出基于SM9密钥封装机制的新型密钥封装机制Twin-SM9.与SM9密钥封装机制相比, Twin-SM9的系统公钥和用户私钥分别增加了一个群元素,而封装密文长度保持不变.在随机谕言模型中证明,若q-BDHI假设成立,则Twin-SM9密钥封装机制满足IND-CCA.然后进一步阐明了SM9标识密码的安全性,研究结果有助于基于SM9的高级密码协议和算法的设计与分析.
关键词 SM9; 安全性分析; 数字签名; 密钥封装; CCA; SM9; security analysis; digital signature; key encapsulation; CCA;

计算机 信息安全 论文 Website Google Scholar

基于轻量级区块链的隐私保护传染病监测数据聚合

Lightweight-blockchain based privacy-preserving data aggregation for epidemic disease surveillance

胡柏吉, 李元诚, 房方, 商兴宇
中国科学: 信息科学, 2021, 51(11): 1885-1899
摘要 随着COVID-19在全球肆虐,传染病监测有利于阻止传染病传播.而保护监测系统中病人以及数据提供者的隐私能免除他们对隐私信息泄露的顾虑,从而提高系统的数据采集能力.本文提出了一个基于区块链的传染病监测数据聚合方案(lightweight-blockchain based privacy-preserving data aggregation scheme, LBPDA),可以在不依赖可信第三方的情况下对数据进行聚合.特别地,为了保护数据聚合过程中数据隐私,采用基于Paillier密码系统的加法同态性来聚合病例数据.此外,为了减少时间开销和存储开销,对使用的Hyperledger Fabric联盟区块链平台进行了改进,从而轻量化数据聚合过程.我们对提出的方案进行了仿真,并进行安全性和性能分析以验证提出方案的可行性和有效性.结果显示,提出的方案能满足政府部门在聚合病例数据用于传染病监测的同时保护病人和数据提供者的隐私的需求.此外,通过对比也证明本文对区块链的轻量化是有效的.
关键词 区块链; 传染病监测; 隐私保护数据聚合; Paillier密码系统; Hyperledger Fabric; blockchain; epidemic disease surveillance; privacy-preserving data aggregation; Paillier cryptosystem; Hyperledger Fabric;

计算机 信息安全 论文 Website Google Scholar

一种基于区块链的隐私保护异步联邦学习

A blockchain-based privacy-preserving asynchronous federated learning

高胜, 袁丽萍, 朱建明, 马鑫迪, 章睿, 马建峰
中国科学: 信息科学, 2021, 51(10): 1755-1774
摘要 联邦学习能够在保障本地数据隐私前提下利用分布式数据和计算资源实现机器学习模型联合训练.现有异步联邦学习有效解决了同步联邦学习所存在的计算资源浪费、训练效率低等问题.然而,现有异步联邦学习通过聚合不同节点训练得到局部模型,并通过中心服务器完成全局模型更新,内生性地受制于中心化信用模式,存在单点失效、隐私泄露等问题.为此,提出了一种基于区块链的隐私保护异步联邦学习,通过上链局部模型并通过共识算法生成全局模型,保证异步联邦学习的可信性.为了保证联邦学习的隐私性,同时提高模型效用,提出利用差分隐私中的指数机制以高概率选择贡献度高的模型梯度,并分配较低的隐私预算以保证局部模型的隐私性.另一方面,针对异步联邦学习时钟不同步问题,提出了双因子调整机制进一步提高全局模型效用.最后,理论分析与实验结果表明所提出的方案能有效保证异步联邦学习的可信性和隐私性,同时提高了模型效用.
关键词 联邦学习; 区块链; 差分隐私; 模型效用; 异步训练; federated learning; blockchain; differential privacy; model utility; asynchronous training;

计算机 信息安全 论文 Website Google Scholar

移动边缘计算中基于位置信息的安全 skyline 查询处理方法

Secure skyline query processing in mobile edge computing over location-based data

王缵, 丁晓锋, 周潘, 田有亮, 金海
中国科学: 信息科学, 2021, 51(10): 1721-1737
摘要 针对移动边缘计算下查询的效率和安全问题,本文开展了面向位置信息的移动边缘计算安全skyline查询的研究.首先,提出了移动边缘计算场景下的安全skyline查询框架;其次,针对边缘服务器资源受限的特性,设计了新颖且统一的轻量级安全索引结构;然后,考虑云边协同中的隐私问题,提出了基于移动边缘计算的安全skyline查询协议.安全性分析表明该协议在半诚实模型下是安全的.同时,实验评估发现其比现有协议具有更高的查询效率.
关键词 安全skyline查询; 位置信息; 移动边缘计算; 安全索引; 半诚实模型; secure skyline queries; location-based data; mobile edge computing; secure index; semi-honest model;

计算机 信息安全 论文 Website Google Scholar

基于区块链和去中心可追踪属性签名的可控匿名认证方案

Controllable anonymous authentication scheme based on blockchain and decentralized traceable attribute-based signature

方宁, 刘百祥, 阚海斌
中国科学: 信息科学, 2021, 51(10): 1706-1720
摘要 信息技术的发展以及人们对于个人隐私安全重视程度的提升对传统互联网应用的身份认证机制提出了更高的要求,既要实现用户的身份认证,同时也要最大程度地保护用户的隐私信息.与传统的数字签名方案相比,基于属性的数字签名方案天然具有匿名的特点,即属性签名可以隐藏签名者的身份信息,其他用户无法将一个签名链接到签名者的身份(属性集).而在实际应用场景当中,我们通常还需要对用户的身份进行监管,以防止匿名滥用和失信行为的发生.因此,为了平衡这两种看似矛盾的需求,本文提出了一个基于区块链和去中心可追踪属性签名的可控匿名认证方案,通过对已有的可追踪属性签名方案进行适当改进,在不影响效率的前提下实现了去中心化的属性授权机构,以防止单个属性授权机构的腐败对系统安全性造成影响.实验及对比分析结果表明,本方案适用于电子投票系统和其他具有去中心可控匿名认证需求的场景.
关键词 区块链; 属性签名; 可追踪性; 可控匿名; 隐私保护; blockchain; attribute-based signature; traceability; controllable anonymity; privacy protection;

计算机 信息安全 论文 Website Google Scholar

基于区块链的数字内容生态价值链构建

Digital content ecological value chain based on block chain

周广猛, 姚苏, 李琳, 刘昕, 徐恪
中国科学: 信息科学, 2021, 51(9): 1559-1574
摘要 随着互联网和移动终端的普及,数字内容产业正成为文化产业主要经济增长点.本文从数字内容产业面临的版权、质量和产业壁垒问题入手,分析区块链技术对于建设数字内容生态价值链的意义和优势,提出以基于区块链的数字内容平台重塑生态价值链的方案.然后分析新型平台中的关键元素、价值流转、平台架构,设计平台价值流转过程中的基础方案,最后从成本和性能角度证明联盟链适合并且可以支撑平台构建.
关键词 数字内容; 价值链; 区块链; 价值流转; 联盟链; digital content; value chain; blockchain; value transfer; consortium blockchain;

计算机 信息安全 论文 Website Google Scholar

基于格的口令散列方案

Achieving password-hashing scheme over lattices

李增鹏, 汪定
中国科学: 信息科学, 2021, 51(8): 1375-1390
摘要 在可预见的未来,口令仍将是最主要的身份认证方法.口令认证密钥交换协议(password authenticated key exchange, PAKE)是口令认证的重要组成部分,它允许通信双方在不安全的通话信道上建立一个安全的会话密钥.为了缓解服务器被入侵后对存储在服务器上口令的影响,将口令散列之后再存储被广泛推荐,例如使用传统的口令散列函数,如PBKDF2, Bcrypt,和Scrypt.然而,这些口令散列函数依赖复杂的数学问题,安全性证明建立在随机预言机模型(random oracle model,ROM)之上,且需要较大内存支持.为解决上述问题,基于离散对数假设的口令散列方案陆续被提出,如Benhamouda-Pointceva方案(IACR ePrint2013/833)、Kiefer-Manulis方案(ESORICS’14)、Pointcheval-Wang方案(ASIACCS’17)与平滑投影散列函数(smooth projective hash function, SPHF)集成,但这些方案无法实现后量子安全且仍依赖于ROM模型.因此,本文着重研究如何在标准模型下设计后量子安全的口令散列方案,并给出可证明安全性分析.尽管所提方案尚不能应用于实际,但为构造实际的后量子安全的口令认证及密钥交换协议奠定了基础.
关键词 抗量子; 口令认证密钥交换; 口令散列方案; 平滑投影散列函数; 基于格的密码学; quantum resistant; password authenticated key exchange; password hashing scheme; smooth projective hash function; lattice-based cryptography;

计算机 信息安全 论文 Website Google Scholar

基于区块链和去中心属性密码的访问控制身份方案

Access control scheme on blockchain and decentralized attributed-based algorithm with identity

陈泽宁, 张亮, 张双俊, 阚海斌
中国科学: 信息科学, 2021, 51(8): 1345-1359
摘要 区块链上的身份体制是不健全的.如何在区块链上认证某个用户的身份、如何确保身份的背书机构是真实的一直是一个挑战.运行在区块链上的分布式公钥基础设施可以在某种程度上解决上述问题,但是属性密码结合区块链可以提供更贴近于真实社会的身份模型.提出一种基于区块链和去中心属性密码的访问控制身份方案,利用用户和组织之间相互授权、背书身份属性实现信任成本的链接,利用属性密码对链上数据进行访问控制和共享达到细粒度的访问控制和隐私保护.设计了可多用户协同的属性密码,为身份模型中的机构提供背书能力.通过实验仿真和对比分析,该方案在安全性和性能上都满足当前通用区块链的需求,为其提供了一种通用基础的身份模型.
关键词 区块链; 属性密码; 访问控制; 身份认证; 隐私保护; blockchain; attributed-based encryption; access control; identity authentication; privacy protection;

计算机 信息安全 论文 Website Google Scholar

面向数据流发布的数据自适应隐私保护机制

Data-adaptive privacy-preserving mechanism for data stream publishing in real-time

王腾, 杨新宇, 任雪斌, 赵俊
中国科学: 信息科学, 2021, 51(7): 1199-1216
摘要 群智感知系统中针对数据流的实时发布和深度学习在极大方便人们日常生活的同时,也严重威胁了参与用户的隐私信息.现有隐私保护机制在处理动态性强、时空相关性复杂的数据流时,大都难以实现数据自适应性,从而导致较低的数据效用性.因此,基于ω-事件级差分隐私,本文提出了一种数据自适应的多维数据流隐私保护实时发布机制AdaPub.该机制通过集成基于多重哈希的维度划分策略和自适应累积回溯时间聚类策略分别学习数据流的空间和时间相关性,不需要预定义任何参数,能够根据数据流的动态变化趋势来自适应地调整隐私参数,从而保证了隐私保护机制的数据自适应性并有效提高了数据效用性.此外,本文进一步提出了一种面向层次数据流发布的隐私保护机制HierAdaPub,利用最优隐私预算分配策略来最小化扰动方差以保证数据效用性.大量仿真实验从不同角度均验证了所提出隐私保护机制能够在提供强隐私保护的同时,具有较高的数据效用性.
关键词 数据流发布, 数据自适应, 差分隐私, 时空相关性, 数据效用性

计算机 信息安全 论文 Website Google Scholar

基于权限的移动应用程序隐私风险量化

Privacy risk quantification of mobile application based on requested permissions

朱敏杰, 叶青青, 孟小峰, 杨鑫
中国科学: 信息科学, 2021, 51(7): 1100-1115
摘要 移动设备的普及带来了移动应用程序市场的蓬勃发展,各类服务提供商通过移动应用程序的权限大量收集用户数据,而数据收集过程往往不为用户所知,因此给用户带来极大的隐私风险.对移动应用程序进行隐私风险评估,不仅有助于规范第三方移动应用市场,而且可帮助用户规避潜在的隐私风险,而如何评估移动应用程序可能带来的最大隐私风险则是当前面临的重大挑战.本文通过研究移动应用程序最大化的数据泄露场景,基于权限请求特征和权限分析原则构建隐私风险最大值量化模型.该模型基于权限敏感度、权限类别异常度、权限使用率和权限调用者数量4个参数,对移动应用程序的潜在隐私风险进行评估.在隐私风险量化和恶意应用检测中,对比当前同类型方法,该模型在真实数据集上效果均较优,说明模型的有效性.实验结果进一步表明,该模型可用于改善现有第三方移动应用市场的隐私风险预警机制,进而保护移动用户的隐私.
关键词 隐私保护, 移动应用程序, 隐私风险量化, 权限分析方法

计算机 信息安全 论文 Website Google Scholar

CCA安全的抗泄露IBE机制的新型构造

A new construction of leakage-resilient CCA secure IBE scheme

周彦伟, 杨波, 夏喆, 张明武
中国科学: 信息科学, 2021, 51(6): 1013-1029
摘要 隐私信息的泄露已成为密码系统当前的严重安全性隐患,因此抗泄露性将是密码机制必备的安全属性之一.目前,通常基于非交互式零知识论证系统、一次性损耗滤波器、强一次性签名等密码基础工具来实现选择密文攻击(chosen-ciphertext attack, CCA)安全的抗泄露身份基加密(identity-based encryption, IBE)机制的通用构造;然而,由于底层工具的计算效率较低,导致传统通用构造尚未达到理想的计算效率.针对上述不足,本文提出一个双封装密钥的身份基哈希证明系统(identity-based Hash proof system with two encapsulated key, T-IB-HPS)的新密码学原语,并详细介绍了T-IB-HPS的形式化定义及安全属性;同时,基于T-IB-HPS和消息验证码(message authentication code, MAC)设计了CCA安全的抗泄露IBE机制的新型通用构造,并基于T-IB-HPS和MAC的安全属性,对通用构造的CCA安全性进行了形式化证明;为进一步展示本文通用构造的实用性,在T-IB-HPS形式化定义的基础上,我们设计了T-IB-HPS的具体实例,并基于判定的双线性Diffie-Hellman假设证明了本文实例的安全性.相较于传统CCA安全的抗泄露IBE机制的通用构造而言,本文通用构造未使用计算效率低的密码学基础工具,表明了本文的通用构造方法具有较高的计算效率.
关键词 哈希证明系统, 身份基哈希证明系统, 身份基加密机制, 抗泄露攻击

计算机 信息安全 论文 Website Google Scholar

抗恶意敌手的百万富翁问题解决方案

Protocol for millionaires' problem in malicious models

李顺东, 王文丽, 杜润萌
中国科学: 信息科学, 2021, 51(1): 75-88
摘要 安全多方计算是国际密码学界研究的热点,百万富翁问题是安全多方计算最基础最重要的问题,是构造其他安全多方计算协议的基本模块.这个问题已经有许多解决方案,但除了基于混淆电路的协议之外,目前基于公钥加密算法的解决方案几乎都是半诚实模型下的解决方案,抗恶意敌手的解决方案极少,仅有的个别解决方案效率很低,这制约着恶意模型下许多安全多方计算问题的解决.抗恶意敌手的解决方案更符合安全多方计算的实际应用场景,研究抗恶意敌手的百万富翁问题解决方案,具有重要的理论与现实意义.本文首先设计了一个半诚实模型下百万富翁问题的解决方案,进一步分析了恶意敌手可能的恶意行为,并用零知识证明和分割选择阻止或发现这些恶意行为,将半诚实模型下安全的计算协议改造成恶意模型下安全的计算协议,并用理想–实际范例证明了协议的安全性,分析了恶意敌手攻击成功的概率和方案的效率.理论分析表明与现有方案相比,我们提出的方案效率至少提高6倍.
关键词 安全多方计算; 百万富翁问题; 恶意模型; 分割–选择; 零知识证明; 理想–实际范例; secure multiparty computation; millionaires' problem; malicious model; cut-and-choose; zero-knowledge proof; ideal-real paradigm;

计算机 社会媒体 论文 Website Google Scholar

基于解析图嵌入和加权图卷积网络的知识图谱补全

Knowledge graph completion based on parsing graph embedding and a weighted graph convolutional network

罗妹秋, 张春霞, 彭成, 张鑫, 郭贵锁, 牛振东
中国科学: 信息科学, 2022, 52(11): 2037-2057
摘要 知识图谱补全是知识图谱构建、自然语言处理和知识工程等领域的重要研究课题.知识图谱不仅是实现通用领域和专业领域精准知识服务的知识支撑,而且是信息检索、问答交互和信息推荐等领域取得突破性进展的必要基础.知识图谱的低质量和小规模是阻碍知识图谱广泛应用的主要瓶颈.知识图谱补全的目的是构建大规模高质量的知识图谱,以不断更新和扩充知识图谱.针对现有知识图谱补全方法难以从非结构化文本等辅助信息中提取深层次语义特征的问题,本文提出一种基于解析图嵌入和加权图卷积网络的知识图谱补全方法.一方面,该方法通过加权图卷积网络,对实体描述文本的语义依存分析进行建模,构建语义依存解析图嵌入;另一方面,引入了实体描述文本的多粒度句嵌入生成方法,旨在于构建能够捕获多粒度语义、深层次语义特征的实体表示学习.通过在两个公开数据集上的实验结果表明了本文知识图谱补全方法优于现有方法,验证了本文方法的有效性和优越性.
关键词 知识图谱补全; 解析图嵌入; 加权图卷积网络; 语义依存分析; 实体表示学习; knowledge graph completion; parsing graph embedding; weighted graph convolutional network; semantic dependency parsing; entity representation learning;

计算机 社会媒体 论文 Website Google Scholar

基于句法模板采样的无监督复述生成方法

Unsupervised paraphrasing via syntactic template sampling

鲍宇, 黄书剑, 周浩, 李磊, 戴新宇, 陈家骏
中国科学: 信息科学, 2022, 52(10): 1808-1821
摘要 文本复述可以辅助机器翻译、智能问答、文本分类等任务,是非常重要的自然语言处理任务.近年来,一些研究探索了基于结构变换的文本复述,从无监督学习的概率化表示空间中采样多个句法表示并生成多个复述.然而,通过后验分布采样句法表示生成的复述往往高度相似,缺乏多样性;另一方面,从先验分布采样句法表示又难以保证与给定的语义表示相匹配,导致生成的复述质量欠佳.本文提出了基于句法模板的文本复述模型,引入了句法模板隐变量建立语义空间和句法空间的联系,并进一步提出了两步采样策略:(1)使用先验分布采样句法模板,使得采样的句法表示更加多样化;(2)使用后验分布采样句法表示,以确保句法表示与语义表示的匹配.实验表明,两步采样策略有效地结合了先验采样和后验采样的优势,生成的文本复述可以在具备良好生成质量的同时保持着更好的多样性,取得了当前最佳的复述性能.
关键词 无监督复述; 变分自编码器; 句法结构; 采样; unsupervised paraphrasing; variational autoencoder; syntax structure; sampling;

计算机 社会媒体 论文 Website Google Scholar

细粒度建模用户兴趣的序列化推荐方法

Fine-grained modeling of user interests for sequential recommendation

张麒, 吴宾, 孙中川, 叶阳东
中国科学: 信息科学, 2022, 52(10): 1775-1791
摘要 序列化推荐因其实用性和较高推荐精度在近期受到了人们广泛关注.不同于传统推荐方法,序列化推荐的核心在于如何基于用户近期交互行为来捕获用户的短期兴趣.现有工作或者依次考虑用户交互序列中物品之间的成对关系,忽略了更为重要的多对一关系;或者将用户最近交互的多个物品视为集合,忽略了物品之间的相对次序.这不仅未能充分挖掘物品之间的复杂关系,而且未准确刻画用户兴趣的演变过程.为此,本文提出门耦合胶囊网络(gating coupled capsule network, GCC),一种从个体层、联合层以及局部有序性3个层面细粒度分析物品间关系对于用户短期兴趣影响的方法.借助胶囊网络的空间感知能力, GCC引入个性化胶囊模块建模用户高阶时序信息,其不仅能够捕获物品间的联合层关系,也保留了物品间的局部有序性.另外,本文在GCC中设计了用于建模物品间成对关系的个性化门单元模块,以此捕获个体层关系对于用户短期兴趣的影响.在4个真实推荐场景下的实验结果表明, GCC相比于主流序列化推荐方法在多个评价指标上具有显著的性能优势.
关键词 胶囊网络; 序列化推荐; 门单元机制; 隐式反馈; 推荐系统; capsule networks; sequential recommendation; gating mechanism; implicit feedback; recommender systems;

计算机 社会媒体 评述 Website Google Scholar

语言认知与语言计算——人与机器的语言理解

Language cognition and language computation—human and machine language understanding

王少楠, 丁鼐, 林楠, 张家俊, 宗成庆
中国科学: 信息科学, 2022, 52(10): 1748-1774
摘要 语言理解是认知科学和计算机科学交叉领域共同关心的问题,但两个学科在选择具体研究问题时却十分不同.认知科学领域的研究侧重解析大脑的工作机制,更多地关注于描述大脑对语言的响应,缺乏对大脑语言功能整体化、系统化的研究,而计算机科学家在选择研究问题时重点关注实际应用效能,往往忽略了对语言最本质规律的研究.那么,如何实现两种思路的交叉融合,为智能语言计算模型的构建和语言认知机理的研究带来新的机遇和启发呢?本文首先简要回顾了认知科学和计算机科学在语言理解方向上的研究问题、发展历程和研究方法,重点阐述研究现状和面临的挑战,之后对比认知科学和计算机科学领域对于语言理解问题的主要观点,分析两者之间的异同.最后对现有语言认知和语言计算两个领域的交叉融合方法进行归纳和总结,并对未来发展趋势予以展望.
关键词 语言认知; 语言计算; 人的语言理解; 机器的语言理解; 交叉研究; language cognition; language computation; human language understanding; machine language understanding; interdisciplinary research;

计算机 社会媒体 论文 Website Google Scholar

基于交互序列商品相关性建模的图卷积会话推荐

Item correlation modeling in interaction sequence for graph convolutional session recommendation

闫昭, 项欣光, 李泽超
中国科学: 信息科学, 2022, 52(6): 1069-1082
摘要 会话推荐旨在根据用户在会话中的短期行为,预测用户的后续行为,多应用于用户匿名访问网站的场景.会话推荐的核心在于商品之间协同关系的建模,以提升推荐结果的性能.现有方法大都挖掘商品交互顺序信息以计算商品间的协同关系.这种方式仅仅考虑了商品之间的相邻交互的信息,忽视了历史交互信息.其实,若两个商品共享相同的历史交互信息,即它们具有一定的协同关联性.例如,在两个商品交互序列为I_1-I_2-I_3和I_1-I_2-I_4的会话中,商品I_3与I_4的历史交互信息均为I_1-I_2,则商品I_3与I_4极有可能具有较强的关联关系.因此,本文提出了一种新颖的会话推荐模型IHGCN,通过分析会话的商品交互序列建模商品之间的关联关系,同时挖掘了相邻交互信息和历史交互信息.为了从这些交互信息中协同分析出商品特征,所提出方法使用图结构构建商品之间的关系,并引入图卷积网络从商品关系图中学习商品特征.该方法使用特征维度级的细粒度注意力机制挖掘户的全局偏好,并融合用户的局部偏好;基于学习得到的商品特征和用户偏好特征生成最终的推荐结果.本文在3个公开数据集上进行了验证分析,与当前最好的相关方法的比较结果表明所提出方法 IHGCN的有效性和优越性.
关键词 会话推荐; 图卷积网络; 商品交互相似性; 用户偏好; 注意力机制; session-based recommendation; graph convolutional network; item interaction similarity; user preference; attention mechanism;

计算机 社会媒体 论文 Website Google Scholar

基于多头注意力网络的无监督跨媒体哈希检索

Unsupervised cross-media Hashing retrieval based on multi-head attention network

李志欣, 凌锋, 唐振军, 马慧芳, 施智平
中国科学: 信息科学, 2021, 51(12): 2053-2068
摘要 跨媒体哈希检索将不同媒体数据编码到公共二值哈希空间中,从而可以有效地测量不同模态样本之间的相关性.为了进一步提高检索性能,提出基于多头注意力网络的无监督跨媒体哈希检索方法.首先,利用多头注意力网络生成哈希码矩阵,使图像和文本能获得更好的匹配.其次,构造一个辅助相似度矩阵,用以整合来自不同模态的原始邻域信息.通过辅助相似度矩阵与哈希码矩阵的协同学习,能够捕获不同模态之间和相同模态内部的潜在联系.此外,设计了两种损失函数训练网络模型,并使用批量归一化和更换哈希码生成函数的策略对模型进行优化,使模型的训练速度得到大幅提升.在3个数据集上的实验表明,本方法的平均性能比目前国际上先进的无监督方法有显著提升,充分证明了本方法的有效性和优越性.
关键词 卷积神经网络; 多头注意力网络; 跨媒体哈希检索; 无监督学习; 协同学习; 辅助相似度矩阵; 批量归一化; convolutional neural network; multi-head attention network; cross-media Hashing retrieval; unsupervised learning; collaborative learning; auxiliary similarity matrix; batch normalization;

计算机 社会媒体 论文 Website Google Scholar

基于时变阻尼运动的社交网络信息传播动力学分析

Social network information propagation dynamic analysis based on time-varying damping motion

刘小洋, 何道兵, 刘超, 张宜浩
中国科学: 信息科学, 2021, 51(11): 1867-1884
摘要 针对目前社交网络上信息传播动力学的研究成果中,未能从社会物理学层面揭示微观个体上的随机性和无序性与宏观群体上的可知性和可控性之间的关系问题,本文提出了一种基于时变阻尼运动的信息传播动力学模型(time-varying damped motion, TVDM).首先,深入分析社交网络中信息传播现象,从时间、空间、主体(行为人)、客体(信息) 4个维度提取关键特征;然后,从带阻尼的简谐运动视角、内外力系合力作用视角、信息能量转化视角、时变系统与信号变换视角,揭示了社交网络上信息传播的物理学本质规则和作用机制;最后,通过数值模拟实验验证了网络上个体行为服从统计规律性.实验结果表明:提出的时变阻尼运动信息传播动力学模型精度为91%,构建的社交网络信息传播动力学模型TVDM是合理有效的.
关键词 社交网络; 动力学; 信息能量; 阻尼运动; 时变系统; social network; dynamics; information energy; damping motion; time-varying system;

计算机 社会媒体 评述 Website Google Scholar

基于深度学习的多方对话研究综述

A survey of multi-party dialogue research based on deep learning

张开颜, 张伟男, 刘挺
中国科学: 信息科学, 2021, 51(8): 1217-1232
摘要 近年来,随着深度学习技术的广泛应用,人机对话研究取得了突破性进展.但是,目前的人机对话系统大多是在人机双方参与的假设下进行设计的,而更具挑战性的人机多方对话的研究和应用尚不成熟.本文将立足于自然语言处理领域,对近几年基于深度学习的多方对话研究进展进行综述.首先从人机对话角度出发,整理多方对话系统的关键问题和已有解决方案;然后,梳理基于多方对话的其他自然语言处理任务;之后,总结已有多方对话研究的数据集,并分析现有数据集的局限性和改进方案;最后,展望多方对话研究的未来发展趋势.
关键词 自然语言处理; 深度学习; 人机对话; 多方对话; natural language processing; deep learning; human-machine dialogue; multi-party dialogue;

计算机 软件 评述 Website Google Scholar

基于深度学习的SQL生成研究综述

A survey of deep learning based text-to-SQL generation

梁清源, 朱琪豪, 孙泽宇, 张路, 张文杰, 熊英飞, 梁广泰, 郁莲
中国科学: 信息科学, 2022, 52(8): 1363-1392
摘要 SQL生成(text-to-SQL)是自动化软件工程的重要应用之一,也是语义解析领域的研究热点.SQL生成根据输入的自然语言描述自动生成相应的SQL数据库查询语句,它允许非专业人员在不了解SQL语法的情况下访问数据库.随着大量SQL相关数据集的不断构造以及人工智能技术的卓越进步, SQL生成任务也得到了极大的发展.基于深度学习的SQL生成(deep learning-based text-to-SQL)能够利用大规模数据的优势,从已有数据中学习自然语言、数据库以及SQL语句的表示,并根据新的自然语言输入生成符合查询需求的SQL语句.相对于传统的SQL生成,基于深度学习的SQL生成具有高准确率、输入信息灵活和可迭代学习的优点.近年来,研究者在基于深度学习的SQL生成方面进行了一系列的研究,本文从SQL生成场景、数据集、模型结构和评估方法层面对现有研究进行分类综述.
关键词 SQL生成; 语义解析; 深度学习; 代码生成; 编码–解码模型; text-to-SQL; semantic parsing; deep learning; code generation; encoder-decoder;

计算机 软件 论文 Website Google Scholar

一种基于列计算的空间并置模式挖掘方法

A spatial co-location pattern mining approach based on column calculation

杨培忠, 王丽珍, 王晓璇, 周丽华
中国科学: 信息科学, 2022, 52(6): 1053-1068
摘要 空间并置(co-location)模式挖掘旨在发现空间特征间的关联关系.一个并置模式是空间特征集合的子集,它们的实例在空间中频繁并置出现.传统的并置模式挖掘方法大多基于表实例计算模式的并置程度,但表实例的生成和存储将导致巨大的时间、空间消耗.针对这一问题,本文提出了一种基于列计算的空间并置模式挖掘方法,不再生成表实例,只需要搜索模式的参与实例.为了加速参与实例搜索,设计了实例搜索空间剪枝、候选参与实例验证、频繁性提前感知等优化策略.在此基础上,提出了CPM-Col算法,讨论了算法的复杂度、正确性和完备性.在真实和模拟数据集上进行了大量实验,实验结果表明,本文提出的算法比其他7个baseline算法具有更好的性能和可扩展性,特别地,CPM-Col算法的效率提升达到数倍至数个量级.此外,实验验证了本文提出的优化策略的有效性.
关键词 空间数据挖掘; 并置模式; 列计算; 搜索算法; 剪枝技术; spatial data mining; co-location pattern; column calculation; search algorithm; pruning technique;

计算机 软件 论文 Website Google Scholar

组合云系统可靠性概念漂移在线度量方法研究

Reliability concept drift online measurement for composite cloud systems

王磊, 张云秋, 徐丙凤, 徐逸卿
中国科学: 信息科学, 2021, 51(9): 1438-1450
摘要 随着全球云计算产业规模的迅速增长,采用按需付费的方式,基于云服务组合实现大规模软件服务的动态集成和协同,从而构造复杂软件,已成为一种切实可行的方法.所构建的组合云系统运行在动态、不确定的环境下,如何应对系统运行可靠性数据流的概念漂移问题,保障系统运行质量,是一个亟待解决的挑战性问题.为给针对组合云系统的可靠性自适应提供早期指导,本文基于主动式缺陷管理思想,研究组合云系统运行风险的在线感知方法,提出基于Sinkhorn距离的可靠性概念漂移在线度量方法 RCDMeas.这一方法通过引入熵正则化和不动点迭代,计算系统历史累积的可靠性流数据和临近的可靠性流数据的分布距离,从而识别组合云系统可靠性概念漂移及系统潜在运行风险.大规模数据实验结果验证了本文方法的有效性.本文的工作对服务组合系统的自动化运维具有重要的理论意义与实际应用价值.
关键词 组合云系统; 可靠性; 概念漂移; 在线; 运行质量保障; composite cloud systems; reliability; concept drift; online; execution quality assurance;

计算机 软件 论文 Website Google Scholar

基于路径相似度的并行程序多路径覆盖调度序列排序

Path similarity-based scheduling sequence sorting for multi-path coverage of parallel programs

潘峰, 巩敦卫, 田甜, 姚香娟, 李吟
中国科学: 信息科学, 2021, 51(4): 565-581
摘要 测试是提高软件可靠性的重要方法.消息传递并行程序中存在的不确定通信语句,使得进程执行顺序具有不确定性,这增加了测试该类程序的难度.鉴于进程执行顺序对目标路径覆盖难易程度的影响,本文研究消息传递并行程序多路径覆盖调度序列排序方法,以提高多路径覆盖测试数据生成的效率.首先,在每个调度序列下,以每个采样的程序输入执行程序,生成路径覆盖矩阵;然后,针对每条目标路径,分别计算与路径覆盖矩阵中每条路径的相似度,生成多个路径相似度矩阵;接着,基于这些路径相似度矩阵的特征量,评价调度序列的性能,并依此对调度序列排序;最后,基于调度序列排序集,使用随机采样法,生成覆盖所有目标路径的测试数据,并使用缺陷检测平均百分比(average percentage of faults detected, APFD)指标评估调度序列排序集.将所提方法应用于9个基准并行程序中,并与随机方法和传统方法进行比较.实验结果表明,所提方法对路径覆盖率没有影响,但显著减少了被测程序执行次数和运行时间.
关键词 消息传递并行程序; 多路径覆盖; 测试; 调度序列排序; 路径相似度; message-passing parallel program; multi-path coverage; testing; scheduling sequence sorting; path similarity;

计算机 软件 论文 Website Google Scholar

基于互联网群体智能的拼图问题求解

Solving pictorial jigsaw puzzles via Internet-based collective intelligence

申博, 张伟, 赵海燕, 金芝, 吴艳红
中国科学: 信息科学, 2021, 51(2): 206-230
摘要 拼图游戏是一类复杂问题的典型代表.这类问题的复杂性体现在其无法通过自上而下、集中控制的方式进行有效求解.通常情况下,拼图游戏由一个玩家独立完成,或由几个玩家围坐在一起协同完成.本文提出一种基于互联网人类群体智能的拼图问题求解方法.该方法使用一种被称为"探索–融合–反馈"的回路用于支持人类玩家群体在互联网环境中进行并行、协同的拼图问题求解.其中,探索活动由玩家实施,融合与反馈活动由拼图环境自动实施.在探索活动中,每个玩家独立进行拼图问题的求解,不与其他玩家发生直接的交互.在任何时刻,一个玩家探索活动的结果是一个关于当前拼图问题的片段解,以及一组被该玩家判断为错误的图块邻接关系.在融合活动中,拼图环境实时地将所有玩家的当前探索结果融合在一起,形成一个不断演化的群体观点图.在反馈活动中,对于每一个玩家,拼图环境根据该玩家的当前探索结果和当前的群体观点图,向该玩家推荐特定的信息,以加速其拼图进程.我们实现了一个支持上述方法的多人在线拼图环境,并在2~10人规模的玩家群体中进行了初步的实验.实验结果表明:(1)在这一多人拼图环境中,拼图求解时间大致正比于玩家数量的倒数,且以玩家群体中的最强个体为基准点,群体拼图效率能够实现31.36%~64.57%的提升;(2)在该环境中,最快完成拼图的玩家获得的反馈信息平均具有86.34%的准确率,且随着群体规模的增加,反馈信息在最快玩家拼图结果中的平均占比逐渐从20%增加到45%左右;(3)相比于面对面协同的群体拼图求解方式,该环境展示出更好的群体规模可扩展性,且拼图结果总是具有100%的正确率,而拼图问题自动求解算法平均只具有52%的正确率.我们希望本文工作能够为探索群体智能在互联网环境下的更广泛应用提供一些有用的信息或观点.
关键词 人类群体智能; 互联网; 复杂问题求解; 拼图问题; 信息融合与反馈; collective human intelligence; Internet; complex problem solving; pictorial jigsaw puzzle; information integration and feedback;