计算机
人工智能
论文
Website
Google Scholar
王鑫, 姚洋, 蒋昱航, 关超宇, 朱文武
中国科学: 信息科学, 2023, 53(5): 899-917
摘要 深度神经网络(deep neural networks, DNNs)能否取得令人满意的性能很大程度上依赖于其神经网络架构.研究人员提出神经网络架构搜索(neural architecture search, NAS)来自动搜索神经网络的最优架构,现有的工作大多使用每秒浮点运算次数(floating point operations per second, FLOPs)来评价神经网络架构的实际效率,但是FLOPs和实际延迟并不是完全一致的.随着任务变得越来越复杂以及越来越多的硬件平台开始运行基于深度神经网络的算法,为硬件平台搜索高效的神经网络架构已成为亟待解决的难题.为了解决这一问题,本文提出了硬件感知的搜索空间构造方法,并借助考虑架构推断延迟的搜索策略,来搜索最优的神经网络架构.本文在可变换神经网络架构搜索方法(transformable architecture search, TAS)和图神经网络架构搜索方法 (graph neural architecture search, GraphNAS)上应用了该方法,提出了硬件可感知的可变换神经网络架构搜索方法 (hardwareaware transformable architecture search, HTAS)和硬件感知的图神经网络架构搜索方法 (hardwareaware graph neural architecture search, HGNAS).相比于现有方法,本文所提出的这两种算法在多种数据集上均针对不同类型目标硬件搜索出了更加高效的深度神经网络架构,从而证明了该方法的有效性.
关键词 深度学习; 神经网络架构搜索; 可变换神经网络架构搜索; 图神经网络架构搜索; 硬件感知; deep learning; neural architecture search; transformable architecture search; graph neural architecture search; hardware-aware;
计算机
人工智能
论文
Website
Google Scholar
周成, 李军华, 黎明, 张聪炫, 蔡昊
中国科学: 信息科学, 2023, 53(5): 878-898
摘要 模型剪枝被广泛应用于深度神经网络(deep neural network, DNN)的压缩与加速,为资源受限的终端设备部署DNN提供了技术支持.然而以往的剪枝研究缺乏对卷积核效力机制的有效评估,同时忽视了压缩空间中多种不可控因素的潜在干扰.因此本文提出一种卷积效力评价机制驱动的DNN全局剪枝方法,在特征图信息丰富度的基础上,以可视化的方式评估卷积核的效力值,优化了卷积核选择机制.同时探索了压缩空间中卷积结构的效力相关性,并在不同卷积层中使用不同的剪枝标准.首先,本文通过离散傅里叶变换(discrete Fourier transform, DFT)对特征图的信息度进行定量分析,并提出一种评估卷积核效力值的数据驱动方法.然后,基于卷积结构的相关性,引入损失因子以度量剪枝过程中剩余压缩单元的效力损失.最后根据层索引值的变化,在不同结构的功能层中自适应修正剪枝标准.实验表明,相比于最新的剪枝策略,本文的剪枝方法具有更佳的压缩性能和模型优化能力.
关键词 深度神经网络压缩; 模型剪枝; 重要度评估; 损失因子; 特征图信息度; deep neural network compression; model pruning; significance evaluation; loss factor; informativeness of feature map;
计算机
人工智能
论文
Website
Google Scholar
徐凡, 李明昊, 黄琪, 鄢克雨, 王明文, 周国栋
中国科学: 信息科学, 2023, 53(4): 663-681
摘要 社交媒体谣言以极低的成本在互联网中被快速扩散,给社会带来显著的负面影响.传统的谣言检测模型主要考虑传播模式、写作风格、用户信用和世界知识等信息.然而,谣言的传播模式通常难以被捕捉,写作风格却容易被模仿,由元数据(如职业、家乡、学历、年龄等)构成的用户信息也容易被伪造.本文提出了一种新颖的知识驱动的图卷积神经网络谣言检测模型.该模型首先将社交媒体文本表示成一种语义–实体无向图结构,其中节点包含原社交媒体文本中的词语,利用世界知识库扩展的实体词语,以及利用语言知识库扩展的语义词语,边包含三类节点的6种有效组合.该语义–实体图可以有效地增强任意两种节点的共现性,从而丰富了原社交媒体文本的表示,从一定程度上缓解数据稀疏共现问题.语言知识利用了HowNet (义原和同义词)以及WordNet (上义词、下义词和同义词)分别对中英文社交媒体文本的主题词进行扩充.并成功地将语言知识和实体知识通过图卷积神经网络框架有效集成.在4个国际基准中英文谣言语料库上的实验结果和可视化分析表明了本文模型的有效性.
关键词 语言知识; 世界知识; 主题模型; 图卷积神经网络; 谣言检测; language knowledge; world knowledge; topic model; graph convolutional neural networks; rumor detection;
计算机
人工智能
论文
Website
Google Scholar
张迎伟, 陈益强, 于汉超, 杨晓东, 谷洋
中国科学: 信息科学, 2023, 53(4): 647-662
摘要 认知健康是大脑健康的重要组成部分,与个体全生命周期的正常发展密切相关.目前,非受限普适场景下的认知能力评估已成为实现认知障碍相关疾病早期预警的重要途径.然而,在医疗、家庭等不同计算场景下,因感知设备、认知评估流程等的不同,往往存在不同场景间评估模型相互适用难的问题.针对以上跨场景认知能力评估挑战,本文提出了一种参数自适应的细粒度迁移学习方法 PAFG-TL.PAFG-TL基于随机森林模型实现,通过参数自适应的个体分类器评估策略和领域自适应的决策树生长机制实现参数无关的个体分类器聚类评估和决策树细粒度进化生长.通过在临床认知评估和公开基准数据集上进行实验验证,证明了PAFG-TL方法在跨场景认知能力评估中的有效性.
关键词 参数自适应; 细粒度; 迁移学习; 跨场景; 认知能力评估; parameter adapative; fine-grained; transfer learning; cross-scenario; cognitive ability assessment;
计算机
人工智能
论文
Website
Google Scholar
公茂果, 高原, 王炯乾, 张元侨, 王善峰, 谢飞
中国科学: 信息科学, 2023, 53(3): 437-453
摘要 联邦学习是一种多设备参与的,保护数据隐私的深度学习技术.它能够在私有数据不出本地的同时训练全局共享模型.然而,在复杂的物联网环境中,联邦学习面临着统计异构性和系统异构性的挑战.不同的本地数据分布和高额的通信计算成本,使得过参数化的模型不适合在物联网应用中直接部署.同时,非独立同分布的数据也使采用参数平均聚合的联邦学习更加难以收敛.联邦学习场景下的研究难点在于,如何根据私有数据为每个客户端建立个性化的轻量级模型的同时,把这些模型汇总成为联合模型.为了解决这一问题,本文提出了一种基于进化策略的自适应联邦学习算法.该方法将模型结构进行编码,把每个参与者视作进化策略中的个体,通过全局优化来为每个客户端自适应地生成不同的个性化子模型.客户端根据网络单元重要性和编码在服务器端超网中抽取相应的子网来进行本地更新,而这种网络局部更新的方法天然契合dropout的思想.在真实数据集上进行的大量实验证明,本文提出的框架相比于经典的联邦学习方法,模型性能得到了显著改善.在客户端数据非独立同分布的情况下,该算法在有效降低了客户端在通信带宽和计算力受限条件下参与联邦学习门槛的同时,提高了全局模型的泛化能力.
关键词 联邦学习; 进化策略; 模型编码; 网络剪枝; 本地个性化; federated learning; evolution strategy; model encoding; network pruning; local customization;
计算机
人工智能
论文
Website
Google Scholar
倪宣明, 沈鑫圆, 张海
中国科学: 信息科学, 2022, 52(12): 2306-2320
摘要 联邦学习允许资源受限的边缘计算设备协作训练机器学习模型,同时能够保证数据不离开本地设备,但也面临着异构数据下全局模型收敛缓慢甚至偏离最优解的挑战.为解决上述问题,本文提出一种自适应个性化联邦学习(adaptive personalized federated learning, APFL)算法,在同时包括空间和时间维度的多任务学习框架下,考虑面向异构数据的联邦优化问题.首先, APFL采用参数分解策略,将待训练模型参数分解为全局共享参数和客户端特定参数,在提取所有客户端公共知识的同时实现针对每个客户端的个性化建模.进一步地, APFL将每个客户端上执行的局部优化构建为顺序多任务学习,通过对全局共享参数的更新施加弹性权重巩固(elastic weight consolidation, EWC)惩罚,实现了全局共享模型中重要参数的记忆保留和非重要参数的快速学习.多个联邦基准数据集上的对比实验验证了本文方法的有效性和优越性.
关键词 联邦学习; 边缘计算; 异构数据; 多任务学习; 持续学习; 参数分解; 个性化; federated learning; edge computing; heterogeneous data; multi-task learning; continual learning; parameter decomposition; personalization;
计算机
人工智能
论文
Website
Google Scholar
张文钧, 蒋良孝, 张欢
中国科学: 信息科学, 2022, 52(10): 1792-1807
摘要 从概率框架的角度来看,生成模型首先由数据学习联合概率分布,然后再求出条件概率分布,通常具有更快的收敛速度;而判别模型由数据直接学习条件概率分布,往往具有更高的准确率.生成–判别混合模型作为二者的有效结合,同时集成了它们的优点.然而,现有方法在构建混合模型时,需要将原始特征划分为两个独立的特征空间,分别用于训练生成模型和判别模型.特征划分不仅提升了模型的时间复杂度,还削弱了原始特征空间的表达能力.为了解决这一问题,本文提出了一种基于特征增广的生成–判别混合模型构建方法.该方法首先利用生成模型学习条件概率分布,然后将学到的条件概率分布作为新特征增广到原始特征空间中,最后在增广后的特征空间中训练判别模型并预测最终的分类结果.该方法利用特征增广的思想做模型混合,无需对原始特征进行划分,具有较低的时间复杂度,同时还增强了原始特征空间的表达能力.在36个经典UCI标准数据集上的实验结果表明,所提方法不仅具有有效性和通用性,还遵循了偏差–方差权衡原则.
关键词 生成模型; 判别模型; 特征增广; 条件概率分布; 偏差–方差权衡; generative model; discriminative model; feature augmentation; conditional probability distribution; bias-variance trade-off;
计算机
人工智能
论文
Website
Google Scholar
杜昊桐, 王震, 聂弘毅, 姚权铭, 李学龙
中国科学: 信息科学, 2022, 52(7): 1204-1220
摘要 知识图谱嵌入是知识图谱研究中的一项重要课题.它旨在根据已观测到的三元组,学习知识图谱中实体与关系的低维向量表示.知识图谱嵌入在许多下游任务中发挥了巨大作用,例如知识图谱补全、三元组分类.如今,深度模型利用神经网络强大的非线性拟合能力,在知识图谱嵌入领域展示出了优异的性能.然而,现有的大多数方法忽略了实体与关系之间的多尺度特征交互, InceptionE是目前唯一考虑到了多尺度交互特征的模型,但由于大量的计算开销导致其很难进行训练.本文提出了一种全新的知识图谱嵌入模型MDCE,它使用多尺度空洞卷积核在不同的尺度空间捕捉丰富的交互特征.同时, MDCE相比于InceptionE方法的计算开销更小.我们在多个基准数据集上进行了大量实验.在链接预测任务上的结果表明, MDCE不仅在性能方面超过了已有的工作,而且更加高效、稳健.
关键词 知识图谱; 知识图谱嵌入; 深层模型; 多尺度特征; 链接预测; 人工智能; knowledge graph; knowledge graph embedding; deep model; multi-scale feature; link prediction; artificial intelligence;
计算机
人工智能
论文
Website
Google Scholar
诸葛文章, 范瑞东, 罗廷金, 陶红, 侯臣平
中国科学: 信息科学, 2022, 52(7): 1186-1203
摘要 不完全多视图聚类是通过结合多视图数据的异构不完全特征来获得数据本征结构,从而提高聚类性能的一种学习范式.在实际应用中,各个视图除了缺失某些完整样本外,还会受到缺失值与异常值的影响,使得大部分传统的不完全多视图聚类方法失效.为解决上述问题,本文提出一种基于独立自表达学习的不完全多视图聚类方法.该方法通过自表达重构,补全缺失的特征的同时学习视图独有的自表达矩阵,然后为自表达矩阵添加低秩约束,更好地挖掘本征结构,并通过引入希尔伯特–施密特独立性准则来衡量不同视图间的差异性.多个数据集上的实验结果表明,所提方法在大多数情况下能取得较对比方法更优的聚类结果.
关键词 不完全多视图聚类; 特征任意缺失; 自表达; 差异性; incomplete multi-view clustering; arbitrary missing feature; self-presentation; diversity;
计算机
人工智能
论文
Website
Google Scholar
石佳欣, 陈键飞, 朱军
中国科学: 信息科学, 2022, 52(5): 804-821
摘要 概率模型为机器学习处理广泛存在的不确定性提供了强大的工具.概率编程利用计算机程序表示概率模型,支持采样和以任意观察值为条件进行的概率推断.长期以来,概率程序中的依赖关系往往是线性或广义线性的,许多成功的模型和推断算法往往都依赖于这一简化.然而,这也限制了概率程序的表达能力和灵活性.可微概率编程允许构建具有参数化的非线性依赖关系(如神经网络)的概率程序,并使用基于梯度的方法从数据中学习未知参数.这种编程范式容易扩展,极大地避免了繁琐的模型选择过程,且允许端到端地部署概率模型.本文介绍珠算(ZhuSuan),一种开源的可微概率编程库,并以此为例,探讨可微概率编程系统的设计与实现.
关键词 概率模型; 概率编程; 贝叶斯推断; 变分推断; 深度学习; probabilistic models; probabilistic programming; Bayesian inference; variational inference; deep learning;
计算机
人工智能
论文
Website
Google Scholar
王克琪, 钱宇华, 梁吉业, 刘畅, 黄琴, 陈路, 贾洁茹
中国科学: 信息科学, 2022, 52(3): 443-460
摘要 卷积神经网络目前在人工智能多个领域均取得了不同程度的进展.卷积计算是基于参数共享的滑窗机制,这导致卷积神经网络更多地关注特征信息的局部关系,对全局关系的建模能力有限.局部关系和全局关系对特征的表达均具有重要的作用.为此,本文聚焦于如何对特征信息的局部–全局关系进行构建并有效耦合,从而挖掘更加丰富的特征信息,提高特征的判别性.本文提出了局部–全局关系耦合模块,该模块是由特征提取、基于深度卷积(depth-wise convolution, DWConv)的局部关系构建分支、基于多头自注意力机制(mutli-head self-attention, MHSA)的全局关系构建分支和基于点向卷积(point-wise convolution, PWConv)的关系耦合4部分组成.基于此模块,本文构建了编解码结构的局部–全局关系耦合神经网络,该网络可以对特征信息的局部–全局关系进行建模,增强特征信息的表征能力,进而提升模型的性能.为验证所提算法的有效性,本文在低照度图像增强任务上,使用基准数据集与其他算法进行了实验对比.实验结果表明,本文所提出的方法取得了较好的图像增强结果,优于当前先进的图像增强方法.最后,本文通过消融实验和扩展实验从多个角度进一步验证了有效耦合局部–全局关系的重要性和可扩展性.
关键词 低照度图像增强; 局部–全局关系; 计算机视觉; 卷积神经网络; 深度学习; low-light image enhancement; local-global relationship; computer vision; convolution neural network; deep learning;
计算机
人工智能
论文
Website
Google Scholar
高畅, 王家祺, 景丽萍, 于剑
中国科学: 信息科学, 2022, 52(3): 430-442
摘要 卷积神经网络压缩是近年来研究的热点.本文将模型存在冗余的原因归结为部分卷积核未学到任务相关特征.为去除这部分冗余,本文基于剪枝框架,从卷积核学习任务相关特征的程度和卷积核对损失函数的影响两个角度出发,提出一种新颖的重要度评价标准.此评价标准能准确量化卷积核的重要度,并以此指导卷积核剪枝操作.此外,本文还将梯度流策略引入到卷积核剪枝的过程中,在每次训练迭代中根据重要性和压缩率将卷积核分成两类并对它们分别用不同的更新策略.对于冗余参数,此策略将目标函数反传的梯度进行截流,仅使其权重逐渐衰减直至为零.本文在VGGNet和ResNet两种网络框架上对此剪枝算法进行验证.结果表明:本算法不仅能够在分类精度、计算量、参数量和任务相关特征的保留程度上优于当前主流剪枝算法,而且在高压缩率情况下表现优越.
关键词 卷积神经网络; 压缩; 剪枝; 任务相关特征; 梯度流; convolutional neural networks; compressing; pruning; features related to task; gradient flow;
计算机
人工智能
论文
Website
Google Scholar
罗杰, 姜鑫, 郭炳晖, 郑宏威, 吴文峻, 吕卫锋
中国科学: 信息科学, 2022, 52(1): 99-110
摘要 群体智能是自然界普遍存在的现象,受到了国内外研究者的广泛关注.网络和人工智能技术的高速发展,使得大规模群体在网络上通过个体智慧激发和群体智慧汇聚形成超越个体能力的群体智能成为可能.随之而来,如何认知和形成这样的群体智能系统成为了研究的热点.本文将在广义群体智能的概念体系之下,探索群体智能系统的度量理论和方法,以此来促进对群体智能形成机理的更深层认知.本文提出了群体智能系统的基本特性以及其形成的激发汇聚建模,指出群体智能系统实质上是一类复杂非线性动力学系统,包含微观个体激发、宏观群体协作、全局群智汇聚3个核心动力学属性.并以此为基础,讨论了群体智能系统群体熵度量所应满足的基本性质.最后以图的群体化搜索为例,说明了群体的激发和汇聚过程,以及在此过程中如何通过群体熵来度量群体行为的变化,验证了本文提出的群体熵度量思想的有效性.
关键词 群体智能系统; 动力学模型; 群体熵; 度量; 激发; 汇聚; crowd intelligence system; dynamic model; crowd entropy; measurement; incentive; convergence;
计算机
人工智能
论文
Website
Google Scholar
张腾, 黎铭, 金海
中国科学: 信息科学, 2022, 52(1): 86-98
摘要 基于间隔的聚类是一类经典的聚类算法,此类算法假设聚类结构能通过引入监督学习中的间隔来确定.即一个好的聚类结果,当以其簇标记作为类别标记进行监督学习时,所得分类器产生的关于间隔的目标物理量也同时达到最优.目前最为有效的间隔物理量是间隔分布,其基于最新的间隔理论,取得了比优化最小间隔更好的效果.然而在现实聚类任务中,我们往往还能获得一些额外的监督信息,例如两两样本之间的"必连"约束和"勿连"约束,此时优化间隔分布是否还有效尚未可知.对此,本文提出面向半监督聚类的最优间隔分布学习机(ODMSSC),对该问题进行初步探索. ODMSSC对应的形式化是一个混合整数规划,我们将其放松成一个鞍点问题,并提出一种高效的交替优化方法进行求解.最终通过真实数据集上的实验,我们验证了所提算法的有效性.
关键词 半监督聚类; 约束聚类; 最优间隔分布学习机; 间隔分布; 间隔; semi-supervised clustering; constrained clustering; optimal margin distribution machine; margin distribution; margin;
计算机
人工智能
论文
Website
Google Scholar
倪一鸣, 陈松灿
中国科学: 信息科学, 2022, 52(1): 75-85
摘要 无监督异常检测(unsupervised anomaly detection, UAD)旨在检测任何未见过的偏离预期模式或正常分布的数据,由于其学习过程不依赖对罕见异常样本的获取,因此在现实动态环境下备受青睐.然而,在现实场景中,目标任务往往会随时间动态变化,这要求模型能够连续执行多个不同的UAD任务,确保在仅有当前任务正常数据的前提下,实现对所有见过任务的异常检测.本文旨在研究这一问题,尝试从互信息角度,提出一种新的连续UAD (CUAD)算法.具体而言,我们针对原始目标依赖过往任务原始数据和异常数据的问题,给出基于信息论的损失函数,并对其进行近似优化.据此,我们构建出来的深度编码器模型既能连续执行不同的UAD任务,又能有效应对连续学习带来的灾难性遗忘问题.最后,我们在多个标准数据集上的实验验证了所提出方法的优越性.
关键词 异常检测; 无监督; 灾难性遗忘; 连续学习; 信息论; anomaly detection; unsupervised; catastrophic forgetting; continual learning; information theory;
计算机
人工智能
论文
Website
Google Scholar
史小艳, 陈松灿
中国科学: 信息科学, 2021, 51(12): 2037-2052
摘要 多视图数据广泛存在于现实,而异常也不可避免地伴随其中.现有的多视图异常检测方法针对的都是对齐的多视图场景,无法胜任更具挑战的非对齐多视图场景.为此,本文提出了4种基于单簇可能性C–均值(possibilistic C-means, PCM),即P1M (PCM, C=1)算法的非对齐多视图异常检测算法.不同于对齐的多视图场景,非对齐特性造成了样本在各视图间对应关系的缺失,以致我们无法利用在对齐场景下示例级的局部关键信息.为此,我们设法通过各视图的全局信息进行学习.本文的关键之处在于借助交替优化法为各视图分别学得一个变换矩阵,用其将各视图投影到一个公共子空间,进而在该公共子空间中用P1M学得所有训练数据对目标类的隶属度,并设置隶属度阈值,从而实现异常检测.在多个UCI数据集上的实验结果表明,本文方法能够有效应对非对齐多视图场景中的异常检测.
关键词 可能性C–均值; 非对齐多视图; 异常检测; 公共子空间; 单簇; possibilistic C-means; non-aligned multi-view; anomaly detection; the common subspace; one-cluster;
计算机
人工智能
论文
Website
Google Scholar
孙鹏飞, 欧阳亚文, 戴新宇, 张文明
中国科学: 信息科学, 2021, 51(11): 1853-1866
摘要 意图识别是对话系统的一个重要组成部分.现有的工作主要集中在使用充足的标记数据进行意图识别.然而,这些方法不能识别训练数据中不存在的意图.为了解决这个问题,我们提出了一种基于隐式网络和显式网络的相似性学习模型,用于零样本意图识别,该模型能够从词级和句子级学习用户话术和意图描述之间的相似性.为了增强意图的表示,我们引入槽位类型作为意图描述.并依据表达方式的不同将意图分为显式意图和隐式意图,分别从词级和句子级构建显式网络和隐式网络.同时,为了更好地结合这两部分信息,我们还设计了关系层来融合不同层级的信息.在两个基准数据集上的实验结果表明,我们的模型明显优于现有的最先进的模型,并展示了从词级和句子级同时学习相似性的有效性.
关键词 零样本意图识别; 隐式网络; 显式网络; 关系层; 选择门; zero-shot intent detection; implicit network; explicit network; relation layer; switch gate;
计算机
人工智能
论文
Website
Google Scholar
朱文武, 王鑫
中国科学: 信息科学, 2021, 51(11): 1802-1839
摘要 三元空间是由信息空间、物理世界、人类社会所构成,三元空间大数据由信息空间所产生的互联网数据、物理空间所产生的物联网数据和人类社会空间所产生的数据所构成.本文介绍了三元空间大数据的关联复杂性,并针对三元空间大数据关联复杂性这一本质困难,提出解决三元空间异构数据的关联表征这一关键科学问题.传统信息科学往往依据既有的先验信息进行特征表达,并在先验表征空间内分析信息语义及其关联关系.然而,在表征层面所引入的先验偏见,极大限制了信息理解和关联的广度和深度,使得蕴含于三元空间大数据之中的超出人类现有经验的知识难以被发掘.为解决上述难题,本文提出将三元空间数据关联关系通过拓扑图理论表征成网络或图以实现三元空间大数据的关联表征和融合分析.具体地,利用数据驱动的深层网络表征对三元空间异构数据的弱先验关联关系进行深度建模以保持原始数据间的异构关联关系,通过对非线性、非凸异构数据关联表达进行深度解离化计算以提升深层关联表征的鲁棒性与可解释性,借助拓扑图理论挖掘三元空间大数据中蕴含的异构关联关系以达到对三元空间异构关系的精准刻画.最后,本文从知识与数据双驱动、自适应,以及可推理三元空间大数据分析的角度对三元空间大数据关联表征的未来研究方向进行展望.
关键词 三元空间; 大数据; 关联表征; 深层表征; 网络表征; cyber-physical-human space; big data; correlational representation; deep representation; network representation;
计算机
人工智能
论文
Website
Google Scholar
尚荣华, 徐开明, 焦李成
中国科学: 信息科学, 2021, 51(10): 1640-1657
摘要 在传统的特征选择方法中,为了保证行的稀疏性,经常采用l_1范数或者l_(2,1)范数来约束评价矩阵.作为凸正则项,它们在多数情况下可以发挥良好的作用.然而在处理冗余性特征时,一些非凸正则项有望表现出更好的性能.借助自适应流形学习与非凸约束的优点,本文提出了一种新的算法,叫做基于自适应对偶图与非凸约束的嵌入特征选择(adaptive dual graphs and non-convex constraint based embedded feature selection, DNEFS).借助稀疏回归框架, DNEFS同时保留了数据空间与特征空间的流形结构信息.通过运用信息熵原理,对偶图中的局部流形信息可以自适应的学习与更新,因此可以获得更好的特征选择效果.不同于传统的凸约束,本文引入了一个新的非凸正则项,这一正则项由l_(2,1)范数与Frobenius范数的差分构成,并记为l_(2,1-2)范数.通过使用这一新正则项, DNEFS可以更好地处理冗余性的特征.本文运用交替迭代更新的方式来优化目标函数,并在6个基准数据集上测试DNEFS算法的性能.通过与6种对比算法做对比,实验结果表明提出的DNEFS优于对比算法的性能.
关键词 对偶图; 流形结构; 非凸约束; 嵌入; 特征选择; dual graphs; manifold structure; non-convex constraint; embedded; feature selection;
计算机
人工智能
论文
Website
Google Scholar
于晓, 刘慧, 吴彦, 张彩明
中国科学: 信息科学, 2021, 51(10): 1625-1639
摘要 大数据时代,针对高维数据的聚类分析已成为数据挖掘的热点和难点问题,与此同时,近年来数据获取方式的重大变革推动了多视角研究快速兴起.多视角子空间聚类能够针对高维数据进行聚类,已成为目前聚类研究的一个重要分支.然而,现有部分方法直接从原始数据学习相似度矩阵,极易受到数据中噪声的影响.因此,本文提出了一种基于本质自表示的多视角子空间聚类方法 (intrinsic self-representation for multi-view subspace clustering, ISMSC),从数据的潜在表示中学习相似度矩阵,并利用数据的自表达特性将所有视角的特征融合成本质表示.然后,本文使用交替方向乘子法(alternating direction method of multipliers, ADMM)设计了有效的求解策略对模型进行优化.最后,将ISMSC在人造数据集和8个真实基准数据集上的实验结果与9种基准方法进行了对比,结果表明了模型的鲁棒性和有效性.
关键词 多视; 聚类; 子空间; 谱聚类; 稀疏; multi-view; clustering; subspace; spectral clustering; sparse;
计算机
人工智能
论文
Website
Google Scholar
倪宣明, 沈鑫圆, 张海
中国科学: 信息科学, 2021, 51(10): 1609-1624
摘要 迁移学习利用不同但相关的源域标记数据来解决目标领域的学习问题,大多数减小域间分布差异的方法依赖于最大均值差异距离,但其仅仅能匹配域间数据分布的各阶矩.此外,隐私保护意识的增强限制了对数据源的访问,对迁移学习的发展提出了新的挑战.本文提出一种基于联合分布核适配的迁移学习及其隐私保护方法,直接在再生核希尔伯特空间中同时减小域间边缘分布和条件分布的差异,从而学习一个域不变核矩阵.此外,我们设置数据源双方首先访问一个相同的随机投影函数,然后聚合器发布基于目标扰动的差分隐私核分类器,在实现基于核的联合分布适配的同时,避免了数据源与聚合器直接共享原始特征数据.在多个文本和图像迁移学习基准数据集上进行了对比实验和参数分析,结果显示本文方法具有良好的有效性.
关键词 迁移学习; 隐私保护; 分布适配; 谱学习; 差分隐私; transfer learning; privacy protection; distribution adaptation; spectral learning; differential privacy;
计算机
人工智能
论文
Website
Google Scholar
程大伟, 牛志彬, 刘新海, 张丽清
中国科学: 信息科学, 2021, 51(7): 1068-1083
摘要 中小企业贷款在促进技术创新、推动经济发展、改善民生和增加就业等方面有着重要的作用.为了满足商业银行的贷款评估标准,很多中小企业选择互相提供担保以获得授信,形成了结构复杂的担保网络.当借款方的贷款违约时,风险则沿着担保方向在网络中层层传播,由此造成的潜在系统性风险给国家的金融安全和监管带来了严峻的挑战.因此,迫切需要发展相应的方法从系统角度对复杂金融担保网络中的传染路径进行风险评估和预测.本文提出了一种基于深度学习的风险评估模型,该方法应用图神经网络和注意力机制直接从网络化的贷款行为数据中学习风险特征,无需依赖于金融领域专业知识的人工特征工程.实验结果表明,本文设计的方法在多数评价指标上均优于现有的7个对比的基准模型.在传染路径风险评估任务中,比基准方法在精确率和召回率的调和平均数(F1-score)方面平均提升了2%~15%.在新路径风险评估任务中,比最好的基准方法平均提升了3.5%.结果表明了本文设计方法在传染路径风险评估中的有效性,可为监管部门和金融机构对担保网络进行系统性风险评估提供方法理论基础.
关键词 风险评估, 传染路径, 担保网络, 图神经网络, 注意力机制
计算机
人工智能
论文
Website
Google Scholar
申大忠, 张琦, 徐童, 祝恒书, 赵雯佳, 殷子凯, 周培伦, 房立华, 陈恩红, 熊辉
中国科学: 信息科学, 2021, 51(6): 912-926
摘要 在实时地震监测中,地震P波(primary wave)的初动拾取任务具有至关重要的作用,其有助于地震应急响应的及时实施.虽然此前在该领域已开展了大量的研究,但是如何从地震分布密集并且充满噪声的监测波形中有效地识别出P波仍然是一个具有挑战性的任务.例如对于大地震的余震监测,实践中使用的普遍方法仍依赖于专家辅助标注.本文针对地震实时监测任务,基于集成学习策略,提出一个全新的技术框架——EL-Picker,实现从连续地震波形中自主拾取P波的初动到时.具体而言,EL-Picker包含3个模块,即触发器、分类器和精化器.其中,分类器模块借鉴集成学习策略,实现对多个个体学习器的整合,提升整体模型性能.基于汶川Ms8.0地震的余震数据集进行的大量实验,我们发现EL-Picker不仅较好地实现P波初动拾取效果,并且多诊断出120%被人工遗漏的地震P波.同时,实验结果也启发我们探索如何针对不同的地震站台选取个性化的个体学习器构建分类器模块.此外,我们进一步地讨论了被人工遗漏的地震波形的规律特点,用于指导人工地震标注.这些发现清晰地验证了EL-Picker框架的鲁棒性、时效性、灵活性以及稳定性.
关键词 P波拾取, 机器学习, 集成学习, 汶川余震, 实时地震监测
计算机
人工智能
论文
Website
Google Scholar
冯霁, 蔡其志, 姜远
中国科学: 信息科学, 2021, 51(6): 900-911
摘要 联邦机器学习系统由于能够在多方之间训练联合模型而无需各方共享训练数据,因此在学术界和工业界都获得了越来越多的关注和应用.与传统的机器学习框架相比,这类系统被认为具有保护数据隐私的良好潜力.另一方面,训练阶段攻击是一种通过故意扰动训练数据,从而希望在测试时操纵相应的学习系统预测行为的攻击方法.例如, DeepConfuse是最近的一种高效生成对抗训练数据的方法,展示了传统监督学习范式在此类攻击下的脆弱性.在本文中,作者扩展了DeepConfuse方法,将其应用在联邦机器学习框架中.这是首次针对联邦学习系统的训练阶段攻击.实验结果表明,在δ–准确率损失的衡量标准下,相比于传统的机器学习框架,联邦学习系统在DeepConfuse攻击下更加脆弱.
关键词 联邦学习, 学件, 表示学习
计算机
人工智能
论文
Website
Google Scholar
刘翀, 杜军平, 周南
中国科学: 信息科学, 2021, 51(5): 779-794
摘要 社交网络蕴含着丰富的多媒体信息,如何实现社交网络跨媒体信息的搜索已成为研究热点.基于深度学习的单一模态语义特征提取和学习在社交网络信息搜索上取得了较好的效果.在跨模态信息搜索时不同模态的数据特征不能直接比较,因此不同模态之间的语义鸿沟是亟待解决的关键问题.针对上述问题,本文提出了一种基于对抗学习和语义相似度的跨媒体搜索方法,实现了文本和图像之间的相互匹配、排序和搜索.该方法使用对抗学习方法框架构建训练特征映射网络和模态判别网络,其中特征映射网络使用多维语义分布向量将不同模态的数据映射到同一语义空间中,使得相同语义下的不同模态数据在该空间距离小,不同语义下相同模态数据距离大.使用语义分布及相似度作为特征映射网训练依据,模态判别网络负责判定空间中不同数据的模态.基于对抗学习交替训练两个网络,使得特征映射网络得到的数据和原数据语义一致,并消除模态特性,最终在同一空间内使用相似度来排序并得到搜索结果.实验结果表明本文提出的方法在文本和图像的相互搜索的map值比同类方法高,并验证了该方法在社交网络安全话题数据上的有效性.
关键词 跨媒体搜索; 对抗学习; 语义相似度; 社交网络; 搜索排序; cross-media retrieval; adversarial learning; semantic similarity; social network; search and rank;
计算机
人工智能
论文
Website
Google Scholar
薄迎春, 张欣, 刘宝, 王平
中国科学: 信息科学, 2021, 51(5): 764-778
摘要 针对池计算网络的构建问题,提出了一种稀疏连接的异步神经元池构造方法,该方法将多个子神经元池顺序连接,并在子神经元池之间设置滞后环节,以实现各子神经元池对输入信息的异步处理,进而构成串行的记忆.为实现信息高效传输,子神经元池之间采用稀疏的连接方式.实验表明,所提方法能够有效地提高神经元池的记忆容量,易于解决长时依赖问题.此外,该结构能够使神经元池产生丰富的动力学行为,对初始参数也有较好的鲁棒性.
关键词 人工神经网络; 池计算; 记忆; 鲁棒性; 动力学; artificial neural network; reservoir computing; memory; robustness; dynamics;
计算机
人工智能
论文
Website
Google Scholar
谭宏卫, 周林勇, 王国栋, 张自力
中国科学: 信息科学, 2021, 51(4): 602-617
摘要 生成式对抗网络(generative adversarial networks, GANs)训练的不稳定性问题一直是GANs研究领域最具挑战性的问题之一.目前,仍未从理论上找到影响GANs训练稳定性的根本原因及有效的解决办法.本文通过理论分析发现, GANs训练的不稳定性主要是由于训练最优判别器与最小化生成器之间相互矛盾所致.经逐步分析得出,控制判别器的Lipschitz常数是解决GANs不稳定性问题的关键,进而提出一种有针对性的梯度惩罚技术来解决此问题.最后,本文从损失函数的振荡幅度(收敛性)、梯度总体变化趋势,以及网络整体性能3个方面进行了全面对比实验.结果显示,本文所提出的惩罚技术对处理GANs训练的不稳定性问题具有显著的效果.
关键词 生成式对抗网络; 不稳定性分析; 惩罚技术; 梯度范数; Lipschitz常数; generative adversarial networks; instability analysis; penalty technique; gradient norm; Lipschitz constant;
计算机
人工智能
论文
Website
Google Scholar
彭博, 卢晨贝, 赵岳虎, 苏宙行, 廖毅, 吕志鹏
中国科学: 信息科学, 2021, 51(4): 582-601
摘要 增量二分图优化问题(dynamic bipartite drawing problem, DBDP)是一个具有NP难度的组合优化问题,该问题在实际生产生活中有着广泛的应用.本文提出了一种新的动态规划驱动的局部搜索(DP-LS)算法来求解该问题.不同于文献中求解该问题和该类问题的所有启发式算法的邻域搜索方式(即每次邻域操作只对一个或两个节点进行插入或交换动作),本文提出的动态规划驱动的局部搜索算法能从邻域结构中挑选出并执行多个独立的邻域动作,大大提高了邻域搜索的效率. DP-LS算法从一个随机初始解出发,迭代地利用基于动态规划的局部搜索算法来寻找局部最优解,同时结合扰动机制跳出局部极值陷阱实现全局搜索.本文提出的增量评估方法能够快速评估基于插入和交换的邻域动作,可以大大提高算法的搜索效率.本文针对1120个公共算例进行了计算实验并同文献中已有算法(包括通用求解器Gurobi)进行对比,表明了所提出的动态规划驱动的局部搜索算法在解的优度和计算效率两方面的有效性.此外,通过对比实验表明了DP-LS算法中动态规划机制的有效性(提升近十倍的搜索效率).值得注意的是,本文提出的基于动态规划的局部搜索算法不仅能够用于求解DBDP问题,也能作为一种通用的启发式算法来求解其他组合优化问题,尤其是排序类优化问题.
关键词 增量二分图优化问题; 动态规划; 局部搜索; 增量评估机制; dynamic bipartite drawing problem; dynamic programming; local search; incremental evaluation technique;
计算机
人工智能
论文
Website
Google Scholar
胡迪, 聂飞平, 李学龙
中国科学: 信息科学, 2021, 51(2): 279-293
摘要 传统基于分类学习的监督哈希方法并不能完全满足哈希检索技术需求,但是线性判别分析却能够在一定程度上做到这一点.本文提出将线性判别分析作为深度网络的优化目标,以端到端训练的方式学习有效的哈希编码.但是,直接以上述目标训练神经网络就必须解决具有较高计算复杂度的特征值分解问题.在本文中,线性判别分析目标被转化为一个简单的最小均方问题,这种转化可以解决上述问题,同时可以利用成熟的优化方法优化网络.这种基于线性判别分析的深度网络拓展可以弥补传统判别分析在简单线性投影和特征学习上的劣势.本文在3个基准数据集上进行大量对比实验,相对于传统线性判别分析,本文所提方法在检索基准指标上有70%的提升,并超过大多数基于深度模型的哈希方法,这些实验结果证明了本文方法的有效性.
关键词 哈希技术; 线性判别分析; 最近邻检索; 深度网络; 量化技术; hashing technique; linear discriminant analysis; nearest-neighbor search; deep network; quantization technique;
计算机
人工智能
论文
Website
Google Scholar
李徵, 刘淇, 王喆锋, 郑毅, 林霞, 怀宝兴, 米兰, 陈恩红
中国科学: 信息科学, 2021, 51(1): 40-55
摘要 油气储集层识别是石油能源企业在勘测和开发业务中核心的任务之一.长期以来,油气行业一直依靠专家人工分析海量测井数据以对地下油气储集层进行定性分析,虽然专家解释结论有着很高的精准度,但是时间与经济成本都十分高昂.近些年来,随着以深度学习为代表的人工智能技术的迅速发展,智能油气储集层识别技术成为学术界和工业界共同关注的问题.然而,真实工业环境存在严重的传感数据不一致问题,给传统的监督学习模型带来巨大的挑战.本文针对传感器不一致情境中油气储集层识别任务展开研究,提出多尺度地质知识蒸馏网络的方法.首先,该方法提出一种多尺度特征自注意力融合机制来学习地质信息的多尺度动态表征.其次,该方法设计一种地质知识蒸馏学习模型,从非一致传感数据中学习额外的地质知识,进一步提升模型准确度.最后,在真实数据集上进行大量实验,结果充分证明本文提出的模型在油气储集层识别任务上的有效性和鲁棒性.
关键词 油气储集层识别; 地质知识; 蒸馏学习; 传感数据; 深度神经网络; oil and gas reservoirs detection; geological knowledge; distillation learning; sensor data; deep neural network;
计算机
人工智能
论文
Website
Google Scholar
王璐, 姜远
中国科学: 信息科学, 2021, 51(1): 27-39
摘要 本文研究K-近邻分类器的鲁棒性验证问题.形式化鲁棒性验证的目标是计算分类器在给定样本点上的最小对抗扰动的精确值或者最小对抗扰动的非平凡下界.我们将计算K-近邻分类器的最小对抗扰动形式化为一组二次规划问题.二次规划问题的数目随近邻参数K的增大呈指数级增长,精确求解该组二次规划问题往往不可行.约束放松法通过放松优化的约束项,可以在多项式时间内求解最小对抗扰动的下界.然而,本文通过理论分析和实验发现,当近邻参数K取值较大时,约束放松法求得的下界往往过于宽松,甚至会出现K越大下界越小的反直觉结果.为解决这一问题,本文提出使用随机平滑法对K-近邻分类器进行鲁棒性验证.随机平滑法利用了K-近邻分类器对高斯(Gauss)白噪声鲁棒的特点,获得了较为理想的鲁棒性验证效果.基准数据集上的实验结果表明,相比于最新的鲁棒神经网络,"随机平滑的" K-近邻分类器展现出了更好的验证鲁棒性.
关键词 监督学习; 对抗机器学习; 对抗鲁棒性; 鲁棒性验证; K-近邻分类器; supervised learning; adversarial machine learning; adversarial robustness; robustness verification; K-NN classifier;
计算机
人工智能
论文
Website
Google Scholar
张彪, 杨朋波, 桑基韬, 于剑
中国科学: 信息科学, 2021, 51(1): 13-26
摘要 近几年,深度模型在诸多任务中取得了巨大成功,但是深度模型需要大量的存储和计算资源实现精确决策,研究者为了将深度模型应用到资源受限的终端设备中,设计了模型压缩的优化策略来降低模型占存和计算量.本文基于剪枝压缩框架,从卷积核重要度评价的角度提出了两种模型剪枝算法.(1)由于每个卷积核都可以学习到其独有特征信息,因此本文提出了一种归因评价机制用于评价卷积核所学特征与因果特征的相关度,将模型中与因果特征相关度较低的卷积核进行裁剪,以实现模型压缩的目的,同时也能够保留原模型的归因特征,称此算法为归因剪枝.(2)第2种剪枝算法基于迭代优化剪枝框架,采用卷积通道和梯度中正相关特征评价相应卷积核重要度,以便于提高剪枝冗余卷积核的精准度,称为Taylor-guided剪枝算法.本文在VGGNet和ResNet两种网络架构上进行实验验证,结果表明:归因剪枝算法可以极大地保留原模型的归因特征;并且两种剪枝算法能够取得比当前主流剪枝算法更优异的压缩效果.
关键词 深度学习; 网络剪枝; 归因; 压缩; Taylor展开; deep learning; network pruning; attribution; compression; Taylor expansion;
计算机
人工智能
论文
Website
Google Scholar
赵鹏, 周志华
中国科学: 信息科学, 2021, 51(1): 1-12
摘要 在很多真实应用中,数据以流的形式不断被收集得到.由于数据收集环境往往发生动态变化,流数据的分布也会随时间不断变化.传统的机器学习技术依赖于数据独立同分布假设,因而在这类分布变化的流数据学习问题上难以奏效.本文提出一种基于决策树模型重用的算法进行分布变化的流数据学习.该算法是一种在线集成学习方法:算法将维护一个模型库,并通过决策树模型重用机制更新模型库.其核心思想是希望从历史数据中挖掘与当前学习相关的知识,从而抵御分布变化造成的影响.通过在合成数据集和真实数据集上进行实验,我们验证了本文提出方法的有效性.
关键词 机器学习; 分布变化; 流数据; 模型重用; 集成学习; 动态环境; machine learning; distribution change; data stream; model reuse; ensemble methods; dynamic environments;
计算机
人工智能
论文
Website
Google Scholar
郭斌, 仵允港, 王虹力, 王豪, 刘思聪, 刘佳琪, 於志文, 周兴社
中国科学: 信息科学, 2020, 50(11): 1629-1644
摘要 随着人工智能和物联网的快速发展与融合,智能物联网AIoT正成长为一个极具前景的新兴前沿领域,其中深度学习模型的终端运行是其主要特征之一.针对智能物联网应用场景动态多样,以及物联网终端(智能手机、可穿戴及其他嵌入式设备等)计算和存储资源受限等问题,深度学习模型环境自适应正成为一种新的模型演化方式.其旨在确保适当性能的条件下,能自适应地根据环境变化动态调整模型,从而降低资源消耗、提高运算效率.具体来说,它需要主动感知环境、任务性能需求和平台资源约束等动态需求,进而通过终端模型的自适应压缩、云边端模型分割、领域自适应等方法,实现深度学习模型对终端环境的动态自适应和持续演化.本文围绕深度学习模型自适应问题,从其概念、系统架构、研究挑战与关键技术等不同方面进行阐述和讨论,并介绍我们在这方面的研究实践.
关键词 智能物联; 环境自适应; 模型演化; 深度模型压缩; 云边端模型分割; 领域自适应; AIoT; context-aware adaptation; model evolution; deep learning model compression; edge-based model partition; domain adaptation;
计算机
人工智能
论文
Website
Google Scholar
石鑫盛, 李云
中国科学: 信息科学, 2020, 50(8): 1255-1266
摘要 公平性学习是机器学习领域的研究热点,预防歧视的目的在于执行预测任务之前消除不公平训练集对于分类器的影响.为了保证分类公平性和准确性,本文通过发现和消除原始数据集中的歧视样本寻找生成公平数据集的方法,即提出了一种基于分类间隔的加权方法用于处理二分类任务中的歧视现象,并在demographic parity和equalized odds公平性判定准则上实现分类公平.为了不影响分类准确性,本文基于最大间隔原理将样本投影之后选出目标集,对于目标集中的每个样本,通过加权距离度量方法判定该样本是否具有歧视性,并进行修正.通过在3个真实数据集上与已有方法进行实验对比,本文的方法能够获得更好的分类公平性和准确性,并且不局限于特定的公平性判定准则和分类器.
关键词 公平性学习; 分类间隔; 目标集; 加权距离度量; 歧视性; fairness learning; classification margin; target set; weighted distance metric; discriminatory;
计算机
人工智能
论文
Website
Google Scholar
李飞江, 钱宇华, 王婕婷, 梁吉业, 王文剑
中国科学: 信息科学, 2020, 50(8): 1239-1254
摘要 数据类型和分布的复杂化导致样本间关系的不确定性增强,给有效挖掘数据的潜在类簇结构带来挑战.为降低样本关系不确定性对数据聚类带来的影响,本文将聚类集成中样本稳定性概念扩展至聚类分析中.本文从理论上分析样本稳定的合理性,并提出基于信息熵的样本稳定性度量方法.此外,本文提出一个基于样本稳定性的聚类方法,该方法先将数据分为稳定样本集和不稳定样本集,然后挖掘稳定样本的团簇结构,并将不稳定样本划分至该团簇结构中.最后,本文通过二维人造数据和图像分割场景可视化显示样本稳定性的合理性,并在基准数据集上验证本文所提聚类算法的有效性.
关键词 机器学习; 无监督学习; 聚类分析; 样本稳定性; 稳定性理论; machine learning; unsupervised learning; clustering analysis; sample's stability; stability theory;
计算机
人工智能
论文
Website
Google Scholar
彭毫, 王雎, 王尧
中国科学: 信息科学, 2020, 50(8): 1217-1238
摘要 在多任务学习问题中,随机效应(random effects)可能同时存在于所有子任务中,而每个子任务又存在对应的稀疏效应(sparse effects).这在文本分析尤其在对电影评论的情感分析中,尤为常见.在本文中,我们提出一种用于数据中同时存在共享随机效应和特定稀疏效应的混合多任务学习模型,并命名为MSS (multi-task learning with shared random effects and specific sparse effects)模型.在模型的建立过程中,我们利用Bayes框架,针对不同效应的特点设定不同的先验分布和超参数.在模型的求解过程中,我们使用变分推断克服Bayes推断中的计算难题,使MSS模型在大规模数据分析中具备广泛的适应性.通过全面的模拟数据实验和真实数据实验的分析结果,我们展示了MSS模型在模型预测和变量选择方面同时具备随机效应模型(random effects models)和稀疏回归模型(sparse regression models)的优势,相比已有方法大幅提高泛化性能. MSS模型通过对多任务学习模型中不同效应的区分,能够更加有效的识别模型中的共享随机效应和特异稀疏效应,进而增强模型在模型预测和变量选择方面的性能.
关键词 多任务学习; 随机效应; 稀疏性; 变量选择; Bayes推断; multi-task learning; random effects; sparsity; variable selection; Bayesian inference;
计算机
人工智能
论文
Website
Google Scholar
韩忠明, 刘聃, 郑晨烨, 刘雯, 段大高, 董健
中国科学: 信息科学, 2020, 50(8): 1197-1216
摘要 网络节点表示学习是网络数据分析挖掘中的一个基础问题,通过学习网络节点表示向量,可以更加精准地对网络节点进行表征.近年来,随着深度学习的发展,嵌入方法在网络节点表示学习方面得到了广泛应用.同时,网络数据在规模、模态等特征方面也有了很大的变化,研究重点从单网络分析挖掘逐渐演变至耦合网络分析挖掘.本文首先分析了嵌入方法在单网络节点表示学习中的研究现状,对比了现有方法的优劣.然后借鉴单网络中嵌入方法的思想,针对耦合网络提出了耦合网络嵌入模型CWCNE.针对耦合网络的特性,改进了嵌入方法中的游走算法,提出了一种网络间带约束的随机游走策略;同时改进了模型的训练方法,使用网络间迭代训练的方式来学习模型参数.最后使用了社交耦合网络、学术耦合网络、影视耦合网络、诗词耦合网络、著作耦合网络等5组数据集验证了CWCNE的有效性.并在社团划分、实体识别、标签分类等任务上取得了良好的结果.
关键词 网络嵌入; 节点向量; 耦合网络; 表示学习; 社团划分; 主体识别; 标签分类; network embedding; vertex vector; coupling network; representation learning; community detection; entity recognition; label classification;
计算机
人工智能
论文
Website
Google Scholar
王铮, 翁泽佳, 王锐, 陈静静, 姜育刚
中国科学: 信息科学, 2020, 50(6): 877-891
摘要 片段视频语义识别旨在识别视频中短小片段的语义概念,是视频分析的一项重要任务.由于片段视频的数量巨大且缺乏可参考的网络标签,片段视频的标记十分困难,通常只能对部分片段视频进行标记.如何利用有限的语义标签提高片段视频语义识别的准确率是一项关键挑战.因此本文提出了一种基于长短时预测一致性的视频语义识别算法.该算法通过引入完整视频语义与片段视频语义一致性的约束,对片段视频语义识别结果进行筛选,以此提高片段视频语义识别的准确率.本文提出的算法在大规模视频数据集YouTube-8M的片段视频语义识别任务上达到了82.62%的平均均值准确率(mean average precision, MAP)识别精度,在第三届YouTube-8M比赛中排名第二.
关键词 大规模视频语义识别; 片段视频语义识别; 语义一致性; 特征聚合; 预测可靠性; large-scale video semantic recognition; segment-level semantic recognition; semantic consistency; feature aggregation; reliable prediction;
计算机
人工智能
论文
Website
Google Scholar
陈卓, 杜昊, 吴雨菲, 徐童, 陈恩红
中国科学: 信息科学, 2020, 50(6): 862-876
摘要 近年来,视频数据资源的日益丰富催生了一系列对于视频片段精细检索的需求.在这样的背景下,对于跨模态视频片段检索的研究逐渐兴起,其旨在根据输入的查询文本,输出一段视频中符合文本描述的片段.现有的研究工作主要关注于查询文本与视频片段的全局或局部的特征表达,而忽略了查询文本与视频片段中所蕴含的语义关系在跨模态检索中的匹配.例如,给定查询文本"一个人在打篮球"时,现有检索系统将根据整个查询文本和的视频的特征,或者关注于文本与视频中所表现的实体(如"人","篮球")来计算合适的视频片段,而缺乏对于"人打篮球"这类语义关系的考虑.因此,它们将难以辨别语义关系上的不同,从而限制了检索质量的提升.为了解决这个问题,本文提出跨模态关系对齐的图卷积框架CrossGraphAlign,通过分别构建文本关系图(textural relationship graph)与视觉关系图(visual relationship graph)来建模查询文本与视频片段中的语义关系,再通过跨模态对齐的图卷积网络来评估文本关系与视觉关系的相似度,从而帮助构建更加精准的视频片段检索系统.在公开的跨模态视频片段检索数据集TACoS和ActivityNet Captions上的实验结果表明,本文提出的方法可以有效地利用语义关系来提升跨模态视频片段检索的召回率.
关键词 关系对齐; 语言关系; 视觉关系; 图卷积网络; 跨模态视频片段检索; relationship alignment; textual relationship; visual relationship; graph convolutional network; cross-modal video moment retrieval;
计算机
人工智能
论文
Website
Google Scholar
刘庆霞, 程龚, 瞿裕忠
中国科学: 信息科学, 2020, 50(6): 845-861
摘要 随着万维网的发展,知识图谱数据大量增长,并在面向智能应用的研究中受到广泛关注.知识图谱用RDF (resource description framework)三元组描述实体相关的事实.在知识图谱中,关于一个实体的描述可能包含大量三元组,在一些需要直接呈现实体信息的应用中,为了避免用户信息过载,并适应有限的呈现空间,就需要进行实体摘要.实体摘要任务是从实体描述的众多三元组中选出最有代表性的子集作为摘要,以呈现给用户阅读.本文提出一种新的实体摘要方法 ESSTER以生成具备高可读性和低冗余性的实体摘要.该方法结合三元组的结构与文本特征,基于结构特性度量知识图谱中三元组的重要性,基于N元语法和文本语料度量三元组的可读性,基于逻辑推理、数值比较和文本相似判断三元组间的冗余关系.综合这3种技术要素,将实体摘要问题建模为组合优化问题进行求解.本文在两个由人工标注的公开数据集上与6种现有方法进行了对比实验,结果表明本文提出的方法效果达到了当前最佳水平.
关键词 知识图谱; 实体摘要; 冗余性; 可读性; 组合优化; knowledge graph; entity summarization; redundancy; readability; combinatorial optimization;
计算机
人工智能
论文
Website
Google Scholar
成红红, 钱宇华, 胡治国, 梁吉业
中国科学: 信息科学, 2020, 50(6): 824-844
摘要 识别海量变量间潜在的复杂关联关系,判断不同形式关联关系的强弱,是大数据关联关系挖掘的重要任务之一.然而,数据分布的不确定性、关联关系的多样性,使得基于分布假设的关联关系度量和基于数据驱动的非参数度量方法的适用性、准确性难以保证.因此,设计一种对关联关系形式无偏的有效关联度量方法变得至关重要.本文从大数据背景下潜在关联关系应被公平排序的需求出发,回顾了目前关联度量的公理化条件,给出了大数据关联关系度量可能需满足的性质;讨论了两类基于邻域视角的度量方法存在的不足;提出了本文基于k-NN粒的关联度量方法,称为最大邻域系数.人造数据集和真实数据集实验从不同角度验证了本文所提方法的有效性和优越性.最后指出了实验中发现的有趣现象和有待解决的理论问题,以引起对该领域更深入的思考和研究.
关键词 大数据; 复杂关联关系挖掘; 关联度量; 数据驱动; 粒计算; k-NN粒; big data; complex associations mining; association measure; data-driven; granular computing; k-NN granule;
计算机
人工智能
论文
Website
Google Scholar
李新春, 詹德川
中国科学: 信息科学, 2020, 50(6): 813-823
摘要 在基于深度网络的自然语言处理任务中,嵌入表示层用词向量刻画词的语义信息,可以有效地提升模型性能.词向量可以和当前任务一起端到端地进行学习,但是从模型参数数量的角度来看,词向量的训练很容易在小语料库上过拟合.为了解决这个问题,通常会使用在大语料库上预训练得到的词向量.首先,本文总结了几种常见的复用预训练词向量的方法.其次,由于当前任务的变化,会有一些新词出现,这些新词的词向量不能通过预训练的词向量获得,因此本文提出了一种保持语义关系的词向量复用算法(SrpWer). SrpWer首先对当前数据集中词语之间的关系进行建模,然后结合预训练的词向量生成新词对应的词向量.实验结果验证了SrpWer的有效性.
关键词 自然语言处理; 词向量; 模型复用; 新词; 深度学习; natural language processing; word embeddings; model reuse; new words; deep learning;
计算机
人工智能
论文
Website
Google Scholar
陈长建, 姜流, 雷娜, 刘世霞
中国科学: 信息科学, 2020, 50(6): 794-812
摘要 集成特征选择算法将多种特征选择方法结果结合在一起,旨在得到更加有效的特征子集.然而这些算法通常假设每种特征选择方法是平等的,没有考虑不同特征选择方法性能的差异性,导致少数方法选择出的有效特征被忽略.为解决这一问题,本文提出一种可以有效地结合不同特征选择方法优势,并利用专家的知识逐步改善所选特征的交互式特征选择方法.该方法包括一个基于众包学习的集成特征选择算法和一个基于该算法开发的可视分析系统.基于众包学习的集成特征选择算法利用众包学习模型对不同特征选择方法的性能进行建模,计算每种方法的可靠性,并在此基础上将这些方法的结果有机融合.可视分析系统提供了丰富的排序方式,帮助专家理解单个特征选择方法的特征选择结果和特征在分类任务中所起的作用,从而让专家交互迭代地改善现有特征子集.在4个真实世界数据集上的数值实验表明,相比于现有的集成特征选择算法,本文提出的算法能够带来0.63%~2.85%分类准确率的提升.此外,在文本和图像数据集上进行的两个案例分析表明,本文提出的可视分析系统能够进一步带来0.28%~5.24%的分类准确率提升.
关键词 集成特征选择; 众包学习; 可视分析; 交互式可视化; 排序可视化; ensemble feature selection; learning-from-crowds; visual analysis; interactive visualization; ranking visualization;
计算机
人工智能
论文
Website
Google Scholar
束俊, 孟德宇, 徐宗本
中国科学: 信息科学, 2020, 50(6): 781-793
摘要 自步学习是近年来机器学习领域提出的一种启发于人和动物"由易到难"学习过程的学习机制.尽管自步学习已取得可喜的理论与应用进展,但是当前的自步学习算法仍存在超参数选择的瓶颈问题.针对该问题当前主要采用一些启发式的手工设计方法或者交叉验证方法,然而此类方法效率很低,缺乏理论性指导,难以推广应用到广泛的实践问题中.针对这一挑战性问题,本文提出一种基于元学习机理的自步学习算法,该方法能使自步学习中涉及的超参数以数据驱动的方式自动习得,从而大大减弱了自步学习的这一核心问题.特别地,我们针对3种典型的自步学习实现格式,将所提元学习策略实质性嵌入,通过回归和分类实验验证了所提算法的准确性和泛化性,特别验证了相比于传统超参设置方法的显著优越性.
关键词 自步学习; 元学习; 样本加权; 噪声标记下学习; 超参数选择; self-paced learning; meta learning; sample re-weighting; learning with noisy labels; hyper-parameter tuning;
计算机
人工智能
论文
Website
Google Scholar
叶翰嘉, 詹德川
中国科学: 信息科学, 2020, 50(5): 662-674
摘要 机器学习依赖大量样本的统计信息进行模型的训练,从而能对未知样本进行精准的预测.搜集样本及标记需要耗费大量的资源,因而如何基于少量样本(few-shot learning)进行模型的训练至关重要.有效的模型先验(prior)能够降低模型训练对样本的需求.本文基于元学习(meta learning)框架,从相关的、类别不同的数据中学习模型先验,并将这种先验应用于新类别的少样本任务.与此同时,本文提出"模型组合先验"(MCP, model composition prior)方法,通过目标函数的最优条件对模型结构进行分解,并分别估计模型的各个组成部分,得到有效的分类器.这种分解方式具有较高的可解释性,能够指导在不同小样本任务中"共享"与"独立"的成分,从而指导元学习的具体实现.在人造数据中,本文方法能够恢复出小样本任务之间的关联性;在图像数据上, MCP方法能取得比当前主流方法更优异的效果.
关键词 小样本学习; 元学习; 模型先验; 模型分解; few-shot learning; meta-learning; model prior; model composition;
计算机
人工智能
论文
Website
Google Scholar
张俪文, 王涛, 罗坚, 杨树森, 徐宗本
中国科学: 信息科学, 2019, 49(12): 1572-1585
摘要 聚类是数据挖掘和机器学习中的基本任务之一.传统聚类方法由于其设计中对簇结构假设的限制,导致算法在不符合其假设的数据集上,尤其是大型高维数据集上的聚类效果较差.本文引入了最大平均熵率的概念,设计了一种基于图的关联聚类算法.该算法将关联聚类问题分解为多个独立的单类优化问题,并利用邻域消除了关联聚类对大数据的限制.算法实现通过启发式邻域搜索和类生成简化了对最优邻域和关联聚类的求解过程,并且设计了适应分布式计算平台的图迭代方法.与其他聚类算法相比,该算法在提高计算效率的同时,对簇结构假设相对灵活,可适用于多种分布数据.在聚类实验中,算法的f1-measure和purity指数均好于其他6种聚类算法,而且对于高维大数据集,算法的运行时间远远低于其他聚类算法.
关键词 聚类; 相关聚类; 熵率; 图聚类; 大数据; clustering; correlation clustering; entropy-rate; graph-based clustering; big data;
计算机
人工智能
论文
Website
Google Scholar
聂秀山, 林培光, 杨明哲, 尹义龙
中国科学: 信息科学, 2018, 48(12): 1697-1708
摘要 近年来,由于互联网上视频数量的爆炸式增长,基于视频哈希(Hash)的近似重复视频检索已经吸引了越来越多的研究者关注.在现有方法中,视频的视觉特征,包括单一特征以及多特征融合的方法被广泛应用于近似重复视频检索算法中.而低层视觉特征在表达高层语义方面存在不足,使得近似重复视频检索的性能变低.针对这一问题,本文提出了一种基于层次特征融合的视频哈希方法,用于近似重复视频检索.该方法首先从视频中提取低层人工定义特征,然后利用卷积神经网络提取中间层深度特征以及高层语义特征,最后把不同层级的特征融合起来,利用层次特征和样本之间的全局结构关系以及各特征之间的互补性,学习得到视频哈希,进而进行近似重复视频检索.该方法在CC-WEB-VIDEO数据库上进行了实验,实验结果证明本文方法与现有的方法相比在性能上有较大提升.
关键词 近似重复视频检索; 视频哈希; 层次特征; 特征融合; 监督学习; near-duplicate video retrieval; video hashing; hierarchical feature; feature fusion; supervised learning;
计算机
人工智能
论文
Website
Google Scholar
徐丹丹, 陈松灿
中国科学: 信息科学, 2018, 48(12): 1681-1696
摘要 电子邮件是一种必不可少的通讯工具,但是众多的垃圾邮件会严重影响用户的工作和生活,甚至还会造成财产损失.由于兴趣、爱好的不同,用户对垃圾邮件的定义可能存在巨大差异,因此实现个性化垃圾邮件过滤成为目前邮件过滤领域研究的重要课题.当出现邮件错滤情况,用户不得不手动修改,这给用户体验带来了极大不便.为了有效解决上述问题,并实现个性化邮件过滤及错滤邮件自动修改等功能,本文结合规则和统计方法提出了一种基于客户端的个性化邮件再过滤系统.大部分现有的垃圾邮件过滤器仅对邮件数据流进行在线过滤,而未考虑不同邮箱的邮件类先验存在差异和类不平衡问题,本过滤系统首先对进入收件箱和垃圾箱的邮件进行分别处理,然后基于多任务学习原理设计了两个互学习的过滤器分别用于收件箱和垃圾箱的邮件再过滤,并对错滤邮件进行自动修改.同时,为保证在随时间变化的用户兴趣点和邮件数据分布情况下过滤器的性能,设计了结合重要性加权的多窗口学习框架,从而有效实现了过滤器的动态自适应.最后,在TREC 2006c和2007p数据集上验证了我们所提出的过滤器拥有显著的过滤效果.
关键词 垃圾邮件过滤; 个性化邮件再过滤; 自动修正; 重要性加权; 多任务学习; 多窗口学习框架; spam filtering; personalized mail re-filtering; automatic correction; importance weights; multi-task learning; multi-window learning framework;
计算机
人工智能
论文
Website
Google Scholar
朱越, 姜远, 周志华
中国科学: 信息科学, 2018, 48(12): 1670-1680
摘要 多标记学习是一种应用非常广泛的学习范式,其中,一个对象可能同时与多个标记相关联.传统的多标记学习研究多假设训练数据中观察到的标记分布与测试数据的真实标记分布一致.但在实际应用中,训练数据中可能存在一些从未被标注出的新标记.在预测时,不仅希望能够在目标标记集合(已知标记)上取得好的性能,还要求能够检测出样本是否存在新标记.针对这种多标记新标记学习问题,本文提出了一种端到端的多视图多示例多标记学习方法 EM3NL.该方法基于卷积神经网络产生多示例包,并通过最小化包上观察标记的错分损失和对新标记预测值排序损失的惩罚以及对多视图预测不一致的惩罚同时学习图像,文本两个视图的特征表示以及已知标记和新标记的预测函数.在大规模图片–文本真实数据集上验证了EM3NL在已知标记学习和新标记检测任务上的有效性.
关键词 多标记新标记学习; 多示例多标记学习; 多视图学习; 深度学习; multi-label learning with new labels; multi-instance multi-label learning; multi-view learning; deep learning;
计算机
人工智能
论文
Website
Google Scholar
张道强, 朱旗, 郝小可, 邵伟, 王明亮, 黄嘉爽, 黄硕
中国科学: 信息科学, 2018, 48(5): 589-602
摘要 近年来,"脑科学计划"吸引了各国政府和公众的广泛关注.脑影像技术是研究脑科学的重要工具之一,然而由于脑影像数据所固有的高维度、多模态、异构和时变等特性,对其进行快速有效分析是当前研究的热点之一.在本文中,首先简要介绍脑影像分析的基本方法,接着回顾作者及其团队近几年在多模态影像数据融合、脑网络构建及其分析、脑影像基因关联分析、脑影像校准等方面的工作,并重点介绍在脑疾病早期诊断以及脑解码领域的应用.
关键词 脑科学计划; 脑影像; 脑疾病诊断; 脑解码; 多模态; brain research project; brain image; brain disease diagnose; brain decoding; multi-modality;
计算机
人工智能
论文
Website
Google Scholar
熊德意, 李军辉, 王星, 张飚
中国科学: 信息科学, 2018, 48(5): 574-588
摘要 神经机器翻译是近几年出现并快速发展的一种深度学习驱动的新型机器翻译模式,目前已成为机器翻译学术和工业界广为接受的主流技术.本文总结了我们在神经机器翻译方面的工作,特别是在各种信息和知识约束条件下提出的一系列神经机器翻译模型和方法,具体包括隐变量约束的变分神经机器翻译模型、单词与短语级统计机器翻译译文推荐与约束模型、源端句法结构约束模型.除此之外,本文也对神经机器翻译未来发展进行了初步思考和展望.
关键词 神经机器翻译; 变分神经机器翻译; 神经机器翻译与统计机器翻译融合; 句法约束的神经机器翻译; neural machine translation; variational neural machine translation; fusion of neural and statistical machine translation; neural machine translation with syntactical constraints;
计算机
人工智能
论文
Website
Google Scholar
张檬, 刘洋, 孙茂松
中国科学: 信息科学, 2018, 48(5): 564-573
摘要 在进行跨语言自然语言处理时,缺少双语资源是非常棘手的问题,而这在语言资源匮乏的场景下是非常普遍的.此时,利用好非平行语料中蕴含的翻译知识变得更为重要.由于语料不平行,从中获取翻译知识意味着小数据、无监督学习,因此极具挑战,而取得的结果通常是双语词典的形式.这既是人工智能领域重要的学术问题,也在语言资源匮乏场景有着巨大的应用价值.本文针对前人研究中存在的问题,介绍一系列工作,从各个角度探索如何更好地利用非平行语料构建双语词典.
关键词 双语词典构建; 非平行语料; 双语词向量; 跨语言自然语言处理; 人工智能; bilingual lexicon induction; non-parallel corpora; bilingual word embeddings; cross-lingual natural language processing; artificial intelligence;
计算机
人工智能
论文
Website
Google Scholar
郑伟诗, 吴岸聪
中国科学: 信息科学, 2018, 48(5): 545-563
摘要 行人重识别是实现跨摄像机场景大范围追踪行人的关键技术,利用该技术可以把行人的碎片化多场景轨迹连接起来.本文首先回顾了行人重识别的发展,列举了目前行人重识别研究的主要难点和挑战.然后进一步介绍了作者所在研究团队针对行人重识别发展的非对称度量学习理论,及基于非对称度量理论和思想所开展的面向开放性行人重识别的非对称行人重识别建模.与现有用于行人重识别的度量学习算法相比,现有算法通常忽略了摄像机特征变化的特性,而非对称度量的优点是可以学习具备建模不同视域特点非一致性能力的特征变换.非对称建模除了应用在一般的行人重识别问题上,还可以应用在跨模态行人重识别、低分辨率行人重识别、基于属性与图像匹配的行人重识别、无监督行人重识别和不完整行人重识别等问题上.最后,本文讨论了行人重识别未来的发展.
关键词 视频监控; 行人重识别; 行人跨视域追踪; 度量学习; 非对称; visual surveillance; person re-identification; cross-view person tracking; distance metric learning; asymmetric modelling;
计算机
人工智能
论文
Website
Google Scholar
白翔, 杨明锟, 石葆光, 廖明辉
中国科学: 信息科学, 2018, 48(5): 531-544
摘要 场景文字检测与识别是一种通用文字识别技术,已成为近年来计算机视觉与文档分析领域的热点研究方向.其被广泛应用于地理定位、车牌识别、无人驾驶等领域.相对于传统的文档文字检测和识别,场景文字在字体、尺度、排布、背景等方面变化更加剧烈,深度学习技术也由于卓越的性能成为该领域的主流方法.本文主要回顾了作者基于深度学习在此领域取得的代表性成果,并对此领域未来研究趋势进行了展望.
关键词 深度学习; 场景文字; 文字检测; 文字识别; 计算机视觉; deep learning; scene text; text detection; text recognition; computer vision;
计算机
人工智能
论文
Website
Google Scholar
耿新, 徐宁
中国科学: 信息科学, 2018, 48(5): 521-530
摘要 本文主要介绍了标记分布学习和标记增强的相关概念及算法.标记分布学习是一种新型机器学习范式,传统的单标记和多标记学习都可以看做是该范式的特例.标记分布学习将不同标记对示例的重要程度用标记分布来显式刻画,已经在多个应用领域中取得很好的效果.然而,现有的多数数据集中却仅具有简单的逻辑标记而非完整的标记分布,因此无法直接应用标记分布学习.为解决这一问题,可以通过挖掘训练集中蕴含的标记重要性信息,恢复出每个示例的标记分布.我们将原始逻辑标记提升为标记分布的过程定义为标记增强.本文给出了标记分布学习和标记增强的形式化定义,介绍了典型标记分布学习和标记增强算法,并对这些算法进行了分析讨论.
关键词 标记分布; 标记分布学习; 标记增强; 多标记学习; 标记多义性; label distribution; label distribution learning; label enhancement; multi-label learning; learning with ambiguity;
计算机
人工智能
论文
Website
Google Scholar
钱光武, 张蕾, 王炎
中国科学: 信息科学, 2018, 48(5): 511-520
摘要 近年来,深度神经网络,亦被称为深度学习,在机器学习方法主导的各个领域都取得了重大的突破.虽然经过训练的深度神经网络具有卓越的性能,但是整个训练过程却十分耗时,即使借助高性能计算设备,也需要数日甚至数周的训练时间.概念器作为回音状态网络的延续和发展,可以理解为描述神经动态活动模式的过滤器,是一个强大的时序数据处理工具.为了解决上述问题,基于对原始概念器模型的改进,本文在深度神经网络的非迭代方法和迁移学习两个方面分别做了一些工作.具体来说,(1)提出了针对非时序数据的概念器分类器,并在此基础上提出了一种非迭代方法前馈卷积概念器神经网络,通过在MNIST变集数据集上的实验测试了前馈卷积概念器神经网络的分类性能,不仅达到了同类方法的最高水平,而且极大地降低了训练时间;(2)提出了一种基于概念器的快速概念器分类器,在数据集Caltech-101和Caltech-256上,测试了快速概念器分类器结合预训练且不再微调的深度神经网络的表现,不仅在性能上超越了同类方法的最高水平,而且训练时间平均减少到原有的1/60.
关键词 概念器; 图像分类; 深度神经网络; 迁移学习; 非迭代方法; conceptor; image classification; deep neural networks; transfer learning; non-iterative methods;
计算机
人工智能
论文
Website
Google Scholar
庞明, 周志华
中国科学: 信息科学, 2018, 48(2): 177-186
摘要 推荐系统在我们的生活中被广泛应用,对人们的生活起着越来越重要的影响.然而,协同过滤作为一种常见的推荐技术,很容易受到伪造虚假用户评分信息的恶意攻击的影响.为了保证推荐的质量,很多恶意攻击检测的方法被提出用于检测恶意攻击.现有的攻击检测方法大多是针对有组织大规模攻击的检测,即攻击者根据同一种策略,伪造大量的虚假用户评分信息用于提升或贬低一个目标物品.本文研究了一种不同的攻击类型:无组织恶意攻击,即攻击者们在没有组织的情况下,分别伪造少量的虚假用户评分信息来提升或贬低同一个目标物品.无组织恶意攻击出现在很多真实的应用中,对推荐系统的鲁棒性造成严重影响,而针对该攻击类型的研究还很初步.实验结果表明现有攻击检测方法不能够有效地检测无组织恶意攻击.本文分析了现有的多种攻击检测方法无效的原因,进而通过分析无组织恶意攻击的特性,总结出无组织恶意攻击检测的关键.
关键词 攻击检测; 推荐系统; 协同过滤; 无组织恶意攻击; 鲁棒性; attack detection; recommender systems; collaborative filtering; unorganized malicious attacks; robustness;
计算机
生物信息
论文
Website
Google Scholar
陈希, 王峻, 余国先, 崔立真, 郭茂祖
中国科学: 信息科学, 2023, 53(2): 250-265
摘要 从大规模生物组学数据中准确识别导致癌症发生的协同驱动模块是生物信息学研究领域重大课题之一.现有研究方法通常只基于批量组学数据进行识别,忽视了细胞水平上的癌症异质性,易受噪声影响.针对上述问题,本文提出了一种基于单细胞数据和先验知识指导的协同驱动模块识别方法CDMFinder.该方法首先利用基因在不同亚型及正常细胞表达数据间存在的特异性共表达信息,融合基因交互网络,优化形成分子功能关联网络,在深入挖掘基因间功能关联的同时有效降低网络复杂度;再基于重叠马尔可夫(Markov)聚类从该网络中挖掘功能簇,并提出基于融合权重和贪心策略的驱动模块识别方法,从功能簇中获得驱动模块集合;最后,融合功能交互网络与突变共现定义模块距离函数,识别获取协同驱动模块. CDMFinder充分融合评估了表达、突变、差异分析等多种因素,展现了优良的识别性能.在乳腺癌和胶质母细胞瘤多组学数据上的实验结果表明,本文方法能够识别出超过对比方法 1.35倍的驱动基因,识别到的协同驱动模块在功能/通路水平富集度上超过现有算法1.5倍.
关键词 单细胞数据; 协同驱动模块; 分子功能关联网络; 马尔可夫聚类; 多组学数据融合; single-cell data; cooperative driver module; molecular functional association network; Markov clustering; multi-omics data fusion;
计算机
生物信息
论文
Website
Google Scholar
蒋明峰, 支明豪, 李杨, 李铁强, 张鞠成
中国科学: 信息科学, 2021, 51(6): 959-970
摘要 高分辨率的磁共振图像可以提供细粒度的解剖信息,但是获取数据需要较长的扫描时间.本文提出了一种基于自注意力机制生成对抗网络的超分辨率磁共振图像重构方法 (SA-SR-GAN),利用生成对抗网络从低分辨率磁共振图像生成高分辨率磁共振图像,将自注意力机制集成到超分辨率生成对抗网络框架中,用于计算输入特征的权重参数,同时引入了谱归一化处理,使判别器网络训练过程更加稳定.本文使用40组3D磁共振图像(每组图像包含256个切片)训练网络,并用10组图像进行测试.实验结果表明,所提出的超分辨率自注意力生成对抗网络方法生成的超分辨率的磁共振图像的PSNR和SSIM值高于同类比较方法.
关键词 磁共振图像, 超分辨率, 生成对抗网络, 自注意力, 谱归一化
计算机
生物信息
论文
Website
Google Scholar
梁振虎, 任娜, 王勇, 李佳妮, 白洋, 李小俚, 何江弘
中国科学: 信息科学, 2021, 51(6): 940-958
摘要 脊髓电刺激作为一种有效的意识促醒手段已经在临床上得到了较为广泛的应用,但是其内在机制仍不完全明确.本文将正常人静息态脑电作为对照组,利用样本熵对微意识状态患者的脊髓电刺激前后的脑电信号进行计算,并分析了基于互样本熵构造的脑网络在刺激前后的变化.结果表明,脊髓电刺激提高了微意识状态患者额叶和中央区内的脑电信号复杂度;还提高了患者在额叶内、中央区内以及额叶与其他脑区间的高频段(α~γ, 8~45 Hz)的耦合模式复杂度,表明通道间信息交互作用的显著增强;同时,患者高频段脑网络平均聚类系数增加,平均特征路径长度减少,小世界特性显著提升(在α,β,和γ均为p <0.001).相对于健康对照组,这些指标变化的方向趋向于正常人静息态的脑功能.样本熵和互样本熵在脊髓电刺激后与健康对照组在某些脑区内或脑区间上无显著差异(比如,β和γ频段的样本熵值在额叶和中央区(p> 0.05)),但是高频段的脑网络参数仍有显著差异(比如,高频段小世界网络特征p <0.001).因此,我们认为这些变化是脊髓电刺激对大脑产生了一个"短时程效应".我们推测脊髓电刺激对脑功能的重塑有一定的促进作用.本研究对脊髓电刺激的内在机理提供了新的解释,同时也为微意识状态患者的脑功能评估提供了新的思路.
关键词 微意识状态, 脑电, 脊髓电刺激, 互样本熵, 脑网络
计算机
生物信息
论文
Website
Google Scholar
雷秀娟, 张文祥, 刘恋
中国科学: 信息科学, 2021, 51(6): 927-939
摘要 环状RNA (circluar RNA, circRNA)在基因表达、剪切和转录的过程中扮演着重要角色.越来越多的证据表明, circRNA与疾病的产生与发展存在着重要的联系.本文提出了一种基于多数据融合的非负矩阵分解算法(EDNMF)预测circRNA–疾病关联关系.该方法首先对circRNA–疾病关联关系进行预处理,解决了circRNA–疾病关联关系过少对算法产生的负面影响的问题.然后, EDNMF算法将circRNA表达谱和癌症相似性数据转化为约束条件,基于预处理后的circRNA–疾病关联关系采用改进的非负矩阵分解算法得到最终的打分值,从而预测circRNA–疾病关联关系.五折和十折交叉验证结果表明, EDNMF算法相比其他算法能更有效地预测circRNA–疾病关联关系.此外,采用EDNMF算法预测新的circRNA–结肠直肠癌关联关系打分排名前10的结果中,大部分结果已经得到了佐证,表明了该算法可以有效地预测未知的circRNA–疾病关联关系.
关键词 circRNA, circRNA 表达谱, circRNA-疾病关联关系, 非负矩阵分解, 疾病相似性
计算机
生物信息
论文
Website
Google Scholar
鱼亮, 赵晋
中国科学: 信息科学, 2019, 49(9): 1175-1185
摘要 复杂疾病的致病机理一直是人类健康领域面临的重大难题之一,通过传统的方法进行新药开发,需要大量的时间与金钱,已经满足不了人们的需求.近几年来寻找已知药物新的治疗效果,即药物重定位,已经成为治疗更多疾病的一个有效途径.目前组织特异性的研究已经取得一些成果,但是传统的药物重定位方法很少考虑疾病的组织特异性.本文提出基于组织特异性和直接邻居相似度方法预测药物的新适应症,同时深入探讨考虑疾病的组织特异性对药物重定位研究的影响.首先研究组织特异性的发展及其特点,并提出基于组织特异性数据,应用直接邻居的相似度进行药物重定位研究.从数据库DrugBank中提取11405条已知药物–靶标关系,并从人类孟德尔遗传数据库中获得5种癌症(乳腺癌、结肠癌、肝癌、肺癌、卵巢癌)及其致病基因数据,利用5种癌症对应的组织特异性相互作用网络作为背景网络,基于直接邻居距离度量方法构建25个组织特异性药物–疾病二部网络,实验结果通过CTD (comparative toxicogenomics database)标准数据库进行验证.结果表明,基于组织特异性和直接邻居相似度度量标准会提高药物重定位研究的准确性,为新药的体内和体外实验提供可靠候选集,这也为药物重定位的研究提供了新的思路.
关键词 药物重定位; 组织特异性; 药物靶标; 致病基因; 直接邻居度量; drug repositioning; tissue specificity; drug targets; disease genes; direct neighborhood measurement;
计算机
生物信息
论文
Website
Google Scholar
赵颖闻, 王峻, 郭茂祖, 张自力, 余国先
中国科学: 信息科学, 2019, 49(9): 1159-1174
摘要 准确地标注蛋白质功能是功能基因组学的核心任务之一.蛋白质功能标注信息存在大量缺失且功能标签空间巨大.近期一些标签压缩方法被提出并应用于蛋白质功能预测,但是这些方法获取的压缩标签可解释性差,且面临着多标记学习中的阈值划分难题.为解决这些问题,本文提出一种基于0-1矩阵分解的蛋白质功能预测方法 (zero-one matrix factorization, ZOMF). ZOMF首先将蛋白质–功能标签关联矩阵分解成两个低秩0-1矩阵,挖掘蛋白质和功能标签间的内在关联.其次它利用蛋白质互作网和基因本体结构信息分别针对上述两个低秩矩阵定义了平滑正则项,约束指导低秩矩阵的优化.最后它利用优化获取的低秩矩阵重构关联矩阵,进而实现蛋白质功能预测.通过在酵母菌、拟南芥、老鼠和人类数据集上的实验表明, ZOMF比已有的相关算法能够更准确地预测蛋白质功能,它无需对重构的关联矩阵进行阈值划分,压缩的0-1标签可解释性更直观.
关键词 蛋白质功能预测; 矩阵分解; 蛋白质互作网; 基因本体; 阈值划分; protein function prediction; matrix factorization; protein-protein interaction network; gene ontology; thresholding segmentation;
计算机
生物信息
论文
Website
Google Scholar
余景景, 李启越, 贺小伟
中国科学: 信息科学, 2019, 49(6): 726-738
摘要 生物发光断层成像(bioluminescence tomography, BLT)是一种高灵敏非侵入式光学分子成像模态,但近红外光在生物组织中传输的复杂性及表面测量信息的有限性,对BLT光源重建算法提出了较高要求.本文提出了一种基于通用迭代收缩阈值(general iterative shrinkage and threshold,GIST)的BLT重建算法,采用非凸平滑剪切绝对偏差(smoothly clipped absolute deviation, SCAD)惩罚项,并通过迭代求解对非凸惩罚项有解析解的邻近算子问题来获得优化结果.此外,重建中也结合了多光谱测量和收缩可行域策略以降低逆问题的不适定性.为评估该算法的光源定位及多光源辨识能力,本文设计了多组仿真和物理仿体实验,并将GIST与几个典型稀疏重建算法进行了对比.实验结果表明GIST算法在不同光源深度和间隔距离的实验中在中心定位误差方面有较大优势.
关键词 多光谱生物发光断层成像; 通用迭代收缩阈值算法; 稀疏重建; 逆问题; 平滑剪切绝对偏差; multispectral bioluminescence tomography; general iterative shrinkage and threshold algorithm; sparse reconstruction; inverse problem; smoothly clipped absolute deviation;
计算机
图形图像
论文
Website
Google Scholar
王熠旭, 李杰, 刘弘, 王言, 徐明亮, 吴永坚, 纪荣嵘
中国科学: 信息科学, 2023, 53(5): 931-945
摘要 模型窃取攻击旨在获得一个和目标受害模型功能相似的替代模型.现有的方法主要采用数据生成或数据选择方法和交叉熵损失函数去获得一个较好的攻击效果.据此,本文着重研究了攻击过程中这两个极为重要的模块:数据采样和损失函数.同时,本文提出了一个新颖的模型窃取攻击方法S&W,其包含了一种新的采样策略和一个精心设计的加权损失函数.首先,新的采样策略更加关注于从受害者模型中获得更多信息的重要样本.与此同时,本文通过引入k-Center算法达到选择样本的多样性的目的.其次,受到经典Focal损失函数的启发,本文设计了一种新的加权损失函数.该损失函数主要关注于受害者模型和替代模型对于相同输入所给出的输出之间的差异,从而促使替代模型模拟受害者模型.在4个常用的数据集上,我们通过实验证明了本文提出的方法的有效性.相比于之前最好的方法,本文方法最高有5.03%的性能提升.
关键词 计算机视觉; 模型窃取攻击; 对抗攻击; 主动学习; 知识蒸馏; computer vision; model stealing attack; adversarial attack; active learning; knowledge distillation;
计算机
图形图像
论文
Website
Google Scholar
叶学义, 曾懋胜, 孙伟杰, 王凌宇, 赵知劲
中国科学: 信息科学, 2023, 53(4): 682-698
摘要 近年来生成对抗网络(generative adversarial network, GAN)已经展示了它在图像修复任务中修复大面积缺失区域并生成合理语义结果的潜力,但现有方法经常忽略缺失区域的语义一致性和特征连续性,并对不同尺度特征的感知能力不足,因此提出一种基于多尺度稳定场GAN的图像修复模型.该模型的生成单元汲取了U-Net的特点,将稳定场算子嵌入到跳跃连接中以填充编码器特征图中的缺失区域,保持了缺失区域的语义一致性和特征连续性;然后通过多尺度融合计算逐步加强经稳定场算子填充缺失区域的特征图的传递,使得跳跃连接传递的信息不再来自单一的特征图,让模型能够感知高层特征的语义信息.在人脸和自然场景等数据集上的实验结果表明,该模型优于其他的经典图像修复方法.
关键词 图像修复; 生成对抗网络(GAN); 稳定场; 多尺度融合; 深度学习; image inpainting; generative adversarial network(GAN); stable field; multi-scale fusion; deep learning;
计算机
图形图像
论文
Website
Google Scholar
王龙光, 郭裕兰, 林再平, 王应谦, 安玮
中国科学: 信息科学, 2023, 53(3): 500-516
摘要 高光谱图像超分辨率重建旨在融合高分辨率多光谱图像与低分辨率高光谱图像以得到高分辨率高光谱图像.如何实现二者中空域信息和谱域信息的有效融合是高光谱图像超分辨率重建的关键.受高光谱图像的端元表示模型启发,本文在神经网络中显式地对端元进行建模,并利用其作为纽带实现空域信息和谱域信息的融合.具体来说,本文提出了一个基于Transformer的高光谱图像超分辨率重建网络,利用Transformer结构从低分辨率高光谱图像提取端元信息,并将端元信息融合到高分辨率多光谱图像中,进而完成高分辨率高光谱图像的重建.实验结果表明, Transformer结构的全局感受野增强了网络的长程建模能力,提高了端元提取精度,进而提升了超分辨率重建性能.与已有方法相比,本文所提方法在室内/遥感高光谱数据集上均取得了更优的性能.
关键词 高光谱图像; 图像超分辨率重建; 图像融合; Transformer网络; 端元特征; hyperspectral image; image super-resolution; image fusion; transformer network; endmember feature;
计算机
图形图像
论文
Website
Google Scholar
龚申健, 张姗姗, 郭煜, 杨健, 陶冶
中国科学: 信息科学, 2023, 53(3): 485-499
摘要 行人是城市交通场景下的弱势群体,为了避免碰撞,有必要准确地预测他们的动作行为.为此,本文首次提出城市交通场景中行人动作识别这一问题并提出了有针对性的解决方案.首先,我们创建了一个新的行人动作识别数据集(PARD)作为实验的数据基础,并给出了一个有效的基准模型MFVGG,该模型能够以较低的计算成本达到与之前先进人体动作识别方法相当的性能.为了更针对性地解决问题,本文在两个方面对基准模型进行了改进.首先,利用姿态先验来丰富特征表示,构造双流网络融合双分支编码特征.其次,本文引入双流神经架构搜索得到对于这项任务的最优层级网络架构.实验表明,提出的方法的性能超过了一般人体动作识别相关的先进算法.数据集以及代码公布在https://github.com/Yankeegsj/PARD.
关键词 深度学习; 计算机视觉; 动作识别; 网络架构搜索; 姿态估计; deep learning; computer vision; action recognition; neural architecture search; pose estimation;
计算机
图形图像
论文
Website
Google Scholar
高瑞均, 郭青, 余洪凯, 冯伟
中国科学: 信息科学, 2023, 53(2): 309-324
摘要 对抗性攻击是研究深度神经网络脆弱性的前沿技术.然而现有工作大多关注基于加性噪声扰动的攻击,无法代表现实世界中的扰动因素,阻碍了对抗性攻击的实际应用.雾作为现实世界中广泛存在的自然现象,对图像造成显著影响,不可避免地对深度模型构成潜在威胁.本文首次尝试从对抗性攻击的角度研究雾对深度神经网络的影响,并提出两种基于雾扰动的对抗性攻击方法:基于优化的雾扰动对抗性攻击OAdvHaze,在深度神经网络的指引下优化大气散射模型参数,以合成有雾图像,该方法具有较高的攻击成功率.预测式雾扰动对抗性攻击PAdvHaze,采用深度神经网络直接预测雾合成参数,提高了对抗性攻击的速度.本文在ILSVRC 2012和NIPS 2017两个公开数据集上验证了所提出方法的有效性, OAdvHaze和PAdvHaze取得了与最先进攻击方法相当的攻击成功率和可迁移性.该工作将有助于评估和提高深度神经网络对现实世界中潜在雾扰动的鲁棒性.
关键词 对抗性攻击; 图像分类; 雾合成; 深度学习; 图像处理; adversarial attack; image classification; haze synthesis; deep learning; image processing;
计算机
图形图像
论文
Website
Google Scholar
闫涛, 钱宇华, 李飞江, 闫泓任, 王婕婷, 梁吉业, 郑珂银, 吴鹏, 陈路, 胡治国, 乔志伟, 张江峰, 翟小鹏
中国科学: 信息科学, 2023, 53(2): 282-308
摘要 基于图像聚焦信息的三维形貌重建方法通常对微观物体的景深图像序列采用统一的聚焦评价标准,这类重建方法往往会忽视图像序列之间的联系,难以修正图像纹理稀疏或低对比度导致的连续帧深度误差.鉴于三维数据特有的多维度信息关联特性,本文将微观物体的不同景深图像序列视为三维数据,在重建过程中引入全部图像序列之间的关联关系,从三维数据时频变换的视角构造了以多视角分析、稳定性聚类、选择性融合逻辑耦合的微观三维形貌重建框架.首先从理论上分析三维数据相较于传统二维图像处理重建问题的优势,通过构造三维时频变换实现三维数据到不同尺度、区域和方向深度图像之间的映射;然后从增强深度图像特征的角度构建基于多模态纹理特征的局部稳定性聚类算法,实现同质性较好深度图像的自适应选择;最后提出选择性深度图像融合的策略,通过构造层筛过滤平衡树对滤除离散噪声后的多层深度图像进行融合,实现微观物体高精度的三维形貌重建.模拟数据与真实场景数据均验证了本文方法的有效性.三维时频变换视角的智能微观三维重建方法为基于图像聚焦信息的三维形貌重建提供一个崭新的研究视角,在精密制造、亚微米级工业测量等领域具有重要的理论意义和应用价值.
关键词 三维重建; 无监督学习; 稳定性聚类; 深度图像; 时频变换; 3D shape reconstruction; unsupervised learning; locally stable clustering; depth image; time-frequency transformation;
计算机
图形图像
论文
Website
Google Scholar
杨铮, 董亮, 蔡新军
中国科学: 信息科学, 2023, 53(1): 46-65
摘要 实时视频流分析在智能监控、智能制造、自动驾驶等场景中具有重要价值,然而其存在计算负载高、带宽需求大和延迟要求严格等特点,难以通过传统的本地计算模式或者云计算模式进行部署.近年兴起的边缘计算范式,将复杂的计算任务从终端设备上传到物理临近的边缘服务器上,能够有效解决设备层面的部署问题.然而,例如无人机编队飞行、车队自动驾驶和多机器人协同等不断涌现的多设备协同场景,新增了系统层面的综合性能要求,包括智能分析的实时准确率、设备之间的性能一致性和系统容纳的设备数量上限.当前的边缘计算范式对多设备协同场景的优化尚显不足,未能有效解决设备之间对上传带宽和服务器算力的竞争问题,所以难以满足这类场景的要求.本文设计了MASSIVE系统,能够在多设备协同场景中,全面提升实时视频分析的综合性能.首先, MASSIVE系统提出了适合多设备协同场景中度量视频流分析系统综合性能的评价体系.其次, MASSIVE系统设计了帕累托改进调度器来计算帕累托最优的系统调度策略,使得系统在3个维度上同时取得了相比已有系统更好的性能表现.最后, MASSIVE设计了虚拟流量整形器来保证各个设备在无线网络中按照调度策略上传视频流数据.实验结果表明, MASSIVE在多种典型的视频分析任务中,相比于当前的代表性系统,至少达到了122.7%的实时准确率、1.8倍的系统容量和更好的系统一致性,并达到了帕累托最优.
关键词 实时视频流分析; 边缘计算; 多设备协同; 多目标优化; 帕累托最优; real-time video analysis; edge computing; multi-agent cooperation; multi-objective optimization; Pareto optimal state;
计算机
图形图像
论文
Website
Google Scholar
徐雪远, 刘建红, 李子遇, 翟广涛, 邬霞
中国科学: 信息科学, 2023, 53(1): 33-45
摘要 颅内容积传导效应导致大量脑电特征之间具有高度相关性,而这些高度相关的脑电特征无法为情感识别提供额外的有用信息,并且会降低基于脑电信号的情感识别效率.为了去除冗余信息和挑选有判别力的脑电特征,本文提出了一种基于正交回归和特征加权的脑电情感特征选择方法.与传统特征选择方法相比,该方法利用正交回归在脑电特征映射空间中保留更多的判别信息,更加适合于非线性和非平稳脑电信号的分析处理.为了验证所提出方法的性能,我们采集了由视频诱发的多通道脑电情感数据,并将所提出方法与4种常用的脑电特征选择方法进行了比较.实验结果证明了本文所提出方法能有效降低脑电特征集内冗余信息,并挑选出具有判别力的脑电特征子集.此外,通过分析由该方法所挑选的脑电特征类型,我们发现中心频率特征是最具判别力的脑电情感特征.该发现将为未来脑电情感特征提取研究提供新的思路.
关键词 脑电; 特征选择; 情感识别; 正交回归; 特征加权; electroencephalogram; feature selection; emotion recognition; orthogonal regression; feature weighting;
计算机
图形图像
论文
Website
Google Scholar
王文彬, 王瑞平, 陈熙霖
中国科学: 信息科学, 2022, 52(11): 2075-2092
摘要 场景图是以场景中的物体为结点、以物体之间的关系为边构成的图结构,在视觉与语言交互理解和推理相关任务中具有广泛的应用前景.近年来,场景图自动生成逐渐受到关注,但生成结果中对于关系的描述受到长尾分布带来的偏见的影响,偏向于样本量较大的头部关系.然而头部关系往往过于空泛,描述不够准确,容易造成误解.由于这种关系价值不高,生成的场景图近似于退化为场景中物体信息的堆叠,不利于其他应用在图结构上进行结构化推理.为了使场景图生成器在这种不均衡的数据条件下,能够更均衡地学习,给出更加多样化的特别是尾部的更准确的关系,本文提出一种附加偏见预测器(additional biased predictor, ABP)辅助的均衡化学习方法.该方法利用一条有偏见的关系预测分支,令场景图生成器抑制自身对头部关系的偏好,并更加注重尾部关系的学习.场景图生成器需要为指定的一对物体预测关系,这是一种实例级的关系预测,与之相比,有偏分支以更简洁的方式预测出图像中的关系信息,即不指定任何一对物体,直接预测出图像中存在的关系,这是一种区域级的关系预测.为此,本文利用已有的实例级的关系标注,设计算法自动构造区域级的关系标注,以此来训练该有偏分支,使其具有区域级关系预测的能力.在不同场景图生成器上应用ABP方法,并在多个公开数据集(Visual Genome, VRD和OpenImages等)上进行实验,结果表明, ABP方法具有通用性,应用ABP方法训练得到的场景图生成器能够预测出更加多样化的、更准确的关系,进而生成更有价值、更实用的场景图.
关键词 场景图生成; 长尾分布; 附加偏见预测器; 均衡化学习; 区域级关系; scene graph generation; long-tailed distribution; additional biased predictor; balanced learning; region-level relationship;
计算机
图形图像
论文
Website
Google Scholar
梅杰, 程明明
中国科学: 信息科学, 2022, 52(11): 2058-2074
摘要 检测由自然灾害造成的不同变化,对于有效地指导人道主义援助和灾难响应行动来说至关重要.但是灾害发生的地区通常面积大、地面环境复杂,导致检测其变化具有较大的挑战性.现有的评估方法通常依靠人工来进行判别,不适用于多种灾害的检测.本文提出了一种新颖的变化检测模型(change transformer, CHTR),基于双时序遥感图像来同时进行建筑分割和多级变化检测两个任务.本文结合卷积神经网络擅长学习局部细节特征和Transformer可以建模长程依赖关系的优势,采用混合卷积神经网络和Transformer的架构作为编码器.考虑到自然灾害通常会对复杂环境中的建筑物造成不同程度的破坏,本文提出了一种全局差异模块,以捕获全局变化模式,提高对双时序图像之间变化的整体认识.进一步设计了一种局部门控注意力模块,以学习多级别变化之间的局部依赖性,增强对不同变化的判别能力.在目前最大的建筑物损毁评估数据集(xBD)上进行的大量实验表明,本文提出的方法在建筑分割和变化检测两个任务上都取得了更好的结果.
关键词 建筑物分割; 变化检测; 遥感图像; 全局和局部结构; Transformer; building segmentation; change detection; satellite imagery; global-local architecture; transformer;
计算机
图形图像
论文
Website
Google Scholar
王清和, 曹兵, 朱鹏飞, 王楠楠, 胡清华, 高新波
中国科学: 信息科学, 2022, 52(8): 1447-1462
摘要 人脸跨域翻译是将人脸图像从一个图像域映射到另一个图像域的过程,常见的人脸图像翻译任务包括人脸照片–素描、人脸照片–线条画跨域翻译等,可以广泛应用于现实场景,如协助刑侦、电影制作、数字娱乐.但是成对的人脸图像数据有限,且不同域之间的颜色、纹理差异较大,导致人脸图像跨域翻译仍面临着巨大挑战.现有的方法通常会产生模糊、伪影、结构失真等问题,导致较差的视觉效果.为解决这一问题,我们提出了一个自判别循环生成对抗网络,其中,生成器部分采用编码器–解码器结构,生成器对应的判别器为翻译方向相反的编码器,通过自判别的形式,使编码器(即判别器)巧妙地融合了“真/假”语义判别能力与对像素改变的敏感性,从而增强了模型的稳健性和泛化能力.其次,我们提出了一个新颖的全向像素梯度损失函数,设计的卷积核计算了每个像素周围每个方向的梯度来提取图像的梯度信息,通过约束生成图像与对应真实图像的梯度信息保持一致,从而激励模型有效地学习像素间连续变化的模式,并且该损失函数可以灵活地应用于其他生成模型以提升性能.大量的实验表明本文提出的框架能够在公开的成对的人脸照片–素描数据集(CUFS, CUFSF)以及人脸照片–线条画数据集(APDrawing)上取得优异的结果.此外,通过泛化能力验证实验,我们进一步展示了模型在真实场景数据上的强泛化能力,以及自判别循环生成对抗网络结构在非成对人脸数据集上的出色性能.
关键词 人脸图像翻译; 自判别循环生成对抗网络; 梯度损失; 照片–素描; 照片–线条画; face image translation; self-discriminative cycle generative adversarial network; gradient loss; photo-sketch; photo-APDrawing;
计算机
图形图像
论文
Website
Google Scholar
袁艺天, 王鑫, 朱文武
中国科学: 信息科学, 2022, 52(8): 1417-1446
摘要 通信技术和移动互联网的发展使多媒体数据逐渐渗透人们的生活,而视频作为其中一种最具表现力的内容表达方式,近年来受到了工业界和学术界的广泛关注.针对视频数据中背景信息较为冗余,所需分析浏览时间长的特点,本文介绍了自然语言句子在视频中的时序定位任务,即在视频中定位与给定自然语言句子语义相关的视频片段,这样人们可以通过提供明确简洁的文本描述在视频中迅速找寻所关注的特定内容,从而提高用户的视频浏览体验和搜索效率.传统方法往往以多模态匹配的框架来解决句子在视频中的时序定位问题,忽略了自然语言句子中的关键定位线索,更忽视了自然语言句子对于关联视频内部相关内容的重要指导作用,因而其时序定位准确率十分有限.为解决上述难题,本文提出了多模态共同注意力机制挖掘自然语言句子中与时序定位相关的重要语义细节,精细地构建句子中各单词和视频内容之间的语义关系.在此基础上,我们还提出了语义条件动态归一化机制,指导视频中与句子语义相关的局部视频内容紧密耦合,形成明确的视频片段边界,最后辅以细粒度的边界调整模块,进而获得更为精准和灵活的时序定位结果.在公开数据集上的实验验证了本文所提出的机制和方法的有效性.最后,本文还从引入视频中的音频信号、考虑弱监督环境下的时序定位问题,以及构建无偏见时序定位数据集这3个方面对自然语言句子在视频中的时序定位问题进行了未来研究方向的展望.
关键词 时序定位; 语义关联; 多模态共同注意力机制; 时序卷积网络; 语义条件动态归一化机制; temporal sentence grounding in videos; semantic correlation; multimodal co-attention mechanism; temporal convolutional network; semantic conditioned dynamic normalization;
计算机
图形图像
论文
Website
Google Scholar
蒋旖旎, 蔺宏伟
中国科学: 信息科学, 2022, 52(7): 1251-1271
摘要 混合曲线曲面的拟合常应用于计算机辅助设计与制造中,但传统的数据拟合方法缺乏明显的几何意义.最小二乘渐进迭代逼近算法(progressive-iterative approximation for least square fitting, LSPIA)能通过迭代地调整控制点得到原始数据点的最小二乘拟合结果,具有明显的几何意义,但收敛速度较慢.为解决这个问题,本文提出一种基于共轭梯度法的最小二乘渐进迭代逼近算法(conjugate-gradient progressive-iterative approximation for least square fitting, CG-LSPIA).该算法首先计算共轭曲线曲面,再更新混合曲线曲面,在没有数值误差的情况下,迭代至多n步即可生成给定数据点的最小二乘拟合曲线曲面.此外,本文给出了CG-LSPIA算法收敛性证明.最后,以B样条曲线曲面为例,与LSPIA算法进行了比较,实验表明该算法有效,并且减少了达到相同拟合误差限所需的迭代次数与时间.
关键词 渐进迭代逼近; 最小二乘拟合; 共轭梯度法; 数据拟合; 几何设计; progressive-iterative approximation algorithm; least square fitting; conjugate-gradient method; data fitting; geometric design;
计算机
图形图像
论文
Website
Google Scholar
律睿慜, 张陶洁, 梅莉琳
中国科学: 信息科学, 2022, 52(7): 1221-1250
摘要 书法笔画能够产生丰富的主观意象,中国传统绘画也有类似的审美现象.于是,在古代的书画论著中,有大量关于笔画观感的记载,往往是将笔画引出的各种丰富拟物化意象进行描述.目前由于书法通常被归入艺术学研究的范畴,书法理论研究中还极少引入数理建模和科学实验的方法,因此对于笔画的意象空间还鲜有采取测量及实证的科学方法,还未能对其建立数理模型.本文设计了两项实验,用以探索书法笔画的意象空间.在第一项实验中,引入实验美学中常用的审美测量方法,选取了书法家写的15个“一”字作为测试样品,并选用21种拟物化感知维度,设计了视觉模拟量表,招募了252名普通群众对它们进行意象感受评测实验.然后,对数据进行主成分分析,展现出笔画“一”的意象空间的特征:其一,它的前二维占据主导,主轴对应于书法理论中探讨最多的“质与妍”的风格倾向问题、副主轴对应于“真与草”的书风倾向问题;其二,它的第三、四维的分布情况也不可忽略,其具体的意义有待进一步解释;其三,不同形态的笔画分布于该空间的不同位置,不同的感知维度对应于从空间原点出发的不同方向.基于第一项实验,设计了可视化方案,直观展现该意向空间中占主导的前二维的结构特征.第二项实验让测试者对实验一中的15个笔画样品评价其两两之间的主观差异.该实验结果经多维缩放分析,与实验一的结果互为支撑.不仅验证了书法理论中有关书风和书体的观点,还为关于“笔法”的审美感知实证研究提供了一种可拓展的数理模型和实验框架.
关键词 书法; 笔法; 笔画; 意象; 实验美学; 主成分分析; 多维尺度分析; 数据可视化; calligraphy; brushstrokes; calligraphic stroke; synesthesia; empirical aesthetics; principle component analysis; multidimensional scaling; data visualization;
计算机
图形图像
论文
Website
Google Scholar
曾宪华, 纪聪辉, 董倩
中国科学: 信息科学, 2022, 52(5): 822-836
摘要 在临床诊断中,磁共振成像(magnetic resonance imaging, MRI)运动伪影是一个常见的问题,运动伪影的存在会影响医生的诊断,虽然重新采集MRI可以避免这一问题,但这会提高医院和患者的经济成本和时间成本,因此,运动伪影的校正具备实用研究价值.现有的研究主要关注于空域的运动伪影校正或者K空间的运动伪影校正,缺乏对K空间和空域之间数据一致性的保持.为了解决这一问题,本文基于生成对抗网络提出了保持K空间和空域之间数据一致性的MRI运动伪影校正模型.该模型通过频域生成器对K空间数据进行初步校正,然后通过空域生成器对空域中的数据进行精细校正,在优化阶段则采用域间数据一致性损失来保持K空间和空域之间的数据一致性.在公开脑部MRI数据集ADNI, ABIDE, OASIS和Brain上的实验结果表明,本文提出的模型相较于其他方法分别在PSNR, SSIM以及RMSE上最高提升了3.4%, 3.07%和15.57%.
关键词 运动伪影校正; 生成对抗网络; 数据一致性; 深度学习; 医学图像; motion artifact correction; generative adversarial network; data consistency; deep learning; medical image;
计算机
图形图像
论文
Website
Google Scholar
姚洁茹, 韩军伟, 张鼎文
中国科学: 信息科学, 2022, 52(3): 461-482
摘要 近年来,弱监督目标检测在计算机视觉和机器学习领域获得了广泛的关注.点标注是弱标注的形式之一,它依赖人工标注,为图像中的每一个物体赋予一个标注点.尽管在过去的几年中,出现了许多基于深度学习的弱监督目标检测算法,但当前基于点标注的弱监督目标检测的探索仍处于空白.考虑到点标注可以为弱监督目标检测提供丰富的、与感兴趣物体相关的位置、类别、数量等信息,本文提出了一个基于点标注的弱监督目标检测算法.该算法通过探索标注点与目标、类别间、实例间的依赖关系弥补弱监督学习中监督信息的不足,提高弱监督目标检测性能.在该算法中,本文提出了3个网络分支用以充分挖掘标注点信息,改善弱监督目标检测学习过程:空间图分支(spatial graph branch,SGB)利用点标注与目标空间上的局部相关性,探索标注点与标注点空间上下文间关系;多语义分支(multi-semantics branch, MSB)利用类别间在语义上的共现概率,构建语义拓扑结构,探索标签间的全局语义关系;实例计数分支(count-guided instance branch, CIB)利用不同实例间在空间上的局部无关性和特征差异,推断每个目标的伪监督信息,实现实例级监督.用点标注训练弱监督目标检测算法,在节省人工标注成本的同时提供更多丰富的监督信息,从本质上提高弱监督目标检测性能.在PASCAL VOC 2007和PASCAL VOC 2012数据集上的实验结果表明,本文算法与基准模型相比,在均值平均精度上分别提高了7.9%和10.2%,在定位准确度上分别提高了9.7%和11.7%.
关键词 弱监督学习; 目标检测; 点标注; 依赖关系; 关系推理; weakly supervised learning; object detection; point annotation; dependency relationship; relationship reasoning;
计算机
图形图像
论文
Website
Google Scholar
梁昌城, 王楠楠, 朱明瑞, 杨曦, 李洁, 高新波
中国科学: 信息科学, 2022, 52(2): 334-347
摘要 从真实的人脸照片合成面部素描及其逆过程具有广泛的用途,例如数字娱乐与协助刑事案件的侦查.但是,由于照片与素描在纹理上的显著差异,它们之间的互相转换仍是一个具有挑战性的问题.最近基于生成对抗网络的方法已在图像间转换问题,特别是照片到素描的转换方面展现出令人鼓舞的结果,但它们大多会在面部关键组件产生不同的形变或者模糊,使得合成图像的真实性受影响.为了应对这一挑战,我们提出了一种新颖的基于多尺度特征融合的人脸照片–素描合成算法,来提高合成图像的结构完整性与纹理逼真度.首先使用编码器提取输入图像的多尺度编码特征,然后将最底层编码特征经过空洞卷积模块后传入解码器进行解码.解码过程中将不同尺度的解码特征与对应尺度的编码特征在通道维度上拼接,从而获得多尺度编解码融合特征.最后在解码器的输出端将不同尺度的编解码融合特征进一步融合,并通过一层卷积层产生最终合成结果.通过这种同时将编码–解码过程中不同尺度的特征在通道维度进行拼接的方式,能够保持较好的图像结构以及纹理细节,生成逼真的面部素描/照片图像.我们在多个具有挑战性的数据集中验证了所提方法的有效性.定量和定性评估表明,本文模型在生成具有高视觉质量的人脸素描(或照片)方面优于其他最新技术.
关键词 人脸照片–素描合成; 图像翻译; 生成对抗网络; 多尺度特征融合; 空洞卷积; face photo sketch synthesis; image-to-image translation; generative adversarial network; multi-scale feature fusion; dilated convolution;
计算机
图形图像
论文
Website
Google Scholar
曾锦山, 陈琪, 王明文
中国科学: 信息科学, 2022, 52(1): 145-159
摘要 近年来,汉字自动生成因其在艺术字体生成、个性化字体设计,以及书法作品生成等问题中的广泛应用而引起了大量关注.当前主流的汉字字体自动生成方法主要基于非配对数据和深度生成模型如生成对抗网络等.然而,这些主流的深度汉字字体生成方法通常忽略了汉字本身的结构信息,导致在提取特征时缺乏相应指导,且在训练过程中容易出现模式坍塌现象,从而在生成汉字质量方面亟待进一步提高.针对该问题,本文受汉字田字格书写的启发,提出一种基于田字格变换的自监督方法来指导网络模型提取更高质量的特征,进而提升汉字生成效果,需要特别指出的是所设计的田字格几何变换无需改变现有模型网络且不增加任何人工成本,因此潜在可嵌入许多已有深度汉字字体生成模型.所提自监督学习方法的有效性在一系列实验中得到验证.实验结果表明,在嵌入所提的自监督学习任务后,当前流行的基于CycleGAN的深度汉字生成模型在生成效果和训练稳定性等方面都有较大提升,并且模式坍塌现象得到改善.与现有其他深度汉字字体生成方法相比,所提基于田字格几何变换的自监督方法提高了生成汉字质量,并且在生成汉字内容准确率、FID值、L1损失和IOU这4个评价指标上均有一定提升.
关键词 汉字字体生成; 自监督学习; 生成对抗网络; 深度学习; 田字格变换; Chinese font generation; self-supervised learning; generative adversarial network; deep learning; square-block transformation;
计算机
图形图像
论文
Website
Google Scholar
白玉, 颜波, 谭伟敏
中国科学: 信息科学, 2022, 52(1): 129-144
摘要 作为改变人脸图像外观的重要方式之一,美妆转移任务在近年来获得了越来越多的关注.美妆转移网络可以将任意参考图像的妆容转移到任意人脸图像上,在节约时间和空间成本的同时帮助人们找到适合自己的妆容,并获得妆容得到美化的图像.美妆转移网络BeautyGAN成功展示了无监督方法妆容迁移的较好效果,然而此类无监督学习策略缺乏可以提供良好妆容细节的监督标签,导致实验结果中出现了背景变色、边缘不自然、容易受光照影响等问题.用素颜–美妆配对标签进一步约束BeautyGAN模型训练可以解决上述问题,但当前学术界缺乏此类精细标注的配对数据集.针对以上问题,本文提出了BeautyGAN+方法,贡献了一个用户详细标注的素颜–美妆配对数据集,即PMT数据集,在BeautyGAN的无监督基础上加入有监督损失进行训练,最终通过实验发现结合无监督(迁移性好)和有监督(细节修复好)的训练策略可以提供更好的迁移效果.实验结果中的图像结果和用户调研(14位)均表明本文方法显著提升了美妆转移效果,解决了美妆转移工作长期缺乏配对数据集及转移结果存在多种偏差的难题.
关键词 深度学习; 美妆转移技术; 生成式对抗网络; 有监督学习; 美妆数据集; deep learning; makeup transfer; generative adversarial network(GAN); supervised learning; makeup dataset;
计算机
图形图像
论文
Website
Google Scholar
冯伟, 张乾, 田飞鹏, 王小伟, 柴勃隆, 孙济洲, 苏伯民
中国科学: 信息科学, 2021, 51(12): 2102-2118
摘要 预防性保护是国际广泛认可并努力持续追求的先进保护理念,代表了文物保护的发展方向.预防性保护通过精细监测病征,识别病因,精准控制相关致病因素,从而达到有效抑制文物本体劣化的目的.整个过程,监测是起点和根本.目前,国内外对环境风险源感知已有很多技术和数据的积累.然而,由于文物本体劣化具有发展缓慢、变化细微、赋存环境多样等特点,目前国内外尚缺乏面向真实赋存环境下文物本体细微变化的快速、精准、可靠的监测方法,严重阻碍了文物预防性保护的发展和推广.本文聚焦该问题,首次提出了基于相机位姿主动式重现的原位监测思路,并在此基础上设计研发了功能完善、适用面广的文物本体智能原位监测系统.通过物理真实地重现相机六自由度位姿,实现了基于图像导引的文物本体真实细微变化的准确检测.目前该系统已成功在敦煌莫高窟、故宫、颐和园等10多个文化遗产地的多种保护业务中推广应用.
关键词 预防性保护; 成像条件原位重现; 相机重定位; 细微变化检测; 主动视觉; 原位监测; preventive conservation; imaging condition reproduction; camera relocalization; fine-grained change detection; active vision; in-situ inspection;
计算机
图形图像
论文
Website
Google Scholar
常令琛, 李钟毓, 樊夏玥, 商增谊, 景海婷
中国科学: 信息科学, 2021, 51(12): 2089-2101
摘要 高效准确的相似神经元检索方法是神经元形态分析的重要支撑.随着高精度显微成像、神经元示踪、人工智能等技术的发展,近些年出现了若干基于机器学习的神经元形态计算与分析方法,这些研究主要包括对传统神经元形态度量指标的统计分析,以及将神经元形态二维投影与深度学习结合的神经元量化表征方法,在神经元的特征提取、分类、相似检索等任务中均取得了不错的效果.不过随着越来越多的三维神经元数据被重建出来,以上方法都无法满足当前背景下对大规模神经元形态数据的细粒度表征、检索与分类需求.为此,本文提出了基于三维深度神经网络的大规模神经元形态表征与检索方法.首先,为了将神经元的三维空间拓扑结构转换成适用于深度神经网络的形式,我们设计了神经元空间形态的体素转换方法,将原始的神经元重构文件转换成三维体素的形式,极大地保留了神经元的三维空间拓扑结构.随后,考虑到当前神经元数据缺乏精细的分类标准,本文设计了基于三维卷积自动编码器的神经元形态表征算法,应用深度神经网络无监督地学习神经元体素数据的结构特点,得到神经元形态的量化表征,并以此设计端到端的相似神经元快速检索算法.最后通过实验验证本文所提出的方法,在9万余神经元数据中检索形态相似的神经元,实验结果显著优于其他基于神经元量化表征的检索方法.实验表明,本文方法可以更高效准确地检索相似神经元,为神经元的形态学分析、神经元单细胞分类等相关研究的关键问题提供支持.
关键词 神经元形态学; 深度神经网络; 三维体素; 特征表达; neuron morphology; deep neural networks; 3D voxels; feature representation;
计算机
图形图像
论文
Website
Google Scholar
缪永伟, 戴颖婷, 王海鹏, 刘复昌, 王金荣
中国科学: 信息科学, 2021, 51(12): 2069-2088
摘要 针对传统点云场景重建中由于场景区域缺乏纹理、场景物体遮挡等导致重建结果不准确的局限性,借助场景包含的几何特性和线结构信息,有效利用RGB-D数据的梯度信息和邻域点云分布信息,本文提出了一种针对点云场景的3D线特征提取、匹配和配准方法.首先,通过场景RGB图的梯度信息确定梯度方向相似的3D直线段支持域.然后,借助场景深度图呈现的邻域几何特性,根据当前点与其邻近点之间的分布关系判断点云中的直线型边界线点云和直线型折边线点云并拟合得到场景3D线特征.其次,以点云场景提取的3D线特征为轴线,构造等厚度同轴圆柱区域作为3D线段支持域,并统计支持域中各层圆柱壁内点云梯度作为描述符实现3D线特征匹配.最后,利用基于线–线的迭代最近线配准算法,迭代计算得到帧间场景的旋转与平移,从而实现帧间点云场景的高效配准.实验结果表明,与已有的点云场景线特征提取及点特征配准方法比较,本文直接基于线特征的方法配准效率高、计算量小、配准精准,方法具有较强的鲁棒性.
关键词 点云场景; 3D线特征; 线特征提取; 线特征配准; 三维重建; point cloud scenes; 3D lines; line feature extraction; line registration; 3D reconstruction;
计算机
图形图像
论文
Website
Google Scholar
姜馨蕊, 王楠楠, 辛经纬, 李柯宇, 杨曦, 高新波
中国科学: 信息科学, 2021, 51(10): 1690-1705
摘要 近年来,深层卷积神经网络在图像超分辨率重建任务中取得了巨大成功,然而复杂的深度神经网络会消耗大量存储空间以及计算资源,严重限制了其在资源有限的移动端设备上的部署.因此降低模型的资源消耗将有助于扩展深度超分辨率网络的实际应用范围.二值神经网络占用存储空间小、计算效率高,激励我们将二值化算法应用于目前的深度超分辨率重建领域,满足现有移动设备对于超分辨率的实际应用需求.因此,本文关注于二值图像超分辨率重建网络的研究.为此,我们首先总结了现有二值化方法,并针对其技术细节和算法特点进行了详细介绍.随后,我们探索了目前二值化方法在超分辨率领域的实际应用效果,并面向图像超分辨率重建任务提出一种新的二值化算法,主要通过提高网络前向过程表达能力和减少网络反向过程训练损失提升二值超分辨率网络的性能.实验表明,无论对比现有基于分类任务的二值化算法还是对比基于超分辨率任务的二值化算法,我们的方法均可以取得最优的性能.
关键词 二值卷积神经网络; 图像超分辨率重建; 二值化; 量化; 模型压缩; binary neural network; single image super-resolution; binarization; quantization; model compression;
计算机
图形图像
论文
Website
Google Scholar
李强, 刘贤明, 韩凯歌, 江俊君, 季向阳
中国科学: 信息科学, 2021, 51(10): 1675-1689
摘要 全切片数字成像(whole slide imaging, WSI)是病理切片数字化的核心技术,其自动对焦的速度和精度决定了WSI系统的性能.然而,传统的自动对焦方法需要拍摄多张离焦子图像创建图像堆栈,或者需要复杂的硬件调制光学系统,从而限制了WSI在实际场景中的应用.本文设计了基于深度学习的数字病理扫描系统单次曝光自动对焦方法,对子图像逐个进行网络虚拟自动对焦,将单张离焦子图像通过网络直接生成准焦子图像.本方法仅需要在任意离焦距离下的单次曝光拍照即可,从原理上避免了重复的对焦运动和相机曝光过程.实验结果表明,本方法具有高通量、高速度、低成本、实用性强、可线下处理等优点.
关键词 数字病理扫描系统; 自动对焦; 深度学习; 光学显微镜; 计算成像; digital pathological systems; autofocusing; deep learning; optical microscopes; computational imaging;
计算机
图形图像
论文
Website
Google Scholar
姚桂林, 张必英, 张艳荣, 苏晓东
中国科学: 信息科学, 2021, 51(10): 1658-1674
摘要 数字图像抠像与合成问题是虚拟现实中的经典问题.抠像问题需要根据抠像公式,从输入图像准确地提取出前景物体的透明度(α)和前景物体的颜色值,而合成问题仅使用抠像结果与新背景图像进行结合,使其成为新的合成图像.然而,目前很多抠像算法仅局限于抠像部分的α值的计算,忽略了用于后续合成步骤的前景颜色的计算.这实际上仅限于理论研究,脱离了抠像问题的合成应用层面.同时,其他一些兼顾计算前景颜色算法的效果仍然不理想,而且也仍然缺乏合成图像数据集和对合成图像的比较.本文充分利用仿射类方法中搜索范围灵活可变的优势,采用实体像素与混合像素进行分级处理的3层次结构,联合求解出最终的α值和前景颜色.其中,每个层次均利用前向层次的先验,结合仿射类方法的像素相关性以及颜色拟合性约束,采用闭合形式进行求解.在实验中,本文不仅针对α层面进行比较,而且在数字抠像领域中首次引入针对合成图像层面的比较.在合成层面中,本文针对输入图像及各型号的三分模板(Trimap),均引入了白色背景和相应的自然图像背景.同时各方法的真实的α值和前景颜色不仅与这些背景进行了常规合成,而且也进行了一种单纯α层面的合成.实验结果表明,在数值评价结果和视觉效果方面,本文方法的最终α结果与上述各种合成效果均优于目前已有的抠像与合成方法及一些新生成的方法.
关键词 图像抠像; 图像合成; 仿射类抠像; 闭合形式解; 实体像素与混合像素; image matting; image compositing; affinity-based matting; closed form solution; opaque and mixed pixels;
计算机
图形图像
论文
Website
Google Scholar
范登平, 季葛鹏, 秦雪彬, 程明明
中国科学: 信息科学, 2021, 51(9): 1475-1489
摘要 物体分割技术是计算机视觉中的研究热点,在多个领域都有广泛的应用.本文从人类视觉系统对场景中的全局信息和局部细节非常敏感的角度出发,设计了一种新颖、高效且易于计算的增强匹配标准(E_ξ)来评估物体分割模型的性能. E_ξ将局部像素值与全局平均值有机结合,以便评估分割结果与标准结果在图像级和像素级的相似度.在国际主流的4个公开数据集上的大量实验表明, E_ξ在多个方面,如应用关联度、随机偏好度、噪声偏好度、感知度上相比现有广泛采纳的评价标准(IoU和F_β)均有大幅相对提升.通过利用加权二值交叉熵损失函数、本文的增强匹配损失函数以及加权交并比损失函数,本文进一步设计了一套组合损失函数(Hybrid-E_(loss))来促进网络学习到像素级、对象级和图像级的分割特征.定性和定量的结果表明,在3个不同领域的分割任务中使用这一组合损失函数能够进一步提高物体分割的精度.
关键词 物体分割技术; 评价标准; 视觉感知; 增强匹配标准; 损失函数; object segmentation; metric; cognitive vision; enhanced-alignment measure; loss function;
计算机
图形图像
论文
Website
Google Scholar
彭春蕾, 高新波, 王楠楠, 李洁
中国科学: 信息科学, 2021, 51(9): 1451-1474
摘要 随着深度学习技术在视频和图像生成领域的广泛应用,视频和图像中的可视身份伪造,特别是人脸伪造结果的逼真程度越来越高,对于身份伪造数据的检测在国家安全和社会稳定等方面均具有重要的研究和应用价值,近年来已成为研究的热点问题.本文从有目标身份伪造和无目标身份伪造两个方面归纳和介绍了可视身份深度伪造的研究方法,并从基于空域线索、时域线索的面向已知伪造类型检测方法、面向未知伪造类型的泛化能力研究,以及面向对抗样本攻击的可信伪造检测研究等多个方面阐述了伪造检测的关键技术,并在总结现有数据集和代表性算法的性能分析基础上,进一步讨论了可视身份深度伪造与检测的关键问题和面临的挑战.
关键词 深度伪造; 人脸替换; 人脸编辑; 表情重演; 人脸生成; 伪造检测; deepfake; face swap; face manipulation; expression reenactment; face generation; forgery detection;
计算机
图形图像
论文
Website
Google Scholar
李坤, 李万鹏, 孙晓琨, 方璐
中国科学: 信息科学, 2021, 51(8): 1287-1301
摘要 在计算机视觉中,群体分析越来越受到人们的关注,对图像中复杂人群进行分组是群体分析领域的基础技术需求.现有的人群社交分组方法只针对固定人数的小范围场景,不能处理真实世界中的大场景图像.本文提出首个面向十亿像素大场景图像的基于深度学习的细粒度人群社交分组框架,由一种图引导的全局到局部的划分策略与一个学习隐函数表示社交对交互模式的深度社交分组网络组成.该框架可在大范围场景图像上实现准确的人群分组.本文方法同样适用于小场景图像,在小场景图像数据集上的实验结果表明,本文提出的框架相比于现有方法取得了显著的性能提升.相关代码与训练数据即将开源.
关键词 群体; 大场景图像; 深度学习; 社交分组; 图引导; group; large-scene image; deep learning; social grouping; graph-guided;
计算机
图形图像
论文
Website
Google Scholar
张帆, 王桦, 范辉, 张彩明
中国科学: 信息科学, 2021, 51(8): 1270-1286
摘要 曲面拟合是最有效的图像放大方法之一,其关键是构造对图像拟合的曲面.图像细节和边缘等特征对图像的视觉效果起着关键作用,因此,构造拟合曲面的关键之一是保持图像细节和边缘.基于样条和多项式方法构造的拟合曲面不能有效地保持图像的边缘信息,从而使放大图像在边缘处锯齿状明显.本文提出了以边缘和距离为特征约束的图像放大新算法.算法以边缘和距离为约束,在每个像素的邻近区域上构造一张对邻域上像素点拟合的二次多项式曲面片,并在每个四边形网格上构造一张二次多项式中间曲面片.在每个四边形网格上由五张曲面片加权平均生成有理多项式曲面片.该曲面片具有二次多项式逼近精度,产生的图像具有较好的视觉效果.通过构造误差曲面片对二次多项式曲面片进行修正,提高了放大图像的精度和视觉效果.新算法把二次多项式的常数项、一次和二次项采用不同方法分别计算,为构造带约束的多项式函数提供了新技术.实验结果表明,相比于其他算法,本文算法不仅有较高的逼近精度,而且放大图像的视觉效果也较好.
关键词 二次多项式; 边缘和距离约束; 逼近曲面; 逼近精度; 图像放大; quadratic polynomial; edge and distance constraints; approximation surface; approximation accuracy; image magnification;
计算机
图形图像
论文
Website
Google Scholar
徐琳琳
中国科学: 信息科学, 2021, 51(8): 1255-1269
摘要 圆弧样条普遍用于数控机床的刀具轨迹设计中,希望用尽可能少的圆弧段逼近曲线.现有方法大多是启发式的,圆弧样条曲率的分段常值性质还没有引起足够的重视.本文基于这个内在的稀疏性质,提出基于稀疏表示的G~1圆弧样条自动逼近方法,主要分两步:稀疏优化问题自动检测圆弧间连接点的全局初始化和重新调整连接点位置保证G~1连续性的局部修正.实验结果显示新方法对对称性比较敏感,部分尖锐特征、自交数据也可以逼近得很好,充分说明了新方法的优越性.
关键词 圆弧样条; 稀疏表示; 逼近; G~1连续; arc spline; sparse representation; approximation; G~1 continuity;
计算机
图形图像
论文
Website
Google Scholar
侯淇彬, 韩凌昊, 刘姜江, 程明明
中国科学: 信息科学, 2021, 51(7): 1084-1099
摘要 针对目标任务收集新类别的海量标注数据通常需要大量时间和人力成本,并已成为语义分割技术投入实际产业应用过程的主要瓶颈.本文旨在以"网络监督"的方式,在仅利用用户提供的目标类别关键词以及相应自动搜索到的网络数据的条件下实现语义分割模型的自主学习.该任务的核心挑战在于网络爬取的图像中存在一定量的类别噪声,从而影响自主学习的可靠性.为了解决类别噪声问题,本文设计了一种新颖的噪声擦除模型.该模型通过每次从小批次样本的置信注意力区域中以跨样本的方式学习语义信息来擦除训练图像中与搜索关键词无关的区域.基于该模型,本文同时提出了一种能够用于训练语义分割模型的高质量伪标注生成方法.在国际主流的公开数据集(PASCAL VOC2012)上的大量实验表明,基于该方法的语义分割模型在利用网络监督与弱监督的条件下均取得了良好结果 (mIoU=62.0%以及66.1%).
关键词 语义分割, 网络搜索, 类别噪声, 噪声擦除网络, 网络监督
计算机
图形图像
论文
Website
Google Scholar
李毓君, 方林聪
中国科学: 信息科学, 2021, 51(5): 808-821
摘要 针对五次间接PH曲线的判别问题,本文结合高斯消元法与几何方法给出Bézier控制多边形满足的充分必要条件.间接PH曲线通过一个二次有理参数变换后,其等距线是有理形式的.间接PH曲线的代数充分必要条件本质是其一阶导数的因式分解满足特定条件,是一种积的形式.考虑到Bézier曲线的表示是Bernstein多项式形式,是一种和的形式.通过这两种形式的相容性引出待求解的非线性方程组并讨论求解问题,最后将所得结果应用在控制多边形上,得到五次间接PH曲线的几何特征.
关键词 Bézier曲线; 等距曲线; 几何特征; 有理参数化; Bézier curves; offsets; geometric characteristic; rational parameterization;
计算机
图形图像
论文
Website
Google Scholar
刘博生, 陈晓明, 韩银和, 常亮
中国科学: 信息科学, 2021, 51(5): 795-807
摘要 光流(optical flow)为同一对象在视频中运动到下一帧的移动量.从视频中估计光流已广泛应用于各类移动智能系统,如运动估计和机器人导航.最近的研究表明,卷积神经网络(convolutional neural network, CNN)能提供可靠的光流估计结果.然而,现有的硬件加速器无法支持面向光流估计的CNN复杂计算.具体而言,这些类型的CNN不仅包括常规的卷积(convolution)和反卷积(deconvolution)运算,还包括双线性插值(bilinear interpolation)和/或关联(correlation)运算.双线性插值和关联操作主要探索两个连续图像帧之间的关联关系.为解决这一问题,本项工作提出面向光流的CNN硬件加速设计方案(称为Swan-AOE),即通过支持卷积、反卷积、双线性插值和关联操作解决这类神经网络的硬件加速计算问题. Swan-AOE包括可配置的硬件计算架构和自适应的调度策略,通过提供灵活的并行调度实现最优化吞吐量计算.此外, Swan-AOE还进行设计空间探索,探索可用片上缓存资源在提高能耗–面积效率的潜在能力.实验结果表明,与基准加速器相比,所提出的设计能有效提升性能、能效和面积效率.
关键词 加速器; 光流估计; 能效; 卷积神经网络; accelerator; optical flow estimation; energy efficiency; convolutional neural networks;
计算机
图形图像
论文
Website
Google Scholar
李定, 张文生
中国科学: 信息科学, 2021, 51(3): 399-412
摘要 视频行为识别近年来逐渐成为计算机视觉领域学者的研究热点,按照识别对象进行划分,视频行为识别任务可分为个体行为识别与群体行为识别.本文聚焦于群体行为识别,识别与分析视频场景中整体人群的行为.已有的群体行为识别方法大多采用多层时序网络模型,学习得到表征时序变化的个体行为特征并对其进行聚合形成群体行为特征.但是,在个体特征聚合过程中,以往方法未能有效考虑个体对群体行为贡献程度的差异性,影响识别性能.为此,本文提出一种针对个体行为特征聚合的注意力池化机制,并依此建立了新型群体行为识别模型,以自底向上的方式同时实现个体行为与群体行为分层识别.首先利用卷积神经网络提取视频中人体图像区块的个体静态特征,并将其作为多层递归神经网络时序模型的输入,从而得到个体动态特征.随后通过注意力池化机制对个体特征完成聚合,得到相应的群体行为特征;最后依托个体、群体行为特征同时完成个体行为与群体行为的识别.未验证所提方法的有效性,本文依托广泛使用的The Volleyball Dataset数据集上开展了一系列实验验证.结果显示,本文所提出的模型取得了较好的分类准确率,分类性能优于当前先进模型.
关键词 群体行为识别; 表示学习; 注意力机制; 深度学习; group activity recognition; representation learning; attention mechanism; deep learning;
计算机
图形图像
论文
Website
Google Scholar
张艳, 谢源, 洪辰, 曲延云, 李睿, 张俊松, 李翠华
中国科学: 信息科学, 2021, 51(3): 383-398
摘要 在神经美学研究中已经证明,中文字体审美偏好的情绪刺激可以通过观察3种偏好(喜欢、不喜欢和中性)之间的事件相关电位(event related potential, ERP)波动获得.本文通过引入一种核化张量奇异值分解的多视角聚类方法分别构建了基于脑电图(electroencephalogram, EEG)和ERP的审美偏好识别模型,通过这些模型首次确认了该结论.本文方法将来自不同频段的数据视为描述中文字体审美偏好的不同视角,通过张量多秩最小化的约束探索所有视角特征的一致性和关联性,并通过之后的聚类获取审美偏好的识别结果.采用多视角无监督聚类方法得到的识别精度达到97.1%.此外,通过输入–扰动关联方法将电极的振幅与不同种类的审美偏好相关联,可视化关键频段组合以及电极之间的关系,分别取出与喜欢、不喜欢、中性最相关的3个电极,包含次相关的6个电极,包含第三相关的9个电极,包含第四相关的12个电极,分别形成4种不同组合的脑电特征.通过比较实验,验证了相对于62个电极信号,上述4种组合方式在字体美学分类上更具有优势,并且最相关的3个电极的组合特征对审美偏好最具判别性.实验结果表明,基于多视角聚类的方法能够解决神经信号与审美偏好的相关分析,并能挖掘出与字体审美偏好最相关的电极.
关键词 中文字体; 审美评价; 计算美学; 事件相关电位; 核化张量奇异值分解; 数据挖掘; Chinese typeface; esthetic evaluation; computational esthetics; event-related potentials; kernelized tensor-SVD; data mining;
计算机
图形图像
论文
Website
Google Scholar
陈成伟, 院旺, 陈攀, 丁守鸿, 谢源, 宋海川, 马利庄
中国科学: 信息科学, 2021, 51(3): 367-382
摘要 近年来,人脸识别技术飞速发展,其主要应用于门禁系统和公共安防系统.然而现有的人脸识别系统容易受到仿冒攻击(也称为呈现攻击),例如尝试使用用户的脸部照片、视频或者伪造的3D人脸去攻击人脸识别系统.这些攻击手段给人脸识别系统带来了极具挑战性的安全问题.因此活体检测技术的研究十分重要,其可以使人脸识别系统免于攻击假脸的安全威胁.目前,大部分活体检测的方法将活体检测任务视作有监督的二分类问题,进而努力充分提取真实人脸和攻击人脸的特征,在单个数据集内部训练和测试可以达到很高的准确率,但是在交叉数据集之间训练和测试往往效果不佳.本文将活体检测任务定义为异常检测任务,并基于此来解决之前活体检测方法存在的泛化能力差的问题.因此本文提出了一种新颖的基于隐空间约束的深度对抗网络,它通过半监督学习的方式进行对抗训练,在此过程中模型不仅仅可以获得正常样本在隐空间中的分布,还可以通过一种惩罚的方式对隐空间中正常样本的特征进行约束,这将带来更加有效和鲁棒的活体检测效果.测试过程中,攻击人脸样本将被视作离群的样本,它们相对于正常样例在隐空间中的表达具有更高的重构差.实验表明提出的模型相较于前沿的半监督异常检测方法具备明显的优势,并且在活体检测跨数据集和单数据集内达到了可比的效果或者目前最好的效果.
关键词 对抗网络; 活体检测; 弱监督学习; 异常检测; 人脸仿冒攻击; adversarial networks; live face detection; semi-supervised learning; anomaly detection; face spoofing attacks;
计算机
图形图像
论文
Website
Google Scholar
方贤忠, 金耀, 黄劲, 鲍虎军
中国科学: 信息科学, 2021, 51(2): 263-278
摘要 六面体网格因其良好的数值性能成为有限元分析等领域中重要的一种离散化方法,而基于标架场导引的重网格化是实现可控六面体网格剖分的重要技术.现有的标架场生成技术由于所获得的标架场往往存在拓扑矛盾,难以运用于纯六面体网格的生成,但较易用于六面体主导混合网格的生成.然而,这种六面体主导网格的质量容易受到标架场旋度的影响.针对这一问题,本文提出了一种三维标架场保向且长度可控去旋方法.该方法通过分析三维向量场的旋度,构造针对四面体网格的离散旋度能量,并将其推广至三维标架场的旋度能量.为保持原标架场方向并控制其长度,引入了表达三维标架场3个子向量场长度伸缩量的标量场,并将新标架场表示为标量场和原标架场的合成,最后通过极小化合成场的旋度得到优化后的标架场.实验结果表明,通过约束标量场的变化范围,能在保持其方向不变的情况下,有效地控制去旋程度;将该标架场运用于已有重网格化方法,可得到方向和密度可控的六面体主导的混合网格.此外,该方法只需求解一个带界约束的二次凸规划问题,鲁棒性强且易于计算.
关键词 三维标架场; 去旋; 长度可控; 六面体主导网格; 3D frame field; curl correction; length-controllable; hexahedral dominant mesh;
计算机
图形图像
论文
Website
Google Scholar
李亚飞, 吴庆顺, 徐明亮, 吕培, 姜晓恒, 朱睿杰, 周兵
中国科学: 信息科学, 2021, 51(2): 247-262
摘要 衡量航母作战性能的重要指标是舰载机出动架次率,而影响舰载机出动架次率的关键因素是舰载机保障作业调度效率.舰载机保障作业调度是指在有限时间、空间和资源约束的前提下合理安排舰载机所需保障作业顺序并高效完成舰载机的作业保障.现有基于最优化方法 (动态规划、线性规划等)和启发式方法 (如遗传算法、粒子群等)的求解策略仅适用于保障作业可预知情况下的作业调度,很难满足高动态作战场景下的实时保障作业调度需求.基于此,本文提出了一种新的基于DQN (deep Q-network)的舰载机保障作业实时调度方法,将舰载机保障作业调度问题建模成部分可观测马尔科夫决策过程(partially observable Markov decision processes)问题,利用全局与长期收益对保障作业调度过程进行优化,并通过离线学习和在线调配的学习决策框架进行解决.经过仿真实验验证,该方法能显著提高舰载机保障作业调度效率并满足实时决策环境的需要.
关键词 舰载机; 保障作业; 实时调度; 强化学习; 仿真验证; carrier-borne aircraft; support operations; real-time scheduling; reinforcement learning; simulations;
计算机
图形图像
论文
Website
Google Scholar
刘畅, 刘小军, 贾金原, 徐识溥, 张乾, 黄晨曦, 黄欣
中国科学: 信息科学, 2021, 51(2): 231-246
摘要 本文面向多种硬件平台提出了一套Web3D实时动态光影的协同式渲染系统,该系统把Web前端的硬件性能作为整个云渲染系统中光影渲染任务分配的关键因素.对于Web前端性能较强的硬件设备,系统分配复杂度较高的光影渲染任务给前端,相应的云后端的渲染负担则有所降低;反之,系统则分配复杂度较低的光影渲染任务给前端,相应的云后端承担大部分的渲染任务.在上述机制的引导下,该系统的前后端部署了4类关键的实时光影渲染算法,最终通过对算法运行帧率、算法所在设备的运行效率以及光影渲染结果等多种数据的分析,验证了部署的合理性.
关键词 云渲染; Web3D; 实时绘制; 动态光影; 全局光照; cloud rendering; Web3D; real-time rendering; dynamic lighting and shadow; global illumination;
计算机
图形图像
论文
Website
Google Scholar
郑雅文, 胡小方, 周跃, 罗丽, 段书凯
中国科学: 信息科学, 2020, 50(12): 1850-1866
摘要 细胞神经网络(cellular neural network, CNN)具有简单的局部互联结构和高速并行处理能力,是构造人工视网膜的基础模型,可被应用于机器视觉中图像处理时的图像增强等方面.然而,现有的此类图像增强方法尚存在一些不足,例如,在处理实际复杂图像时,采用固定模板难以取得理想效果;而且,未能模拟人类视觉系统的全局和局部自适应调节特性,缺乏仿生考虑.因此,本文融合自适应三高斯(tri-Gaussian)理论和纳米信息器件忆阻器,提出了一种用于图像增强的新型仿生自适应忆阻细胞神经网络.其中,基于忆阻器的可编程性、非易失性、突触可塑性等优点,构建忆阻细胞神经网络架构.基于神经元感受野三高斯模型,利用高斯核函数和细胞神经网络的图像处理特征,提出对应的仿生自适应图像增强模板设计算法.最后,分别以灰度和彩色图像为例进行了图像增强实验和对比分析,结果表明,提出的仿生自适应忆阻细胞神经网络能够显著提高图像的全局亮度、局部对比度和清晰度.本研究可为细胞神经网络提供自适应模板设计及实现方案,提升细胞神经网络的仿生特性和硬件实现的可行性,并为图像增强等智能图像处理提供新思路.
关键词 细胞神经网络; 图像增强; 自适应三高斯模型; 仿生图像处理; 忆阻器; cellular neural networks(CNN); image enhancement; adaptive tri-Gaussian model; biomimetic image processing; memristors;
计算机
图形图像
论文
Website
Google Scholar
张修宝, 林子原, 田万鑫, 王艳, 沈海峰, 叶杰平
中国科学: 信息科学, 2020, 50(7): 1110-1120
摘要 日常生活中,面对经呼吸道传播的传染性疾病或厂矿生产过程中产生的扬尘沙土,人们佩戴口罩进行防护可保护身体健康和生命安全.人脸佩戴口罩的自动化识别可以有效监督人们佩戴口罩,是抑制疾病快速传播和保护身体健康的重要技术手段.对于生活和生产中的口罩佩戴识别的需求,本文提出了基于深度学习的人脸检测和口罩佩戴识别相结合的方法.该方法在人脸检测中利用特征融合金字塔,结合空间和通道注意力学习,以及分割分支进行神经网络弱监督学习.另外针对检测后的人脸子图像,采用图像分类的方法实现快速识别,并加入注意力学习机制,增强模型对口罩区域特征的学习.利用近20万的公开和企业自有数据,并采用数据增强等方法,在全天候自然场景下取得了99.50%的识别准确率.该技术已广泛应用于滴滴出行实际业务中,日均处理百万数量级的请求.该服务已对外开放,关键算法已开源,从而使其发挥更大的应用价值和社会价值.
关键词 口罩佩戴识别; 人脸检测; 人脸属性识别; 特征金字塔; 注意力学习; mask-wearing recognition; face detection; face attribute recognition; feature pyramid; attention;
计算机
图形图像
论文
Website
Google Scholar
缪永伟, 刘家宗, 陈佳慧, 舒振宇
中国科学: 信息科学, 2020, 50(5): 675-691
摘要 针对三维点云形状修复补全中难以保持形状精细结构信息的问题,借助于生成对抗网络框架,本文提出了一种自动修复补全三维点云形状的神经网络结构.该网络由生成器和判别器构成.神经网络的生成器采用编码器–解码器结构,以缺失的三维点云形状作为输入,首先通过输入变换和特征变换对齐输入点云数据的采样点位置与特征信息;然后借助权共享多层感知器对各采样点提取局部形状特征并利用最大池化层与多层感知器编码提取出采样点的特征码字;其次将采样点特征码字加上网格坐标数据,解码器使用2个连续的三层感知器折叠操作将网格数据转变成点云形状的缺失补全数据;最后将缺失补全数据与点云输入数据合并,得到完整的三维点云形状.神经网络的判别器则接收真实的完整点云形状数据和生成器生成的完整点云形状数据,并利用与生成器相同的编码器结构判别出点云形状数据的真假并反馈以不断优化生成器,最终使生成器生成足以"以假乱真"的点云形状数据样本.实验表明,针对形状缺失的稠密点云和稀疏点云数据,本文方法在修复补全形状缺失部分的同时能有效保持输入点云形状的精细结构信息.
关键词 生成对抗网络; 编码器–解码器结构; 点云数据; 形状补全; 折叠操作; generative adversarial network(GAN); encoder-decoder structure; point cloud; shape completion; folding operation;
计算机
图形图像
论文
Website
Google Scholar
施沫寒, 王志海
中国科学: 信息科学, 2020, 50(3): 438-460
摘要 步态特征识别是生物特征识别的一种,在大量实际场景中有广泛的应用.目前,基于深度学习的方法在步态识别任务中表现出较好的准确率.但是,在对机器学习的研究中,人们不仅希望得到精确的预测,还希望算法对识别结果进行解释,以便人们理解实际问题中的关键.深度神经网络的黑盒属性使得解释其识别依据非常困难.在已有的步态识别文献中,关注可解释性的研究尚处于空白状态.另外,深度神经网络需要大量数据来学习模型参数,在问题规模较小时难以有效地在未见数据上泛化.本文探索了一种兼具准确性和可解释性的步态识别方法.将步态特征表示为多维时间序列,使用一种基于Shapelet的时间序列分类方法进行步态识别. Shapelet是时间序列中最具有辨别性的子序列,基于Shapelet的时间序列分类方法能够提供较好的可解释性,同时可以提供较高的准确率.我们在CASIA-B数据集上进行了实验,和几种较新的深度学习方法进行了比较.实验表明,本文提出的方法在较小规模的数据集上能够提供与深度神经网络接近的准确率.与此同时,还能详细具体地解释模型的决策依据,即哪些特征在视频哪几帧的表现对某个个体而言最具辨别性.
关键词 步态识别; 时间序列; Shapelet; 随机森林; 可解释性; gait recognition; time series; Shapelet; random forest; interpretability;
计算机
图形图像
论文
Website
Google Scholar
王国芬, 黄永东
中国科学: 信息科学, 2020, 50(2): 239-260
摘要 医学图像融合的目的是将多幅多模态医学图像的信息整合到一幅图像上,此图像有助于临床诊断,帮助医生精确观察细微病变,缩短病人的治疗周期.本文提出了一种新的解剖图像和功能图像的融合算法,选取了局部拉普拉斯滤波(local Laplacianfiltering, LLF)作为融合过程的分解工具,该工具在增强细节的同时保护边缘,保证解剖图像的细节信息不被功能图像的颜色信息遮盖.首先,利用LLF将原图像分解为近似图和一系列细节图.其次,对于近似图,结合区域能量和边缘能量提出一个改进的局部能量取大的融合规则;对于细节图,采用参数自适应的简化脉冲耦合神经网络(parameteradaptive simplified pulse coupled-neural network, PA-SPCNN)模型进行细节图融合,选取改进的拉普拉斯和(novel sum-modified-Laplacian, NSML)与彩色显著特征信息(color saliency feature, CSF)分别作为解剖图像和功能图像所对应的PA-SPCNN模型的外部刺激输入.最后,使用逆LLF变换获得融合图像.仿真实验表明本文所提算法在主观评价和客观评估方面与已有算法相比具有一定优势.
关键词 图像处理; 图像融合; 医学图像处理; 局部拉普拉斯滤波; 脉冲耦合神经网络; 拉普拉斯和; 彩色显著特征; 边缘能量; image processing; image fusion; medical image processing; local Laplacian filtering; pulse-coupledneural-network; novel sum-modified-Laplacian; color saliency feature; edge energy;
计算机
图形图像
论文
Website
Google Scholar
朱建章, 王栋, 卢湖川
中国科学: 信息科学, 2020, 50(1): 128-150
摘要 判别相关滤波跟踪算法通过对中心目标块(唯一准确正样本)循环移位获取训练集,依赖潜在样本周期延拓假设,使得模型训练和检测可以通过快速傅里叶变换高效完成,然而整个学习过程没有对真正的背景信息进行建模.背景感知相关滤波(BACF)跟踪算法利用一个二进制掩码矩阵通过密集采样的方法获取真正的正、负样本对目标外观进行建模,然而BACF算法在学习相关滤波器时并没有考虑滤波器的时间一致性和空间一致性信息,当目标出现外观突变时,学习到的相关滤波器将会偏向背景而发生漂移.为了解决学习到的相关滤波器适应连续帧之间的外观突变问题,本文在基准BACF算法框架下引入时间一致性约束项和空间一致性约束项,提出了学习时空一致性相关滤波(TSCF)跟踪算法.时间一致性约束项在时间序列意义上起到平滑多通道相关滤波的作用;空间一致性约束项在空间分布意义上平滑多通道相关滤波,使得学习到的相关滤波能量分布更加均匀.本文的TSCF模型有闭式解,采用共轭梯度下降法迭代逼近模型的最优解,且优化过程利用循环矩阵性质转化到傅里叶域快速求解,有效降低计算大型矩阵的代价.本文的TSCF算法跟踪结果在TB100公开数据库上显示,距离精度较基准BACF算法提升了5.5%,成功率曲线图线下面积(AUC)提升了4.3%,纯手工特征跟踪性能在TB100数据库上100个视频的跟踪距离精度达到0.879, AUC为0.664,结果展示本文的TSCF算法在遇到诸如短时间遮挡和面内旋转或面外旋转等挑战性问题时具有一定的鲁棒性和有效性.
关键词 视觉跟踪; 相关滤波; 时空一致性; 正则化; 共轭梯度下降; visual tracking; correlation filter; temporal-spatial consistency; regularization; conjugate gradient descent;
计算机
图形图像
论文
Website
Google Scholar
姜枫, 顾庆, 郝慧珍, 李娜, 胡修棉
中国科学: 信息科学, 2020, 50(1): 109-127
摘要 砂岩薄片鉴定是矿物学和采矿工程中的一个重要步骤,其基础是将砂岩薄片图像包含的矿物颗粒分割到独立区域.不同于一般图像分割问题,砂岩薄片图像中包含大量矿物颗粒,且相邻颗粒之间边界模糊,通用的图像分割方法难以适用.本文利用多角度砂岩薄片图像,使用卷积神经网络和模糊聚类技术,提出一种3阶段颗粒分割方法.第1阶段,将输入的多角度砂岩图像预分割成超像素集合.第2阶段,根据砂岩矿物特点构建卷积神经网络RockNet,先使用带标签的砂岩矿物颗粒图像库训练RockNet,然后将之用于提取超像素语义特征.第3阶段,提出区域合并方法 FCoG,该方法融合多特征用于聚类和合并超像素,并生成最终的矿物颗粒.对采集自多个地区和不同地质年代的砂岩薄片图像数据集进行实验,结果表明本文方法的有效性,其性能明显优于其他分割方法.
关键词 砂岩薄片图像; 图像分割; 神经网络; 模糊聚类; 特征提取; sandstone thin section images; image segmentation; neural networks; fuzzy clustering; feature extraction;
计算机
图形图像
论文
Website
Google Scholar
陈健堃, 彭凌霄, 仇晓兰, 丁赤飚, 吴一戎
中国科学: 信息科学, 2019, 49(12): 1606-1625
摘要 建筑物三维重建在城市规划、灾害监测、智慧城市等领域有重要应用,是计算机视觉、摄影测量、遥感等领域研究的重要课题.由于SAR成像机理的特殊性和复杂性,基于SAR图像的建筑物三维重建难度很大,现有方法的适用性和自动化程度都亟待提升.本文构建了基于深度学习与雷达成像机理结合的SAR图像建筑物检测及三维重建整体框架,并提出了基于耦合等效复数卷积神经网络的SAR图像建筑侧立面检测方法,基于RaySAR的建模仿真及点云生成方法,以及基于3D生成网络的SAR建筑物三维重建方法,利用TerraSAR-X与GF-3高分辨率SAR图像进行实验,得到了较好的三维重建结果.本文方法为SAR图像目标三维重建提供了新的技术途径,是SAR目标三维重建的有益尝试.
关键词 SAR; 深度学习; 语义分割; 点云生成; 建筑物检测; 三维重建; SAR; deep learning; semantic segmentation; point cloud generation; building detection; 3D reconstruction;
计算机
图形图像
论文
Website
Google Scholar
王相海, 赵晓阳, 朱毅欢, 宋若曦, 宋传鸣
中国科学: 信息科学, 2019, 49(6): 708-725
摘要 近年来,非下采样Shearlet变换(non-subsampled shearlet transform, NSST)因其具有各向异性,多方向捕捉性的同时,还兼具平移不变性,从而在图像恢复过程中发挥着重要的稳定作用.本文首先对图像NSST子带内系数关系、子带间系数的"父子关系"和"兄弟关系" 3方面进行分析,获得子带内系数具有稀疏性、子带间"父子关系"和"兄弟关系"系数均具有聚集性和传递性的结论.在此基础上提出一种基于系数多状态关联的隐Markov树模型(multi-state non-subsampled shearlet transform hidden Markov tree, M-NSST-HMT),该模型通过将NSST子带间系数的"父子关系"和"兄弟关系"作为共同指导子带间系数传递的状态来估计重构系数,并利用两种状态关联的互信息来对重构系数进行整合.最后将所提出的模型应用于图像去噪并取得良好的去噪效果,结果表明所提出的模型较传统HMT模型能够更好地揭示图像NSST变换后子带内和子带间系数的关系,并提高系数的预测准确性.
关键词 非下采样剪切波变换; 混合Gauss模型; 隐Markov树模型; 系数多状态关联; 图像去噪; 支持向量机; non-subsampled shearlet transform; Gaussian mixture model; hidden Markov tree model; multi-state coefficients association; image denoising; support vector machine;
计算机
图形图像
论文
Website
Google Scholar
李毓君, 方林聪, 汪国昭
中国科学: 信息科学, 2019, 49(6): 698-707
摘要 本文讨论七次PH (Pythagorean hodograph)曲线的G~2[C~1] Hermite插值问题. PH曲线是具有有理形式的等距线的一类多项式参数曲线,其弧长可精确计算,因此在CAD (computer aided design)中有着广泛的应用.本文采用平面参数曲线的复数表示形式,根据导矢曲线因式分解得到的多项式因子次数不同,将七次PH曲线分为3类.第1类七次PH曲线都是正则曲线,且其G~2[C~1]Hermite插值方法已经被研究.本文研究另外两类七次PH曲线的构造方法,并指出对于给定的初始条件,存在不超过6条的偶数条第2类七次PH曲线;而第3类七次PH曲线的存在性不仅对初始条件有约束,而且可以通过用户指定一个具有几何意义的实参进行交互构造.本文最后通过实例构造了这两类曲线对六分之一圆弧曲线的逼近.
关键词 Bézier曲线; 等距曲线; 七次; 几何连续; Hermite插值; Bézier curve; offset curve; septic; continuous; Hermite interpolation;
计算机
图形图像
论文
Website
Google Scholar
徐海月, 姚乃明, 彭晓兰, 陈辉, 王宏安
中国科学: 信息科学, 2019, 49(4): 450-463
摘要 多姿态人脸图像正面化可以缓解头部姿态变化对人脸分析任务的影响.以往直接从多姿态人脸图像合成正面人脸图像的方法存在细节特征缺失的问题.针对这一问题,本文提出一种基于编解码网络的多姿态人脸图像正面化方法——多任务卷积编解码网络(MCEDN).该方法引入正面基础特征网络合成正面人脸基础特征,并在此基础上融合编码网络提取的多姿态人脸局部特征进行细节补偿,最终合成更加清晰的正面人脸图像.利用多任务学习机制建立端到端模型,统一局部特征提取、正面基础特征解析、正面图像合成3个模块,通过共享参数提升整个模型的效果.与已有方法对比, MCEDN在多个数据集上都可以合成结构稳定、细节清晰的正面人脸图像.我们直接使用合成的正面人脸图像进行人脸识别和表情识别,识别准确率达到先进水平,这表明MCEDN可以有效保留人脸细节特征,支持人脸分析任务.
关键词 人脸正面化; 卷积神经网络; 编解码网络; 多任务学习; 人脸识别; 表情识别; face frontalization; convolutional neural network; encoder-decoder network; multitask learning; face recognition; facial expression recognition;
计算机
图形图像
论文
Website
Google Scholar
王鹏宇, 水盼盼, 余锋根, 甘渊, 刘琨, 张岩, 孙正兴
中国科学: 信息科学, 2019, 49(4): 436-449
摘要 近些年来,卷积神经网络框架在二维图像的语义分割、分类、检索等领域取得了非常好的效果.但是由于三维模型结构的复杂性与不规律性,卷积神经网络的卷积和池化操作却无法直接应用在三维模型上.为了发挥深度学习框架在二维图像分析领域积累的技术优势,本文采用基于多视角投影的方法来完成三维模型分类的任务.然而现有的基于多视角投影的三维模型分类方法大多采用固定视角,所采集到的多视角下模型投影渲染图中存在大量的信息冗余,对结果造成一定的干扰.本文提出了一种新型的多视角卷积神经网络框架,在网络训练过程中自动判别每个视角的贡献度,舍弃冗余视角的信息,从而提取出最能表征模型类别的特征,提高了网络的鲁棒性.此外,本文将基于视点熵的最佳视角选择方法引入三维模型分类领域,相比于固定视角方法,本文方法能更多地保留模型的细节信息,同时不需要模型的朝向对齐.通过在ModelNet10和ModelNet40数据集上的实验,验证了将基于视点熵的视角选择方法应用于三维模型分类,以及本文提出的基于视角判别的多视角信息融合方法的合理性和优越性.实验结果表明,本文方法的分类准确性也优于现有的基于固定多视角投影的三维模型分类方法.
关键词 三维模型; 视角选择; 视点熵; 卷积神经网络; 深度学习; 3D model; viewpoint selection; viewpoint entropy; convolutional neural network; deep learning;
计算机
图形图像
论文
Website
Google Scholar
王丽君, 王党校, 郑一磊, 张玉茹
中国科学: 信息科学, 2019, 49(4): 422-435
摘要 高难度精细触觉交互任务依赖于注意资源的高强度激活,研究触觉通道和注意力状态的关系不仅有利于理解人类感知与认知的交互机制,对于触觉模态脑机交互系统的设计也具有重要应用价值.本文构建了融合多点接触力反馈和沉浸式视觉反馈的虚拟现实交互环境,以高精度力位协同控制任务为对象提出了注意力状态的客观监测方法.将力、位置两个模态的容许误差作为任务难度的调控变量,测量了用户在每个模态内的操作绩效.结合用户主观评估数据,证实了该任务可以有效激活注意力资源,并能够作为注意力"示波器",实现高时间分辨率的注意力水平和注意力焦点的客观监测.本文实验结果表明,基于触觉通道的力位协同控制任务能够实现注意力状态的客观测量,为后续构建基于神经生理信号的注意力机制研究提供了行为学基准.
关键词 虚拟现实; 触觉交互; 力位协同控制; 注意力状态; virtual reality; haptic interaction; collaborative force-position control; attentional states;
计算机
图形图像
论文
Website
Google Scholar
艾子豪, 胡永豪, 闫丰亭, 张惠娟, 王冬青, 青胜蓝, 朱合华, 贾金原
中国科学: 信息科学, 2019, 49(4): 405-421
摘要 基于移动互联网浏览器实现地铁站逃生模拟训练是一种高效率的火灾逃生训练方式.然而,由于地铁站规模庞大且火灾情景复杂,在线逃生路径规划仿真平台模型因数据规模大,其在基于有限网络带宽传输以及渲染能力较弱的浏览器上运行时,速度将非常缓慢甚至无法运行.为解决此问题,本文针对轻量级Web3D地铁火灾逃生路径在线规划平台实时在线关键技术进行了研究.首先,针对大规模地铁站BIM静态场景数据,通过语义和体素化成分检验的轻量化方法对其进行了轻量化处理.同时,针对大规模虚拟化身的在线渲染,基于数据拆分并灵活组合思想,通过对虚拟化身的几何体信息和虚拟化身的动画数据进行数据管理,实现了大规模虚拟化身在线渲染的轻量化处理,进而实现了轻量级人群可视化;其次,针对动态烟气数据,提出了基于烟气冗余消除和归一化的轻量化处理方法,并基于精灵纹理粒子系统构建了轻量级烟气场景,实现了轻量级烟气可视化;最后,基于上述一系列轻量化处理的Web3D地铁场景中的逃生路径规划问题研究,本文提出了基于虚拟足迹聚类的蚁群优化算法eAACO (evacuation based on adaptive ant colony optimization),该算法通过VR设备获取真实人群逃生路径,实现对路径数据筛选和聚类以形成骨干路径,并与蚁群算法(ACO,ant colony optimization)相结合,设计了逃生路径规划的最优方案.实验表明,上述关键技术的实现较好解决了大规模地铁站火灾逃生路径规划Web3D模拟平台的实时在线处理问题.
关键词 Web3D; 地铁站BIM; 轻量级烟气可视化; 轻量级人群可视化; 虚拟足迹聚类; 火灾逃生路径规划; 蚁群优化算法; Web3D; metro BIM; lightweight smoking visualization; lightweight crowding visualization; virtual traces clustering; online planning of fire evacuation path; ant colony optimization;
计算机
图形图像
论文
Website
Google Scholar
王嘉骥, 苗振江, 张雪艳, 张强
中国科学: 信息科学, 2019, 49(2): 229-244
摘要 拉班舞谱是一种用于记录人体动作的符号记录体系,它是保护、继承和传播民族民间舞蹈及其他动作艺术的有力工具.目前,拉班舞谱的获取主要依靠专业人员手工记录,效率较低.本文基于三维人体运动捕捉数据,通过识别与拉班符号相对应的元素动作,提出了一种自动生成拉班舞谱的方法.方法的主要部分包括运动分割和元素动作分析.在运动分割中,利用速度阈值方法将人体运动捕捉数据分割成与舞谱符号对应的元素动作片段.然后,将动作片段与拉班舞谱的节奏相匹配,从而确保生成的舞谱符号更加规范和准确.在元素动作分析中,拉班舞谱将动作区分为支撑动作和非支撑动作,考虑到两类动作性质不同,因此本文采用两种方法分别对支撑与非支撑动作进行有针对性的分析.实验表明,本文的方法实现了将运动捕捉数据表示的舞蹈动作转换为数字化的拉班舞谱,并且自动生成的效率远高于手工记录.所以该方法可以快速记录濒临失传的民族舞蹈,为保护和传承动作类非物质文化遗产做贡献.
关键词 运动捕捉; 拉班舞谱; 运动分割; 元素动作分析; motion capture; Labanotation; motion segmentation; unit movement analysis;
计算机
图形图像
论文
Website
Google Scholar
夏梦, 张荣, 彭韧, 于金辉
中国科学: 信息科学, 2019, 49(2): 216-228
摘要 与基于三维模型和照片生成浮雕的技术相比,黑白线描图中没有物体的三维信息,因此用黑白线描图辅助生成浮雕面临新的研究挑战.本文面向非物质文化遗产唐卡,提出一个用黑白线描图生成唐卡浮雕的方法.本文主要贡献是用物体区域的灰度控制图以及边界种子作为约束求解Poisson方程得到物体浮雕表面高度.具体将浮雕模型分为低频、中频和高频3个分量.低频分量指线描图中人物躯干以及四肢在衣服覆盖下形成的隆起趋势,中频分量指线描图中人物的四肢局部隆起,这两部分的高度用距离变换约束的Poisson扩散获得.高频分量指物体的细节,例如人的眉毛、背景中的云、山、花瓣,以及饰品等,它们的高度通过边界约束的Poisson扩散生成.最后将浮雕低频分量、中频分量和高频分量的高度图叠加并将其转换成面片模型获得完整浮雕模型.文中给出的图例验证了我们方法的有效性.
关键词 非物质文化遗产; 唐卡; 线描图; Poisson扩散; 浮雕; intangible cultural heritage; Thangka; line drawing; Poisson equation; relief;
计算机
图形图像
论文
Website
Google Scholar
张浩, 徐丹
中国科学: 信息科学, 2019, 49(2): 204-215
摘要 图像不仅可以传达丰富的语义信息进而直接表达人的情感,也可以在情感层面影响他人,艺术作品更是如此.人们对于不同的视觉刺激有着不同的情绪反应,所以理解图片所包含的情感是非常重要的.本文通过微调现有的卷积神经网络模型,以少数民族绘画图像数据为研究对象,分析了艺术绘画的色相、亮度、饱和度,以及对比度对神经网络模型情感分类的影响,并在公共数据集Twitter image dataset上取得了超过目前先进水平3.4%的精度提升.最后,本文提出了一种相关任务的预训练策略,对少数民族绘画的情感分类任务有明显的提升,并通过可视化结构对实验结果进行了分析.
关键词 少数民族绘画; 图像情感; 卷积神经网络; 微调; 可视化; ethnic painting; image emotion; convolutional neural network; ?ne-tuning; visualization;
计算机
图形图像
论文
Website
Google Scholar
陈佳舟, 郑佳, 卢书芳, 缪永伟, 钟凡
中国科学: 信息科学, 2019, 49(2): 188-203
摘要 民族文化图案的分割是数字化分析民族文化的关键步骤之一.现有的图像分割方法虽然能够较好地分割自然图像,但分割民族文化图案时依然存在着难以保持主要结构和依赖大量手动交互等问题.本文提出一种基于多层次块匹配的民族图案分割协同优化方法.首先,充分利用民族文化图案的重复性特点,通过全局块匹配自动检测多个相似目标图案;接着,通过局部块匹配估计图案之间的相对朝向,再利用带约束的块匹配建立准确的稠密对应;最后,构建分割图元之间的协同优化模型,获得保持结构特征的分割结果.本文方法能够将相似图案自动分割为相互关联的细节图元,不仅交互少、精度高,还能改善矢量化等民族文化图案数字化分析的质量,大量的实验证明了其有效性.
关键词 民族图案; 图像分割; 协同优化; 块匹配; 矢量化; ethnic pattern; image segmentation; co-optimization; patch match; vectorization;
计算机
图形图像
论文
Website
Google Scholar
赵海英, 陈洪, 贾耕云, 郑桥, 王绍杰
中国科学: 信息科学, 2019, 49(2): 172-187
摘要 民族文化图案是中华民族宝贵财富,对民族文化图案进行语义标注与分析,是挖掘其文化价值,进行再创作与应用的基础.本文以此为研究对象,在多分类字典学习的基础上,提出了一种多标签字典学习标注算法SCMIDL.算法结合字典不相关性与系数相似性,有效提高了多标签标注性能,实现了民族文化图案的自动标注.在收集并构建的三类民族文化图案数据集进行多标签语义标注实验,实验结果验证了算法的有效性.
关键词 民族文化图案; 字典学习; 多标签; 图像标注; 相关性; national cultural pattern; dictionary learning; multi label; image annotation; correlation;
计算机
图形图像
论文
Website
Google Scholar
喻扬涛, 徐丹, 钱文华
中国科学: 信息科学, 2019, 49(2): 159-171
摘要 本文针对蜡染冰纹和蜡染布料染色两个关键工作进行模拟.使用FIT(?ood identity transform)算法,使模拟具有一定实时性;提出复合交点距离模拟交点加粗效果;使用形态修正、扰动等方法改善冰纹形态及视觉效果.不考虑布料结构,基于乘性模型,尝试多色染色模拟.选择平织纹棉布料,建立布料模型,建立扩散微分方程,对蜡染图案及冰纹进行单色染色模拟.在染色中使用椭圆模型并引入Perlin噪声,有效模拟了晕染现象.实验表明,本文方法能够模拟手工蜡染作品的基本特征.
关键词 蜡染; 距离变换; Fick第二定律; 扩散微分方程; Perlin噪声; batik; distance transform; Fick's second law; diffusion differential equation; Perlin noise;
计算机
图形图像
论文
Website
Google Scholar
李学龙, 陈穆林, 王琦
中国科学: 信息科学, 2018, 48(9): 1227-1241
摘要 群组行为分析是光学影像序列分析中的一项重要课题,在近年来引起了人工智能领域研究人员的广泛关注.与行人个体相比,群组能提供更高层的语义表示,为分析人群运动模式提供基础.本文将人群影像序列中的影像块作为研究对象,提出了一种基于多视角聚类的群组行为分析方法,对运动模式不同的群组进行区分,主要研究内容有:(1)提出了基于特征点的影像块构图方法,从交互关系、空间位置、运动方向分布,以及运动规律等方面衡量影像块之间的关系;(2)提出了一种多视角聚类方法,通过融合多种特征对每个影像块分配类标签,并引入图多样性正则项以避免特征冗余;(3)提出了一种类合并方法,根据类内特征点的运动方向和类中心位置坐标,对关联度较高的类别进行合并,自动确定最终群组数目.CUHK人群数据集上的实验结果证明了该方法能够准确划分出影像数据中的群组.另外,与现有方法相比,本文提出的多视角聚类方法也在不同数据集上取得了较好的实验结果.
关键词 人群分析; 群组行为分析; 聚类算法; 图聚类; 多视角聚类; crowd analysis; group behavior analysis; clustering; graph clustering; multiview clustering;
计算机
图形图像
论文
Website
Google Scholar
周明非, 汪西莉
中国科学: 信息科学, 2018, 48(8): 1022-1034
摘要 本文提出了一种遥感图像目标检测框架,克服了遥感图像中由于目标较小且背景复杂造成的目标检测任务中的困难.所提框架包含两种深层神经网络模型,分别是全卷积网络模型和卷积神经网络模型.首先,使用全卷积网络提取遥感图像中可能存在待检测目标的候选区域,避免了对图像的穷举搜索.其次,使用深层卷积神经网络对候选区域分类,通过提取高层特征提高分类正确率.然后,提出了新的遥感图像目标检测数据集,模型的训练全部使用图像级的标签,提出简化弱监督训练方法解决遥感图像目标检测领域目标级标签缺乏的问题.最后,提出一种候选框融合算法,合并重叠候选框的同时调整候选框的位置.提出的模型在本文所提数据集satellite aircrafts dataset和公开数据集aircrafts dataset上进行了测试.实验结果表明,提出的目标检测框架和其他使用深层神经网络的框架相比提高了目标检测的正确率,并具有更高的检测效率.
关键词 遥感图像; 目标检测; 卷积神经网络; 全卷积网络; 弱监督训练; remote sensing image; object detection; convolutional neural networks; fully convolutional networks; weakly supervised training;
计算机
图形图像
论文
Website
Google Scholar
周乐, 肖斌, 史文明, 李伟生
中国科学: 信息科学, 2018, 48(8): 1000-1021
摘要 基于变换技术的图像融合是多聚焦图像融合中常采用的方法,融合效果明显,并具有较强的抗噪能力,但时间复杂度普遍较高.本文提出了一种基于离散Tchebichef变换和聚焦评价的多聚焦图像融合方法,根据离散Tchebichef多项式变换和相关分析(correlation)之间的联系,利用少量低阶离散Tchebichef多项式变换系数得到图像块的聚焦评价,然后对输入的多聚焦图像按聚焦评价最大原则进行融合.实验结果表明,该方法在保证融合效果的同时,有效地降低了融合时间,并对噪声有较强的鲁棒性.
关键词 多聚焦图像融合; 离散Tchebichef变换; 聚焦评价; 相关分析; 正交变换; multi-focus image fusion; discrete Tchebichef transform; focus measure; correlation; orthogonal transform;
计算机
图形图像
论文
Website
Google Scholar
刘小军, 贾金原
中国科学: 信息科学, 2018, 48(3): 274-292
摘要 当今,使用手机网页来访问大规模建筑环境逐渐被人们所追求.BIM(building information modeling)是新一代智能建造的核心技术.本文以其主流格式IFC(industry foundation classes)作为输入数据格式,提出一套面向手机网页的大规模Web BIM场景实时漫游算法.与图形学领域的可视化程序相比,该方法不只注重可视化渲染时的面片级处理,更是在遵从建筑语义的前提下,以建筑构件为单位,对大规模Web BIM场景进行轻量化处理.方法主要从构件实例冗余、构件及空间混合索引、多粒度数据动态装/卸载策略3方面对场景数据量、组织结构、动态数据管理进行优化,并集成到原型系统.实验表明本文方法的去冗比例达70%左右,原型系统的FPS能保持在30左右,内存损耗约400 MB,能较稳定、流畅地在手机网页上进行大规模Web BIM场景的实时漫游.
关键词 手机Web3D; BIM/IFC; 轻量化处理; 建筑空间分析; 索引结构; mobile web3D; BIM/IFC; lightweight; building space analysis; index structure;
计算机
图形图像
论文
Website
Google Scholar
黎吉国, 王悦, 张新峰, 马思伟
中国科学: 信息科学, 2018, 48(3): 261-273
摘要 随着鱼眼相机逐渐成为全景视频的主要采集设备,面向鱼眼图像的高效全景拼接技术也得到越来越多的关注.为了解决镜头间亮度差异造成的拼接视频质量下降的问题,本文提出了一种基于非均匀采样直方图的亮度补偿算法.该算法根据全景图像在不同纬度空间采样率变化的特点对相邻图像的重叠区域进行非均匀采样,构成统计直方图,通过直方图匹配实现图像间的亮度补偿.此外,考虑到图像亮度分布对拼接图像质量的影响,本文根据重叠区域图像亮度直方图提出了一种新的自适应基准图像选择方法,基于该方法得到的基准图像可以有效提高全景视频的质量,该方法充分考虑了鱼眼镜头的畸变特性,不要求拼接的图像之间精确配准,能够适应不同的光照条件.实验表明,本文提出的算法在保证全景视频质量的同时,有效地降低了亮度补偿的复杂度,从而可以应用于基于鱼眼镜头的全景实时视频拼接系统.
关键词 图像处理; 虚拟现实; 直方图匹配; 鱼眼镜头; 视频拼接; image processing; virtual reality; histogram matching; fisheye lens; video stitching;
计算机
图形图像
论文
Website
Google Scholar
陆炎, 张和东, 刘利刚
中国科学: 信息科学, 2018, 48(3): 248-260
摘要 本文提出一套具有普适性、高效性的三维人脸迁移系统,能够简单、快速地实现带有纹理的三维网格角色模型之间的面部迁移.主要特点是对大部分三维角色均有很好的迁移效果.使用网格Laplace进行迁移面部的几何变换和变形保证几何细节的相似性,使用Poisson图像融合与色差优化技术结合的方法保证面部纹理色调的一致性和平滑过渡.配合人脸迁移系统搭建一套基于深度相机的自动人脸三维扫描系统,可自动快速重建出带有高清纹理贴图、较规整的三维人脸网格.较之前的工作,主要贡献是将人脸迁移对象从二维图像提升到三维模型,并且两个系统无缝衔接,形成了一套自动化程度很高的三维人脸迁移应用.
关键词 人脸迁移; 人脸扫描; 深度相机; 网格Laplace; 纹理融合; face transplanting; face scanning; depth camera; mesh Laplace; texture blending;
计算机
图形图像
论文
Website
Google Scholar
何高奇, 江东旭, 金祎, 陈琪, 卢兴见, 徐明亮
中国科学: 信息科学, 2018, 48(3): 233-247
摘要 人群仿真已经成为疏散演练、安全监控等重要应用领域的关键支撑技术,但是复杂的个体心理、个性特征,以及个体间的相互影响对人群仿真的真实感提出了挑战.本文从用户的安全心理特征和运动速度特征出发,研究个体在拐角处的运动轨迹和避碰行为的真实感.首先,将影子障碍物模型分别转化为ORCA(optimal reciprocal collision avoidance)半平面和期望速度,分别提出了两种影子障碍物和ORCA模型的结合方法.然后,通过提出影子障碍物的手动生成方法,处理任意角度的拐角以及一些非封闭墙面的情况.基于上述方法,融合行为模拟和物理模拟技术,提出基于速度的人群仿真框架,并对复杂场景以及大规模人群进行实验分析.最后,将上述方法应用在地铁站环境的复杂场景,并采用Unity3D引擎进行真实感渲染,在仿真效果和计算效率两方面与现有的社会力模型进行比较.实验结果表明,本文提出的结合影子障碍物和ORCA模型的人群仿真方法计算效率高、真实感强,具有较好的应用前景.
关键词 人群仿真; 影子障碍物模型; ORCA模型; Unity3D; 真实感渲染; behavior simulation; shadow obstacle model; ORCA model; Unity3D; scene realistic rendering;
计算机
图形图像
论文
Website
Google Scholar
郭文, 游思思, 高君宇, 杨小汕, 张天柱, 徐常胜
中国科学: 信息科学, 2018, 48(1): 60-78
摘要 传统的基于检测的跟踪方法虽然具有较好的鲁棒性,但是这种直接将目标与背景简单分类的方式不能合理地考虑跟踪目标与背景的结构相对关系,而这种相对结构判别性信息的缺乏使得跟踪算法极易发生跟踪漂移,为了缓解这种问题,本文提出了一个基于深度相对度量学习的视觉跟踪方法.利用一个对称且权值共享的深度卷积神经网络构建深度相对度量学习模型,通过这个模型来挖掘跟踪目标在大尺度的图像块里的结构相对关系,然后在Bayes跟踪框架下利用这种相对度量最大值确定跟踪目标,整个跟踪算法简洁有效.通过在跟踪的基准视频序列库上的实验结果验证了本文算法在跟踪精度和跟踪成功率上的高性能.
关键词 相对属性; 度量学习; 卷积神经网络; 视觉跟踪; relative attribute; metric learning; convolutional neural network(CNN); visual tracking;
计算机
计算机理论
论文
Website
Google Scholar
陈宏崟, 邓小铁, 孔雨晴, 陆宇暄
中国科学: 信息科学, 2022, 52(6): 992-1001
摘要 创作者经济的兴起以及相应去中心化平台的搭建加速了权力向个体创作者的转移,然而由于去中心化平台缺乏中心内容审查和监管,创作者可能滥用权力,传递可能造成社会损害的信息.已有的去中心化审查机制缺乏对创作内容社会损害的严谨刻画,同时对于该问题的解决方案也缺乏相应的理论支撑.我们提出了一套去中心化平台的审查机制:创作者上传的作品将首先由去中心化的审查者进行损害评估,根据评估结果,创作者在上传作品的同时需要支付一定押金,为了防止在随机环境下较坏情况发生,我们将引入去中心化的担保者进行担保,在此基础上通过中心化的资金池解决极端情形下的社会损害赔付.我们证明:(1)在损害评估阶段,审查者们诚实地给出自己对作品社会损害的评估是一个支配性策略;(2)审查机制以极高的概率保证作品的社会损害会低于担保者的赔偿上限和创作者的押金之和.
关键词 创作者经济; 互联网3.0; 去中心化审查; 区块链; 社交媒体; creator economy; Web3.0; decentralized censorship; blockchain; social media;
计算机
计算机理论
论文
Website
Google Scholar
张沁楠, 朱建明, 高胜, 熊泽辉, 丁庆洋, 朴桂荣
中国科学: 信息科学, 2022, 52(6): 971-991
摘要 联邦学习通过聚合多方本地模型成为数据共享的新模式.现有的联邦学习激励机制有效缓解了完全信息下的数据供给不足问题,但仍面临搭便车、不公平、不可信等挑战.为此,本文提出了一种基于区块链和贝叶斯博弈(Bayesian game)的不完全信息联邦学习激励机制,通过量化数据供给方的成本效用与数据需求方的支付报酬对数据交易过程建模,采用沙普利值(Shapley value)实现了数据供给方报酬分配的公平性.在交易模型中考虑到参与个体的异质性与隐私保护,将数据供给方的资源配置策略构建为不完全信息的贝叶斯博弈模型,通过优化本地模型训练策略实现对数据供给方的激励作用.本文进一步分析了激励机制的有效性与行动策略的可信性,提出一种隐私保护的贝叶斯博弈行动策略共识算法(privacy-preserving Bayesian game action strategy consensus algorithm, PPBG-AC),该算法使数据供给方在基于区块链的数据交易平台下实现了贝叶斯纳什均衡.方案对比与理论分析表明本文提出的不完全信息联邦学习激励机制保障了数据供给方利益分配的公平性与资源配置的可信性,基于实际公开数据集的仿真实验与性能评估验证了激励机制的有效性.
关键词 联邦学习; 激励机制; 区块链; 贝叶斯博弈; 沙普利值; 不完全信息; 隐私保护; federated learning; incentive mechanism; blockchain; Bayesian game; Shapley value; incomplete information; privacy protection;
计算机
计算机理论
论文
Website
Google Scholar
袁森, 陈开奇, 李江坤, 张鹏
中国科学: 信息科学, 2022, 52(6): 960-970
摘要 最小最大圈覆盖问题是旅行售货商问题的推广,该问题在无线传感器网络和无人机救灾等领域有着广泛的应用.目前关于最小最大圈覆盖问题的研究主要集中在近似算法方面,而缺少精确算法方面的结果.本文根据最小最大圈覆盖问题的组合特征,对该问题设计了基于动态规划策略的首个精确算法,时间复杂度为O~*(3~n).本文将对最小最大圈覆盖问题的求解分为两个阶段,第一个阶段是对问题的输入进行预处理,第二个阶段是在预处理的基础上求问题的最优解.有趣的是,两个阶段的方法都是基于动态规划策略设计的,这是本文处理最小最大圈覆盖问题的一个主要的特色.本文所证明的求到最优解的时间O~*(3~n),显著优于基于暴力搜索策略的枚举算法的时间.
关键词 最小最大圈覆盖问题; 动态规划; 分支定界; 精确算法; min-max cycle cover; dynamic programming; branch and bound; exact algorithm;
计算机
计算机理论
论文
Website
Google Scholar
刘晓非, 代涵, 李思哲, 李伟东
中国科学: 信息科学, 2022, 52(6): 947-959
摘要 给定平面上的n个用户、m个传感器和一个正整数k (n),任意传感器s均可以通过提供能量p(s)产生一个圆形的覆盖区域,覆盖区域的半径r(s)与p(s)满足p(s)=r(s)~α,其中, α1为衰减系数.平面上带次模惩罚费用的最小能量部分覆盖问题尝试寻找传感器的一个能量供应方案,使得至少有k个用户被覆盖且总能量与未覆盖用户的惩罚费用之和达到最小,其中惩罚费用由一个次模函数确定.该问题推广了最小能量覆盖问题、最小能量部分覆盖问题和带惩罚费用的最小能量部分覆盖问题.通过深入挖掘平面上半不相交圆盘集合的几何性质,本文设计了一个基于原始对偶框架的两阶段多项式时间(5·2~α+1)-近似算法.当惩罚费用函数是线性函数时,此算法的近似比为5·2~α.
关键词 能量部分覆盖问题; 次模惩罚费用; 原始对偶方法; 半不相交; 近似算法; k-prize-collecting power cover problem; submodular penalties; primal-dual method; semi-disjoint; approximation algorithm;
计算机
计算机理论
论文
Website
Google Scholar
张智杰, 应东昊, 张家琳, 孙晓明
中国科学: 信息科学, 2022, 52(6): 935-946
摘要 公平分配研究如何把m个不可分的物品公平地分配给n个玩家.每个玩家关于物品有一个可加的估值函数.物品是无权重的,如果他们的取值范围为{1, 0,-1}.非负估值的物品称为奖品,非正估值的物品称为苦差.本文考虑寻找无权重物品的分配,并满足“相差任意物品下是无忌妒的”(envy-free up to any item, EFX0). EFX_0是本领域内最受关注的公平性度量.一般可加估值函数下的EFX_0分配的存在性仍然是开放的.本文提出寻找无权重物品的EFX_0分配的多项式时间算法.为了达到这个目的,本文分别提出了寻找无权重奖品和无权重苦差的EFX_0分配的算法.然后,通过将二者小心地结合起来,本文得到了最终的算法.本文的结果完整刻画了无权重情况下寻找EFX_0分配的解决方案.
关键词 公平分配; 无忌妒性; 不可分物品; 奖品; 苦差; fair allocation; envy-freeness; indivisible items; goods; chores;
计算机
计算机理论
论文
Website
Google Scholar
凤维明, 尹一通
中国科学: 信息科学, 2022, 52(2): 287-313
摘要 梅特罗波利斯算法(Metropolis algorithm)是一种基本的马尔可夫链蒙特卡罗(Markov chain Monte Carlo, MCMC)采样技术,可用于从概率图模型所表示的高维概率分布(即吉布斯(Gibbs)分布)中进行随机采样.传统的梅特罗波利斯算法是一个串行算法.关于其快速收敛性的一个经典结论是:当满足梅特罗波利斯算法的Dobrushin-Shlosman条件时,该算法在O(n log n)步内快速收敛,其中n是随机变量的个数.本文研究了梅特罗波利斯算法的分布式版本——局部梅特罗波利斯算法.对该算法的正确性与收敛速度进行了分析,证明了该算法总是收敛于正确的吉布斯分布;并且对于一类自然的不包含三角形(triangle-free)概率图模型,如果满足相同的Dobrushin-Shlosman条件,则局部梅特罗波利斯算法在O(log n)轮内快速收敛.相比于传统的串行算法,实现了?(n)倍的渐进最优并行加速比.具体应用包括图染色、硬核模型和伊辛(Ising)模型的分布式采样算法.
关键词 分布式采样; 马尔可夫链蒙特卡洛; 混合时间; 自旋系统; 耦合; distributed sampling; Markov chain Monte Carlo; mixing time; spin system; coupling;
计算机
计算机理论
论文
Website
Google Scholar
魏玲, 曹丽, 祁建军, 张文修
中国科学: 信息科学, 2020, 50(12): 1817-1833
摘要 形式概念分析是以形式背景及其概念格为基础的一种数据分析方法,其中的形式概念明确反映了数据信息中对象与属性间的关系,是哲学中"概念"这一名词的形式化描述.文章提出在形式概念分析框架下进行概念约简的思想,研究保持形式背景中二元关系不变的概念约简的相关理论;针对概念约简理论中作用不同的3种概念类型,分别从算子角度以及布尔矩阵角度分析了对象(属性)概念的特征,并给出了求解概念约简的方法.
关键词 形式背景; 形式概念分析; 二元关系; 约简; 特征; formal context; formal concept analysis; binary relations; reduction; characteristic;
计算机
计算机理论
论文
Website
Google Scholar
王辛, 王晓峰, 许道云, 杨德仁
中国科学: 信息科学, 2020, 50(10): 1501-1510
摘要 双目标最小生成树问题是一个NP-难问题,在光缆通信、智能控制等领域有其重要的应用价值.警示传播(warning propagation, WP)算法是一种基于因子图的消息传递算法,可用于求解组合优化问题.借助于Boltzmann机模型使一个无向图转换为因子图,将求解无向图上的双目标最小生成树问题映射为求解因子图上的对应问题,进而设计一种求解双目标最小生成树问题的警示传播算法.选取由随机数种子产生的若干随机数构造邻接矩阵,生成对应的无向图实例,数值实验结果表明,该算法优于同类算法.
关键词 双目标优化; 组合优化; 警示传播算法; 最小生成树; 因子图; double-objective optimization; combinatorial optimization; warning propagation algorithm; minimum spanning tree; factor graph;
计算机
高性能计算
论文
Website
Google Scholar
刘云浩, 李振华, 李洋, 林灏, 宫良一, 郑雅文
中国科学: 信息科学, 2022, 52(12): 2290-2305
摘要 移动蜂窝系统正经历着从2G/3G/4G到5G的交错式代际进化过程,多样化的信号与协议长期共存.如何在庞大、异构、高动态的蜂窝环境中保证服务的高速(传输快)、高能效(耗电少)和高可靠性(不断网)成为至关重要但又非常困难的问题,该问题同时涉及手机制造商、网络服务提供商、操作系统和应用软件开发商.我们研究和综述了近年来针对该问题的代表性工作,发现蜂窝系统表观层面的多个反常性能问题,实际上归因于核心机制层面隐蔽而深刻的“近因现象”:受社会舆论和商业宣传影响,在选择使用移动网络时,存在非理性的代际偏颇和不自觉的速度至上倾向,进而引发了偏向5G的“亏损迁移”、网络容量的“饱和饥饿”以及基站连接的“乒乓跳跃”等连锁效应.为修复上述缺陷,我们提出基于4G/5G双连接以及非齐次时变马尔可夫过程的自调控技术设计,将5G设备的故障发生率降低40%并将所有设备的平均故障持续时间缩短36%,同时探讨我们基于大规模工业合作实践的洞察和创新.
关键词 代际交错; 5G; 近因现象; 亏损迁移; 自调控技术; interlaced generations; 5G; recency effect; loss-making migration; self-regulating design;
计算机
高性能计算
论文
Website
Google Scholar
庄毅敏, 文渊博, 李威, 郭崎
中国科学: 信息科学, 2022, 52(6): 1040-1052
摘要 随着各类机器学习算法的广泛应用,高能效地定制机器学习系统受到越来越多的关注.定制机器学习系统高效部署的关键在于其编程与编译环境.中间表示是编程与编译环境的核心,用于连接上层编程语言和底层硬件指令.当前的中间表示或是面向上层算法或是面向以标量处理为核心的传统处理器,难以高效应对以张量处理为核心的机器学习系统.本文提出了面向机器学习系统的张量中间表示,以提升机器学习系统的编程和运行效率.具体而言,我们定义了一系列张量类型,张量操作及张量存储空间,并在此基础上进行张量处理优化.我们将所提出的张量中间表示对TVM的底层标量中间表示进行了扩展并在典型机器学习系统上进行了实验.我们探索了原有中间表示没有发掘的优化并取得了1.62~2.85倍的性能提升,同时在典型算子的开发效率上平均提升了5.46倍.
关键词 机器学习系统; 编程与编译; 张量处理; 中间表示; 编程效率; machine learning systems; programming & compiling; tensor processing; intermediate representation; programming efficiency;
计算机
高性能计算
论文
Website
Google Scholar
林力韬, 陈汉华, 金海
中国科学: 信息科学, 2022, 52(2): 314-333
摘要 流连接广泛应用于提取多源流数据之间的关键信息,是大数据处理的重要支撑技术.但连接两条大数据流时大规模的连接谓词计算,使其易成为性能瓶颈.为提高处理性能,流连接系统常采用并行和分布式两种方式扩展.然而,采用多核并行的流连接系统的扩展性受到CPU核数限制,无法应对大规模数据流.采用分布式扩展的流连接系统由于引入分布式框架运行的开销,导致硬件处理效率严重下降.为实现高效大规模扩展,本文提出一种利用FPGA加速器外设向上扩展的流连接系统FJoin.加速器可进行高并行的流动连接,载入多个流元组后,连接窗口中的数据流经一次即可完成所有连接计算.对于逻辑容易在FPGA实现的连接谓词,通过大量基本连接单元串联构成深度连接流水线,实现大规模并行.通过主机CPU和FPGA设备协同进行连接控制,将连续的流连接计算划分为独立的小批量任务,高效地保证并行化流连接的完整性.在装备FPGA加速卡的平台实现了FJoin,基于大规模真实数据集的测试结果表明,对比部署在40个节点集群上的目前最好的分布式流连接系统,本文提出的流连接加速器FJoin可在单一FPGA加速卡上将连接计算速度提升16倍,达到5倍的系统吞吐,且时延满足实时流处理要求.
关键词 流连接; FPGA; 流处理; 硬件加速; 并行计算; stream join; FPGA; stream process; hardware accelerate; parallel computing;
计算机
高性能计算
论文
Website
Google Scholar
赵进, 姜新宇, 张宇, 廖小飞, 金海, 刘海坤, 杨赟, 张吉, 王彪, 余婷
中国科学: 信息科学, 2022, 52(1): 111-128
摘要 随着现实世界中图计算需求的快速增长,同一平台上往往并发运行着大量迭代图分析任务.然而,现有的图计算系统主要是为了高效执行单个图分析任务而设计的.因此,当多个并发图分析任务同时在同一个底层图上并行执行时,现有图计算系统会面临巨大的数据访问开销.为了提高并发图分析任务的吞吐量,现有的核外并发图处理方案通过共享图数据减少并发任务的数据存储与访问开销.但是,由于现实世界中图的图顶点度数幂律分布特性以及图分析任务之间的差异性,现有方案在访问数据时依旧存在着大量的不必要的冗余I/O开销.这是因为即使静态图分区中绝大部分顶点处于非活跃状态或者只被少数图分析任务共享,现有方法也依旧会将整个分区加载入内存供并发图分析任务处理.为解决上述问题,本文提出了一个面向并发图分析任务的高效存储系统GraphDP.它能够插入到现有核外图计算系统中来透明有效地减少现有图计算系统执行并发图分析任务时的存储消耗与数据访问开销,从而提高并发图分析任务的吞吐量.具体来说, GraphDP使用一种新颖的动态I/O调度策略,能够使系统以最优的I/O访问方式完成图数据的加载,并有效地减少加载到内存和cache的数据.同时, GraphDP通过高效的缓存机制在内存中优先缓存被频繁访问的图数据,从而进一步减少数据访问开销.为证明GraphDP的有效性,我们将GraphDP插入到目前流行的核外图计算系统中,包括GridGraph, GraphChi和X-Stream.实验结果表明, GraphDP分别将GridGraph, GraphChi和X-Stream的吞吐量提高了1.57~2.19倍, 1.86~2.37倍和1.62~2.21倍.
关键词 迭代图处理; 并发任务; 存储系统; I/O开销; 吞吐量; iterative graph processing; concurrent jobs; storage system; I/O overhead; throughput;
计算机
高性能计算
论文
Website
Google Scholar
王少清, 孙富春, 赵有健
中国科学: 信息科学, 2021, 51(11): 1840-1852
摘要 LEO巨型星座因其广覆盖、高通量及低延时的通信潜力而受到越来越多的关注.然而由于所处空间环境复杂及自身特点等原因, LEO巨型星座容错问题亟待研究.为此,本文关注如下问题:如何保证卫星失效后,网络流量依然无拥塞正常转发?本文提出了基于流量工程的主动容错方法 SN-FFC,主要思想是通过合理的链路冗余,使得对于至多k (k为可调参数)个卫星失效,网络流量依然能无拥塞正常转发. SN-FFC首先设计基于流量工程的容错建模方法,随后针对模型计算复杂度高的问题,提出基于对偶理论的算法,使得复杂度从O(C_n~k)降低到O(n).基于Starlink第一阶段星座模型的仿真实验表明SN-FFC相较现有方案,能实现故障下的无拥塞转发,并且计算时间和吞吐量开销较低.
关键词 LEO巨型星座; 容错; 流量工程; 对偶理论; 线性规划; LEO mega-constellation; fault tolerance; traffic engineering; duality theory; linear programming;
计算机
高性能计算
论文
Website
Google Scholar
蒋昌俊, 丁志军, 喻剑, 章昭辉, 闫春钢, 张亚英, 王鹏伟
中国科学: 信息科学, 2021, 51(8): 1233-1254
摘要 随着信息技术创新日新月异,数字化、网络化、智能化深入发展,新应用层出不穷、新业态蓬勃发展,对业务系统的敏捷构造和持续运维提出了更高的要求.为此,本文提出了一种新的计算模式:方舱计算.所谓方舱计算,是通过网络访问的,面向IT任务全生命周期的跨域资源配置和协同的计算集成环境.其核心是"方舱专用机动、资源跨域伸缩、系统运维自治".本文给出了方舱计算系统结构及其工作原理,方舱计算系统主要由方舱生成与管理系统、跨域资源管理系统、虚拟数据中心系统和若干网关(方舱网关、虚拟数据中心网关、跨域资源网关等)组成.进而,给出了适于方舱计算的资源分配最优化问题定义,在兼顾数据资源、计算资源和存储资源等的基础上,实现最小化资源成本.通过规划求解器与近似优化算法仿真实验,表明本文的方法能够兼顾数据资源和物理资源的分布,实现方舱资源的优化配置.
关键词 方舱; 虚拟数据中心; 跨域资源管理; 资源分配; 资源分布图; 资源目录; cabin; virtual data center; cross-domain resource management; resource allocation; resource distribution map; resource directory;
计算机
高性能计算
论文
Website
Google Scholar
江家宝, 沈云付, 陈迅雷, 王哲河, 刘拥, 陈丽萍
中国科学: 信息科学, 2021, 51(5): 750-763
摘要 除法运算是基本四则运算之一,如何进行快速除法一直是电子计算机、嵌入式系统和其他新型计算系统广受关注的问题.充分发挥三值光学处理器位数众多、运算功能可重构、按位可分配等优势,设计出高效并行MSD (modified signed digit)数除法器对提高大数据除法的运算效率、促进三值光学计算机(ternary optical computer, TOC)在数值计算领域的应用意义重大.本文首次提出MSD数的符号判定算法,并基于SRT算法首次提出利用一个并行无进位SJ-MSD加法器和一个MSD数比较器实现单组MSD整数除法或多组MSD整数并行除法方案——并行MSD整数除法,该算法对于被除数等长的多组与单组MSD整数除法需要的机器周期是相同的.实验表明,并行MSD整数除法方案是可行的,它将有效地提高大数据处理效率并加速TOC进入数值计算等实际应用领域.
关键词 并行MSD整数除法器; SJ-MSD加法器; 比较器; SRT除法; 三值光学计算机; parallel MSD integer divider; SJ-MSD adder; comparator; SRT division; ternary optical computer(TOC);
计算机
高性能计算
论文
Website
Google Scholar
周知, 刘方明
中国科学: 信息科学, 2021, 51(5): 735-749
摘要 多租户公有云是云计算的一种重要组成形式.近年来,多租户公有云数据中心在如火如荼发展的同时,其过低资源使用率所导致的巨大能耗浪费也引起了社会的高度关注.然而,由于多租户公有云的资源通常以"包年包月"的租赁形式预留给租户,云服务提供商无法通过关闭空闲服务器等常用能耗管理方法来降低数据中心能耗.针对这一难题,本文提出了面向多租户数据中心资源回收利用的激励机制来提升多租户数据中心能效.该机制以经济激励的形式来回收利用租户空闲预留型资源,即云服务提供商向租户支付合适的经济补偿,从而回收租户空闲预留型资源,并充分利用其运行其他云计算服务(如电商和搜索服务).基于Lyapunov方法,本文设计并分析了一种面向租户预留资源回收利用的动态定价算法,该算法无需预测系统未来信息便可作出在线定价决策,并且在保障系统稳定性的同时使得云服务提供商长期成本无限接近于理论最低值.通过严格的数学证明以及由真实数据驱动的仿真实验,本文验证了所提出的激励机制在回收利用租户空闲资源方面的有效性.
关键词 多租户数据中心; 能耗管理; 资源回收; 激励机制; 在线算法; multi-tenant datacenter; energy management; resource recycling; incentive mechanism; online algorithm;
计算机
高性能计算
论文
Website
Google Scholar
张小莉, 程光, 张慰慈
中国科学: 信息科学, 2021, 51(1): 56-74
摘要 机器学习方法对网络流量分类的前提是假设流量具有独立同分布性,而实际情况下流量特征不断发生变化,导致该方法在处理海量、不具备独立同分布的流量数据时开销较大,计算复杂度较高,精度较低.针对上述问题,本文提出一种新的分类模型.该模型将PCA算法与改进的深度卷积神经网络分类模型(improved deep LeNet-5 convolutional neural networks, LCNN)相结合进行流量分类.前者进行降维分析,发现影响检测精度的关键特征,后者采用自主特征学习方式提升分类精度.实验表明,本文方法的内存开销较之前方法降低了3.2%,检测精度提升了5%~8%.
关键词 网络流量分类; 深度卷积神经网络; PCA; 多分类器; 特征选择; Tensorflow; network traffic classification; deep convolutional neural network; PCA; multi-classifier; feature selection; Tensorflow;
计算机
高性能计算
论文
Website
Google Scholar
孙婧, 梁松涛, 路新江
中国科学: 信息科学, 2020, 50(12): 1834-1849
摘要 如何提升分布式存储系统中磁盘修复的速度,一直是磁盘修复问题中的难点.优化的途径有两种:一种是通过对解码算法的优化,减少修盘数据的传输量.另外一种方法是通过对修盘过程中数据流的调度,最大化地利用节点的计算能力、传输能力,进而加速修盘进程.本文从数据流的调度出发,根据数据流图和拓扑结构,计算出了节点的近似最优的修盘数据比例,并依照此比例,设计了分布式存储系统下的近似最优修盘调度算法(NOPT).对于主流的两种Reed-Solomon (RS)编码方式,本文做了等价性证明,并给出了编码转换矩阵.通过大量实验仿真可以看出,在预知系统拓扑的前提下,可以显著地减少通过交换机的流量,进而缩短修盘的时间.
关键词 Reed-Solomon码; 磁盘修复技术; 分布式存储系统; Reed-Solomon code; disk repair algorithm; distributed storage systems;
计算机
高性能计算
论文
Website
Google Scholar
胡振宇, 石宣化, 柯志祥, 金海, 王斐
中国科学: 信息科学, 2020, 50(8): 1178-1196
摘要 基于内存计算模型的分布式数据处理系统,如Flink和Spark,经常遭受严重的内存压力,尤其在平台内存资源紧张,且被多个用户或组织共享情况下,内存资源竞争进一步加剧.用户应用被分配的内存空间不足,会在运行期间产生严重的垃圾回收(garbage collect, GC)开销,而分配过量的内存会导致平台资源的浪费.因此平台中如何为用户应用配置合适的内存成为关键问题.通过研究分析发现,平台上的多个应用会多次共同处理某个特定的数据集,且应用对数据的处理逻辑具有相似性,如图计算和机器学习应用;大数据应用框架的算子API和用户自定义方法 (UDF)与数据处理逻辑有着密切的关系,继而影响运行时内存的使用.基于该发现,本文提出了一种预估新提交应用的合理内存阈值的方法.该方法利用程序分析与历史应用处理数据特征分析,基于kTree判断与历史应用的数据路径的相似性来预估新应用的合理内存阈值,并在Spark系统上实现该方法.通过一系列实验评估预估的准确性和性能收益,实验结果表明本方法预估大数据应用的结果与真实合理内存阈值的误差比例低至4%,预估过程所产生的开销与应用运行时间相比可以忽略不计,平台上数据处理应用整体执行时间减少至56%.
关键词 内存管理; 生命周期; 代码诊断; 数据处理系统; 分布式系统; memory management; lifetime; program diagnostics; data-processing system; distributed system;
计算机
高性能计算
论文
Website
Google Scholar
丁玥, 王涓, 卢卫, 荣垂田, 杜小勇
中国科学: 信息科学, 2020, 50(5): 649-661
摘要 针对"信息孤岛"中的关系数据融合问题,本文提出并实现了多源关系数据融合的基本框架(multi-source relational data fusion, MSF).框架包含3个主要模块:模式匹配、实体对齐、实体融合.模式匹配面向多源关系数据的属性对齐问题,结合属性值的多维特征,提出基于匈牙利(Hungarian)算法的属性间对齐发现机制,实现了多源关系数据的快速模式匹配.实体对齐连接多源关系中的元组对,通过引入多样性取样策略和实体特征抽取方法,提升了实体对齐的效果.最后将对齐实体进行融合,为数据分析提供统一的数据视图.为了验证MSF的效果和效率,实现了数据融合系统DataPuzzle,并在该系统上,结合真实公开的多领域数据,对提出的方法进行了验证.结果表明,所提出的方法可以高效地实现数据融合,具有较高的查全率、查准率.
关键词 多源异构数据; 关系数据; 信息孤岛; 模式匹配; 实体对齐; 数据融合; multi-source heterogeneous data; relational data; information isolated island; schema matching; entity alignment; data fusion;
计算机
高性能计算
论文
Website
Google Scholar
张心怡, 张智鹏, 张铁赢, 崔斌, 范举
中国科学: 信息科学, 2020, 50(5): 637-648
摘要 连接优化是数据库领域最重要的研究问题之一.传统的连接优化方法一般应用基础启发式规则,他们通常搜索代价很高,并且很难发现最优的执行计划.主要原因有两个:(1)这些基于规则的优化方法只能探索解空间的一个子集,(2)他们没有利用历史信息,不能够很好地衡量执行计划的代价,经常重复选择相同的糟糕计划.为了解决以上两个问题,我们提出RLO (reinforcement learning optimization),一个基于强化学习的连接优化方法.我们将连接优化问题建模成马尔可夫(Markov)决策过程,并且使用深度Q-学习来估计每一种可能的执行计划的执行代价.为了进一步增强RLO的有效性,我们提出了基于树形结构的嵌入方法和集束搜索策略来尽量避免错过最好的执行计划.我们在Apache Calcite和Postgres上实现了RLO.实验表明:(1)在Apache Calcite上,与一系列剪枝的启发式算法相比, RLO搜索计划的效率为它们的10~56倍,并且生成的计划能更快地执行(80%的加速);(2)与原生的Postgres相比, RLO搜索计划的效率是其14倍,并且在端到端的执行中达到12.9%的加速.
关键词 连接优化; 强化学习; 嵌入方法; 集束搜索; join optimization; reinforcement learning; embedding method; beam search;
计算机
高性能计算
论文
Website
Google Scholar
李天安, 黄向东, 王建民, 毛东方, 徐毅, 袁骏
中国科学: 信息科学, 2020, 50(5): 621-636
摘要 Apache IoTDB是一个新型的开源时序数据库管理系统.分布式数据管理系统不仅需要解决数据分区与多副本带来的节点间元数据同步问题,还要支持高效查询请求处理.本文针对节点间元数据同步问题提出了双层粒度元数据管理策略,在此基础上基于一致性哈希分区方法和Raft协议设计了同时支持强一致性查询和最终一致性查询的分布式框架.基于单机版Apache IoTDB进行了系统实现与实验测试,测试结果表明:双层粒度元数据管理策略与单层粒度管理策略相比,其元数据内存资源占用更少且写入性能提升5%~10%,并且分布式Apache IoTDB的读写性能随着集群规模的扩大而线性增长.
关键词 物联网数据库; 时间序列; 分布式框架; Raft协议; 元数据; 强一致性; 最终一致性; IoT database; timeseries; distributed framework; Raft protocol; metadata; strong consistency; eventual consistency;
计算机
高性能计算
论文
Website
Google Scholar
李成龙, 李韬, 韩玉浩, 冯振乾, 王宝生
中国科学: 信息科学, 2020, 50(4): 576-587
摘要 现有DNS权威服务器处理DNS请求及响应报文依赖软件网络协议栈, CPU资源占用率高、开销大,处理性能受限.本文基于SmartNIC架构对DNS权威服务器的功能进行卸载加速,提出并设计了高性能DNS权威查询响应流水线PHDR Pipe (perfect Hash DNS response pipeline),基于完美哈希(perfect Hash)实现对区文件的预先处理,避免哈希冲突导致的多次访存,降低流水线最坏情况下处理延迟,从而有效提升系统吞吐率并降低响应延迟.基于开源的FAST平台的实验结果表明,与通用的BIND9系统相比响应延迟降低了约10倍,吞吐量接近10 Gb链路线速,同时资源开销小且具有良好的可扩展性.
关键词 DNS; 权威服务器; 完美哈希; FPGA; 加速; DNS; authoritative server; perfect Hash; FPGA; accelerate;
计算机
高性能计算
论文
Website
Google Scholar
罗军舟, 何源, 张兰, 刘亮, 孙茂杰, 熊润群, 东方
中国科学: 信息科学, 2020, 50(2): 195-220
摘要 随着物联网、云计算和大数据等技术的发展,人类正迈入第四次工业革命时代.工业互联网作为建立在生产对象之间、对象与外部环境之间、对象与人之间高度协同、共享智能的全球性网络,是实现这场革命的核心.然而目前对工业互联网的研究大多局限在物联网、云计算和大数据等各自辖域,其云端协同尚处于"感、联、知、控"的初级阶段,尤其缺乏云端融合、共享智能的体系结构及关键技术,无法应对其中感知对象更加复杂、联网实体更加多元、数据处理更加快速、反馈控制更加智能等需求.为此,本文首先重点调研和归纳了该研究领域所涉及的几个重要方向的研究现状和面临挑战;在此基础上,提出一个云端融合的工业互联网新型体系结构及相关关键技术的解决方案;之后,针对智能制造领域的具体应用场景,将所提相关技术进行应用;最后,总结全文并展望了云端融合的工业互联网未来发展趋势.
关键词 工业互联网; 云端融合; 体系结构; 云计算; 大数据; industrial Internet; synergy of cloud and client; architecture; cloud computing; big data;
计算机
高性能计算
论文
Website
Google Scholar
李洋, 黄进, 田丰, 韩冬奇, 范俊君, 陈辉, 彭晓兰, 戴国忠, 王宏安
中国科学: 信息科学, 2017, 47(9): 1164-1182
计算机
信息安全
论文
Website
Google Scholar
赖建昌, 黄欣沂, 何德彪, 郭福春
中国科学: 信息科学, 2023, 53(5): 918-930
摘要 分层标识加密能有效减轻标识密码体制中密钥生成中心生成用户私钥和分发私钥的工作量.SM9标识密码作为我国商用密码行业标准和国家标准,在金融、政务等方面起着重要的作用,但SM9标识加密算法不具备分层加密的功能,不适合大规模网络的应用场景,阻碍了SM9加密算法的部署.本文基于商用密码SM9标识加密算法提出一个高效的分层标识加密方案SM9-HIBE.相比SM9标识加密算法,方案的密文只增加一个群元素,解密开销只增加一个双线性对运算,与接收者标识的长度无关.方案的安全性基于判定性BDHI困难问题,在随机谕言模型中可证明方案满足静态选择明文攻击模型下的不可区分性.最后,对方案进行比较分析,结果表明SM9-HIBE在计算开销和通信代价方面与现有HIBE方案是可比的.
关键词 分层加密; 标识密码; SM9; 密钥封装; 选择明文安全; hierarchical encryption; identity-based cryptography; SM9; key encapsulation; chosen-plaintext attack; CPA;
计算机
信息安全
论文
Website
Google Scholar
王波, 代晓蕊, 王伟, 于菲, 魏飞, 赵梦楠
中国科学: 信息科学, 2023, 53(3): 470-484
摘要 为了解决传统的机器学习中数据隐私和数据孤岛问题,联邦学习技术应运而生.现有的联邦学习方法采用多个不共享私有数据的参与方联合训练得到了更优的全局模型.然而研究表明,联邦学习仍然存在很多安全问题.典型地,如在训练阶段受到恶意参与方的攻击,导致联邦学习全局模型失效和参与方隐私泄露.本文通过研究对抗样本在训练阶段对联邦学习系统进行投毒攻击的有效性,以发现联邦学习系统的潜在安全问题.尽管对抗样本常用于在测试阶段对机器学习模型进行攻击,但本文中,恶意参与方将对抗样本用于本地模型训练,旨在使得本地模型学习混乱的样本分类特征,从而生成恶意的本地模型参数.为了让恶意参与方主导联邦学习训练过程,本文进一步使用了“学习率放大”的策略.实验表明,相比于Fed-Deepconfuse攻击方法,本文的攻击在CIFAR10数据集和MNIST数据集上均获得了更优的攻击性能.
关键词 联邦学习; 对抗样本; 投毒攻击; federated learning; adversarial example; poisoning attack;
计算机
信息安全
论文
Website
Google Scholar
周彦伟, 王兆隆, 乔子芮, 杨波, 顾纯祥, 夏喆, 张明武
中国科学: 信息科学, 2023, 53(3): 454-469
摘要 现有的多数抗泄露加密机制的研究均假设敌手的泄露是来自收到挑战密文之前,并禁止敌手在挑战后进行泄露操作.然而,在现实中敌手往往是接触到密文数据后会通过各种手段获取相应密钥的泄露信息,因此挑战后的泄露容忍性更符合实际环境的真实应用需求.针对上述不足,本文将对身份基加密(identity-based encryption, IBE)机制的挑战后泄露容忍性展开研究,提出IBE机制熵泄露容忍性的属性要求和安全性定义;并在状态分离模型中联合熵泄露容忍的IBE机制和二源提取器设计抗挑战后泄露攻击的IBE机制,对上述构造在选择明文攻击下的安全性进行了形式化证明.此外,为了获得具有更优安全性的IBE机制,在上述构造的基础上,通过增加消息验证码设计选择密文攻击安全的挑战后泄露容忍的IBE机制.
关键词 挑战后泄露容忍性; 身份基哈希证明系统; 身份基加密机制; 熵泄露容忍性; after-the-fact leakage resilience; identity-based hash proof system; identity-based encryption; entropic leakage resilience;
计算机
信息安全
论文
Website
Google Scholar
陈荣茂, 王毅, 黄欣沂
中国科学: 信息科学, 2023, 53(2): 266-281
摘要 国密SM2密码算法已经成为保障我国网络信息系统安全自主可控的关键技术.然而近期研究发现, SM2加密算法在实际部署应用时面临高效的算法替换攻击.该种攻击可以从当前的密文预测下一次加密所使用的随机数,从而可以在不知道解密密钥的情况下成功解密后续密文.密码逆向防火墙技术已被证实可以有效抵抗该种攻击,但其要求密文具有可重随机性,与SM2加密算法本身所具备的CCA (chosen-ciphertext attack)安全性相冲突.针对该问题,本文改进SM2加密算法,构造了具有RCCA (可重放CCA)安全性的公钥加密方案.该方案具有与SM2加密算法近似的安全性,且同时支持密文重随机操作,因此可以有效兼容密码逆向防火墙.方案的设计遵循Phan等提出的OAEP三轮构造范式,结合SM2加密算法进行改进,并在随机预言机模型下给出了严谨的安全证明.本文提出了首个基于国密算法的可重随机RCCA公钥加密方案,研究结果有助于提升SM2密码算法在实际应用中的安全性.
关键词 SM2; 加密算法; RCCA; 可重随机性; 密码逆向防火墙; SM2; encryption; RCCA; rerandomizability; cryptographic reverse firewall;
计算机
信息安全
论文
Website
Google Scholar
姜奇, 杨雪, 王金花, 程庆丰, 马鑫迪, 马建峰
中国科学: 信息科学, 2022, 52(12): 2351-2370
摘要 随着汽车保有量的持续增长和道路交通的饱和,车联网被视为有效提高交通效率,改善驾乘体验的有效技术之一.认证密钥协商协议是保证车载单元(onboard unit, OBU)与各种信息服务器安全交互的关键手段.通常,认证密钥协商协议所需的密钥被存储于OBU中.然而,由于车辆常处于无人值守状态, OBU失盗事件时有发生.因此,如何确保私钥的存储安全是一个具有挑战性的难题.为了解决上述问题,本文提出了基于不经意伪随机函数(oblivious pseudorandom functions, OPRF)和两方协同签名的抗捕获认证密钥协商协议.借助于两方协同签名,私钥被分成两个部分,一部分使用辅助设备的公钥加密,另一部分通过OBU和辅助设备运行OPRF协议才能恢复.由于OBU中没有存储任何秘密信息,即使OBU被盗取,攻击者仍然无法获取私钥.本文对提出的方案进行了全面的安全性分析和性能比较.结果表明所提出的方案可以抵抗各种已知的攻击,特别是设备被捕获导致的密钥泄露.此外,所提出的方案可以实现计算开销和通信开销的平衡.
关键词 车联网; Schnorr协同签名; OPRF; 认证密钥协商; 抗设备捕获; Internet of vehicle; Schnorr collaborative signature; OPRF; authentication key agreement; capture resilient;
计算机
信息安全
论文
Website
Google Scholar
张效林, 谷大武
中国科学: 信息科学, 2022, 52(12): 2336-2350
摘要 消息认证码(message authentication code, MAC)是一种对称密码算法,能检查消息的完整性与来源合法性,可广泛用于各类信息系统.然而,当运行MAC算法的设备受到物理攻击时,攻击者可通过读取存储器或电路调试等手段获取算法密钥并生成合法的消息认证码,从而危害系统安全.为此,本文提出了PUF-MAC,一种基于物理不可克隆函数(physically unclonable function, PUF)和Hash函数的MAC算法. PUF是一种具有结构不可克隆性与输出不可预测性的数据映射实体,不同PUF实体映射间的差异来源于生产时物理环境的微小变化.通信双方可使用PUF生成共享密钥.在标准模型下,本文归约证明了PUF-MAC算法在适应性选择消息攻击下满足存在性不可伪造(existential unforgeability under chosen message attack, EUF-CMA),且算法的EUF-CMA安全性依赖于Hash的弱抗碰撞性以及PUF的EUF-CMA安全性.同时,本文基于PUF-MAC算法设计了一种满足前后向安全性的密钥协商方案和双向身份认证协议,体现了PUF-MAC良好的实用性.理论分析表明,与其他MAC算法相比, PUF-MAC结构轻量且实现简单,无需预先存储大量的PUF响应. PUF的引入使攻击者即使获取算法密钥,也无法生成合法的消息认证码,保证了通信系统的安全.
关键词 消息认证码; 密钥管理; 物理不可克隆函数; 身份认证; MAC; key management; PUF; authentication;
计算机
信息安全
论文
Website
Google Scholar
陈泌文, 向涛, 何德彪, 黄欣沂
中国科学: 信息科学, 2022, 52(12): 2321-2335
摘要 近年来网络攻击与数据泄露事件层出不穷,网络安全受到国家及相关部门的高度关注.国产密码算法作为保障我国网络与信息安全的关键技术,推动其应用与实施既符合构建我国网络强国的战略需求,又能保障实际应用的健康发展. SM2公钥加密算法是我国自主设计的国产商用密码之一,可有效保障数据在通信过程中的安全性.然而,经典SM2公钥加密算法适合“一对一”通信场景,在“一对多”通信场景中需承担较大的计算与通信开销.为提升SM2公钥加密算法在“一对多”通信场景中计算与通信效率,扩展我国商用密码的应用范围,本文将我国商用密码SM2公钥加密算法和广播加密概念相结合,利用Diffie-Hellman密钥交换和多项式秘密分享的思想,设计了基于SM2的公钥广播加密方案.所构造方案最大程度地保留原有SM2公钥加密算法结构,通过简单地扩展即可实现在多用户场景下消息安全广播的自主可控.与现有广播加密方案相比,所构造方案的系统参数大小与接收者数量无线性关系,以及系统无需指定数据发送者广播消息.所构造方案的安全性分析表明,本文方案与SM2公钥加密算法具有相同安全强度.理论分析与实验仿真表明,所构造方案具有较好的性能,显著增强了我国商用密码的实用性.
关键词 公钥加密; SM2公钥密码算法; 广播加密; Diffie-Hellman密钥协商; publi-key encryption; SM2 public key cryptography; broadcast encryption; Diffie-Hellman key exchange;
计算机
信息安全
论文
Website
Google Scholar
暴婷, 徐蕾, 祝烈煌, 王丽宏
中国科学: 信息科学, 2022, 52(8): 1481-1499
摘要 推荐系统可帮助用户从众多的数据中发现用户所需数据,与此同时,上传用户原始数据给服务器也可能泄露用户隐私.本文使用本地化差分隐私技术为推荐系统中的用户数据提供隐私保护.在本地化差分隐私模型中,隐私预算控制用户数据的隐私保护程度,较高的隐私预算通常意味着较高的分析准确性.为在最小化隐私损失的同时最大化推荐准确性,我们将隐私预算设置问题建模为多臂赌博机问题,并提出基于置信度上界的学习策略帮助用户选择最优的隐私预算.考虑到用户对不同数据的敏感程度不同,我们对学习策略进行了改进.真实数据集上的实验结果表明,所提策略可以帮助用户选出合适的隐私预算,可有效提高用户的累计收益.
关键词 推荐系统; 本地化差分隐私; 隐私预算; 强化学习; 多臂赌博机; recommendation system; local differential privacy; privacy budget; reinforcement learning; multiarmed bandit;
计算机
信息安全
论文
Website
Google Scholar
梁若舟, 高跃, 赵曦滨
中国科学: 信息科学, 2022, 52(8): 1463-1480
摘要 在真实场景,特别是工业场景下的高级持续性威胁(advanced persistent threat, APT)具有复杂性和长期性,但当前方法无法有效提取攻击中的长期关联关系.针对这一问题,本文提出一种基于溯源图的APT攻击检测方法 SeqNet. SeqNet采用序列特征提取方式,实现APT攻击检测.在SeqNet中,首先将描述系统运行状态的溯源图序列转化为特征向量序列,然后使用GRU (gate recurrent unit)模型提取系统状态变化特征,并使用结合局部注意力机制的编解码器模型训练GRU模型,最后利用K-means聚类方法对系统正常行为进行建模.本文在5个公开数据集StreamSpot, wget, shellshock,ClearScope和CADETS上进行了实验,并与当前具有代表性的方法进行了对比.本文方法在5个数据集上都取得了相似或更好的效果.实验结果证明本文方法能够实现真实场景下的APT攻击检测.
关键词 APT攻击检测; 溯源图; 异常检测; 序列特征提取; 局部注意力机制; APT attack detection; provenance graphs; anomaly-based detection; sequence feature extraction; local attention mechanism;
计算机
信息安全
论文
Website
Google Scholar
董晓娟, 张卫明, 方涵, 俞能海
中国科学: 信息科学, 2022, 52(7): 1272-1286
摘要 现有的云存储服务普遍推出了浏览文件的功能,这为用户通过拍摄屏幕上的文件来窃取信息带来极大的便利,同时也加重了信息泄露的风险.因此,用户通过拍照窃取信息对云存储服务来说是一个潜在的安全性问题.现有的办法是云端在推送图像至用户端前,先嵌入与用户身份相关的抗屏摄水印,那么云端能从拍摄的图像检测到水印,发现用户身份.然而云端和用户端都有含用户水印的图像,我们无法确认被泄露的图像是从云端流出的还是从用户端流出的.为了消除泄露源的二义性,使用密文水印,云端将用户的密文水印嵌入到明文图像,生成含用户水印的密文图像.只有用户端能将之解密,获得相应的明文图像.一旦该图像被偷拍泄露,我们可断定该图像一定是从用户端流出的.但是目前的抗屏摄水印算法不支持上述功能,仅支持明文水印的嵌入.为此,本文提出一个云与用户之间的抗屏摄密文水印协议,旨在保护版权用户对其图像的版权,防止使用图像的用户通过偷拍窃取图像.通过理论分析和仿真实验,本文验证了所提出协议在实施过程中的安全性和有效性.
关键词 云存储; 密文水印协议; 抗屏摄水印; 版权保护; 泄露追踪; cloud storage; ciphertext watermark protocol; screen-shooting resilient watermark; copyright protection; leakage tracking;
计算机
信息安全
论文
Website
Google Scholar
袁和昕, 刘百祥, 阚海斌, 陈泽宁
中国科学: 信息科学, 2022, 52(6): 1135-1148
摘要 灵活有效的身份体制方案一直是信息时代的核心需求之一.传统的中心化公钥基础设施存在诸多缺陷,而已有的运行在区块链上的分布式的公钥基础设施同样存在诸如性能、鲁棒性、不可否认性、身份灵活性等方面的问题.本文创新地将区块链与去中心不可否认属性签名结合,提出一种新型分布式公钥基础设施方案,方案利用门限算法和属性签名对身份进行细粒度的管理,并引入非交互式零知识证明使得证书具有不可否认的性质,利用区块链的共识机制进行证书库的同步以实现分布式的身份认证.本文通过实验仿真和分析并结合具体场景,证明了该方案在安全性和可用性上都满足实际落地的需求.
关键词 区块链; 公钥基础设施; 属性签名; 门限算法; 零知识证明; 身份认证; blockchain; public key infrastructure; attribute-based signature; threshold algorithm; zero-knowledge proof; identity authentication;
计算机
信息安全
论文
Website
Google Scholar
周子钰, 张宗洋, 刘建伟
中国科学: 信息科学, 2022, 52(5): 837-855
摘要 中本聪共识是区块链共识机制中最基础和研究最广泛的一种共识机制,其安全性对整个区块链领域的发展具有重要的理论意义和应用价值.现有大量研究在各种模型假设下对中本聪共识进行了安全性分析和证明.本文首先详细描述了中本聪共识的执行模型,包括时间模型、网络模型、敌手模型等.其次,系统总结了中本聪共识安全性的形式化定义.再次,根据时间模型将中本聪共识研究方法分为基于离散时间模型和连续时间模型两类,并指出不同方法的优缺点.最后对中本聪共识的安全性研究进行展望,旨在为区块链共识机制的研究提供技术支撑.
关键词 中本聪共识; 区块链; 安全性证明; 数字货币; 工作量证明; Nakamoto consensus; blockchain; proof of security; cryptocurrency; proof-of-work;
计算机
信息安全
论文
Website
Google Scholar
周彦伟, 杨波, 乔子芮, 夏喆, 张明武
中国科学: 信息科学, 2021, 51(12): 2119-2133
摘要 泄露攻击的出现,导致在传统理想安全模型下已证明安全的密码机制在实际应用中不再保持其所声称的安全性;并且现有基于双线性映射构造的抗泄露无证书密钥封装机制(certificateless keyencapsulation mechanism, CL-KEM)的计算效率较低.针对上述不足,在不使用双线性映射的前提下本文设计了抗连续泄露的CL-KEM,并基于经典的判定性Diffie-Hellman假设对构造的安全性进行形式化证明.在我们的CL-KEM实例中,封装密文的所有元素对敌手而言是随机的,确保任意敌手均无法从封装密文中获知关于用户私钥的泄露信息;并且泄露参数是固定的常数,不受封装密钥空间大小的限制.为了进一步增强CL-KEM的抗泄露攻击的能力,本文构造了一个泄露量达到l_(sk)(1-O(1))的新颖抗泄露CL-KEM,其中l_(sk)表示私钥的长度,分析表明该机制在具有上述优势的同时,将抵抗泄露攻击的能力提升到最佳.最后,基于抗泄露CL-KEM提出抗泄露无证书混合加密机制和抗泄露无证书密钥协商协议的通用构造方法.
关键词 无证书公钥密码; 密钥封装机制; 泄露容忍; 连续泄露容忍; DDH安全性假设; certificateless public-key cryptography; key-encapsulation mechanism; leakage resilience; continuous leakage resilience; DDH security assumption;
计算机
信息安全
论文
Website
Google Scholar
赖建昌, 黄欣沂, 何德彪, 伍玮
中国科学: 信息科学, 2021, 51(11): 1900-1913
摘要 安全性分析为密码方案的安全性提供重要依据和有力保障.我国自主设计的商用标识密码SM9已成为国家标准,其中, SM9数字签名算法和加密算法已成为ISO/IEC国际标准.然而,现有关于SM9标识密码算法安全性分析的公开发表研究成果较少. Cheng在Inscrypt 2018基于Gap-q-BCAA1假设,给出了SM9密钥交换协议、密钥封装机制和公钥加密算法的安全性证明.本文首先基于q-SDH假设和随机谕言模型,证明SM9数字签名算法具有EUF-CMIA的安全性.其次,为了消除对Gap类困难假设的依赖,采用Twin-Hash-ElGamal技术,提出基于SM9密钥封装机制的新型密钥封装机制Twin-SM9.与SM9密钥封装机制相比, Twin-SM9的系统公钥和用户私钥分别增加了一个群元素,而封装密文长度保持不变.在随机谕言模型中证明,若q-BDHI假设成立,则Twin-SM9密钥封装机制满足IND-CCA.然后进一步阐明了SM9标识密码的安全性,研究结果有助于基于SM9的高级密码协议和算法的设计与分析.
关键词 SM9; 安全性分析; 数字签名; 密钥封装; CCA; SM9; security analysis; digital signature; key encapsulation; CCA;
计算机
信息安全
论文
Website
Google Scholar
胡柏吉, 李元诚, 房方, 商兴宇
中国科学: 信息科学, 2021, 51(11): 1885-1899
摘要 随着COVID-19在全球肆虐,传染病监测有利于阻止传染病传播.而保护监测系统中病人以及数据提供者的隐私能免除他们对隐私信息泄露的顾虑,从而提高系统的数据采集能力.本文提出了一个基于区块链的传染病监测数据聚合方案(lightweight-blockchain based privacy-preserving data aggregation scheme, LBPDA),可以在不依赖可信第三方的情况下对数据进行聚合.特别地,为了保护数据聚合过程中数据隐私,采用基于Paillier密码系统的加法同态性来聚合病例数据.此外,为了减少时间开销和存储开销,对使用的Hyperledger Fabric联盟区块链平台进行了改进,从而轻量化数据聚合过程.我们对提出的方案进行了仿真,并进行安全性和性能分析以验证提出方案的可行性和有效性.结果显示,提出的方案能满足政府部门在聚合病例数据用于传染病监测的同时保护病人和数据提供者的隐私的需求.此外,通过对比也证明本文对区块链的轻量化是有效的.
关键词 区块链; 传染病监测; 隐私保护数据聚合; Paillier密码系统; Hyperledger Fabric; blockchain; epidemic disease surveillance; privacy-preserving data aggregation; Paillier cryptosystem; Hyperledger Fabric;
计算机
信息安全
论文
Website
Google Scholar
高胜, 袁丽萍, 朱建明, 马鑫迪, 章睿, 马建峰
中国科学: 信息科学, 2021, 51(10): 1755-1774
摘要 联邦学习能够在保障本地数据隐私前提下利用分布式数据和计算资源实现机器学习模型联合训练.现有异步联邦学习有效解决了同步联邦学习所存在的计算资源浪费、训练效率低等问题.然而,现有异步联邦学习通过聚合不同节点训练得到局部模型,并通过中心服务器完成全局模型更新,内生性地受制于中心化信用模式,存在单点失效、隐私泄露等问题.为此,提出了一种基于区块链的隐私保护异步联邦学习,通过上链局部模型并通过共识算法生成全局模型,保证异步联邦学习的可信性.为了保证联邦学习的隐私性,同时提高模型效用,提出利用差分隐私中的指数机制以高概率选择贡献度高的模型梯度,并分配较低的隐私预算以保证局部模型的隐私性.另一方面,针对异步联邦学习时钟不同步问题,提出了双因子调整机制进一步提高全局模型效用.最后,理论分析与实验结果表明所提出的方案能有效保证异步联邦学习的可信性和隐私性,同时提高了模型效用.
关键词 联邦学习; 区块链; 差分隐私; 模型效用; 异步训练; federated learning; blockchain; differential privacy; model utility; asynchronous training;
计算机
信息安全
论文
Website
Google Scholar
王缵, 丁晓锋, 周潘, 田有亮, 金海
中国科学: 信息科学, 2021, 51(10): 1721-1737
摘要 针对移动边缘计算下查询的效率和安全问题,本文开展了面向位置信息的移动边缘计算安全skyline查询的研究.首先,提出了移动边缘计算场景下的安全skyline查询框架;其次,针对边缘服务器资源受限的特性,设计了新颖且统一的轻量级安全索引结构;然后,考虑云边协同中的隐私问题,提出了基于移动边缘计算的安全skyline查询协议.安全性分析表明该协议在半诚实模型下是安全的.同时,实验评估发现其比现有协议具有更高的查询效率.
关键词 安全skyline查询; 位置信息; 移动边缘计算; 安全索引; 半诚实模型; secure skyline queries; location-based data; mobile edge computing; secure index; semi-honest model;
计算机
信息安全
论文
Website
Google Scholar
方宁, 刘百祥, 阚海斌
中国科学: 信息科学, 2021, 51(10): 1706-1720
摘要 信息技术的发展以及人们对于个人隐私安全重视程度的提升对传统互联网应用的身份认证机制提出了更高的要求,既要实现用户的身份认证,同时也要最大程度地保护用户的隐私信息.与传统的数字签名方案相比,基于属性的数字签名方案天然具有匿名的特点,即属性签名可以隐藏签名者的身份信息,其他用户无法将一个签名链接到签名者的身份(属性集).而在实际应用场景当中,我们通常还需要对用户的身份进行监管,以防止匿名滥用和失信行为的发生.因此,为了平衡这两种看似矛盾的需求,本文提出了一个基于区块链和去中心可追踪属性签名的可控匿名认证方案,通过对已有的可追踪属性签名方案进行适当改进,在不影响效率的前提下实现了去中心化的属性授权机构,以防止单个属性授权机构的腐败对系统安全性造成影响.实验及对比分析结果表明,本方案适用于电子投票系统和其他具有去中心可控匿名认证需求的场景.
关键词 区块链; 属性签名; 可追踪性; 可控匿名; 隐私保护; blockchain; attribute-based signature; traceability; controllable anonymity; privacy protection;
计算机
信息安全
论文
Website
Google Scholar
周广猛, 姚苏, 李琳, 刘昕, 徐恪
中国科学: 信息科学, 2021, 51(9): 1559-1574
摘要 随着互联网和移动终端的普及,数字内容产业正成为文化产业主要经济增长点.本文从数字内容产业面临的版权、质量和产业壁垒问题入手,分析区块链技术对于建设数字内容生态价值链的意义和优势,提出以基于区块链的数字内容平台重塑生态价值链的方案.然后分析新型平台中的关键元素、价值流转、平台架构,设计平台价值流转过程中的基础方案,最后从成本和性能角度证明联盟链适合并且可以支撑平台构建.
关键词 数字内容; 价值链; 区块链; 价值流转; 联盟链; digital content; value chain; blockchain; value transfer; consortium blockchain;
计算机
信息安全
论文
Website
Google Scholar
李增鹏, 汪定
中国科学: 信息科学, 2021, 51(8): 1375-1390
摘要 在可预见的未来,口令仍将是最主要的身份认证方法.口令认证密钥交换协议(password authenticated key exchange, PAKE)是口令认证的重要组成部分,它允许通信双方在不安全的通话信道上建立一个安全的会话密钥.为了缓解服务器被入侵后对存储在服务器上口令的影响,将口令散列之后再存储被广泛推荐,例如使用传统的口令散列函数,如PBKDF2, Bcrypt,和Scrypt.然而,这些口令散列函数依赖复杂的数学问题,安全性证明建立在随机预言机模型(random oracle model,ROM)之上,且需要较大内存支持.为解决上述问题,基于离散对数假设的口令散列方案陆续被提出,如Benhamouda-Pointceva方案(IACR ePrint2013/833)、Kiefer-Manulis方案(ESORICS’14)、Pointcheval-Wang方案(ASIACCS’17)与平滑投影散列函数(smooth projective hash function, SPHF)集成,但这些方案无法实现后量子安全且仍依赖于ROM模型.因此,本文着重研究如何在标准模型下设计后量子安全的口令散列方案,并给出可证明安全性分析.尽管所提方案尚不能应用于实际,但为构造实际的后量子安全的口令认证及密钥交换协议奠定了基础.
关键词 抗量子; 口令认证密钥交换; 口令散列方案; 平滑投影散列函数; 基于格的密码学; quantum resistant; password authenticated key exchange; password hashing scheme; smooth projective hash function; lattice-based cryptography;
计算机
信息安全
论文
Website
Google Scholar
陈泽宁, 张亮, 张双俊, 阚海斌
中国科学: 信息科学, 2021, 51(8): 1345-1359
摘要 区块链上的身份体制是不健全的.如何在区块链上认证某个用户的身份、如何确保身份的背书机构是真实的一直是一个挑战.运行在区块链上的分布式公钥基础设施可以在某种程度上解决上述问题,但是属性密码结合区块链可以提供更贴近于真实社会的身份模型.提出一种基于区块链和去中心属性密码的访问控制身份方案,利用用户和组织之间相互授权、背书身份属性实现信任成本的链接,利用属性密码对链上数据进行访问控制和共享达到细粒度的访问控制和隐私保护.设计了可多用户协同的属性密码,为身份模型中的机构提供背书能力.通过实验仿真和对比分析,该方案在安全性和性能上都满足当前通用区块链的需求,为其提供了一种通用基础的身份模型.
关键词 区块链; 属性密码; 访问控制; 身份认证; 隐私保护; blockchain; attributed-based encryption; access control; identity authentication; privacy protection;
计算机
信息安全
论文
Website
Google Scholar
王腾, 杨新宇, 任雪斌, 赵俊
中国科学: 信息科学, 2021, 51(7): 1199-1216
摘要 群智感知系统中针对数据流的实时发布和深度学习在极大方便人们日常生活的同时,也严重威胁了参与用户的隐私信息.现有隐私保护机制在处理动态性强、时空相关性复杂的数据流时,大都难以实现数据自适应性,从而导致较低的数据效用性.因此,基于ω-事件级差分隐私,本文提出了一种数据自适应的多维数据流隐私保护实时发布机制AdaPub.该机制通过集成基于多重哈希的维度划分策略和自适应累积回溯时间聚类策略分别学习数据流的空间和时间相关性,不需要预定义任何参数,能够根据数据流的动态变化趋势来自适应地调整隐私参数,从而保证了隐私保护机制的数据自适应性并有效提高了数据效用性.此外,本文进一步提出了一种面向层次数据流发布的隐私保护机制HierAdaPub,利用最优隐私预算分配策略来最小化扰动方差以保证数据效用性.大量仿真实验从不同角度均验证了所提出隐私保护机制能够在提供强隐私保护的同时,具有较高的数据效用性.
关键词 数据流发布, 数据自适应, 差分隐私, 时空相关性, 数据效用性
计算机
信息安全
论文
Website
Google Scholar
朱敏杰, 叶青青, 孟小峰, 杨鑫
中国科学: 信息科学, 2021, 51(7): 1100-1115
摘要 移动设备的普及带来了移动应用程序市场的蓬勃发展,各类服务提供商通过移动应用程序的权限大量收集用户数据,而数据收集过程往往不为用户所知,因此给用户带来极大的隐私风险.对移动应用程序进行隐私风险评估,不仅有助于规范第三方移动应用市场,而且可帮助用户规避潜在的隐私风险,而如何评估移动应用程序可能带来的最大隐私风险则是当前面临的重大挑战.本文通过研究移动应用程序最大化的数据泄露场景,基于权限请求特征和权限分析原则构建隐私风险最大值量化模型.该模型基于权限敏感度、权限类别异常度、权限使用率和权限调用者数量4个参数,对移动应用程序的潜在隐私风险进行评估.在隐私风险量化和恶意应用检测中,对比当前同类型方法,该模型在真实数据集上效果均较优,说明模型的有效性.实验结果进一步表明,该模型可用于改善现有第三方移动应用市场的隐私风险预警机制,进而保护移动用户的隐私.
关键词 隐私保护, 移动应用程序, 隐私风险量化, 权限分析方法
计算机
信息安全
论文
Website
Google Scholar
周彦伟, 杨波, 夏喆, 张明武
中国科学: 信息科学, 2021, 51(6): 1013-1029
摘要 隐私信息的泄露已成为密码系统当前的严重安全性隐患,因此抗泄露性将是密码机制必备的安全属性之一.目前,通常基于非交互式零知识论证系统、一次性损耗滤波器、强一次性签名等密码基础工具来实现选择密文攻击(chosen-ciphertext attack, CCA)安全的抗泄露身份基加密(identity-based encryption, IBE)机制的通用构造;然而,由于底层工具的计算效率较低,导致传统通用构造尚未达到理想的计算效率.针对上述不足,本文提出一个双封装密钥的身份基哈希证明系统(identity-based Hash proof system with two encapsulated key, T-IB-HPS)的新密码学原语,并详细介绍了T-IB-HPS的形式化定义及安全属性;同时,基于T-IB-HPS和消息验证码(message authentication code, MAC)设计了CCA安全的抗泄露IBE机制的新型通用构造,并基于T-IB-HPS和MAC的安全属性,对通用构造的CCA安全性进行了形式化证明;为进一步展示本文通用构造的实用性,在T-IB-HPS形式化定义的基础上,我们设计了T-IB-HPS的具体实例,并基于判定的双线性Diffie-Hellman假设证明了本文实例的安全性.相较于传统CCA安全的抗泄露IBE机制的通用构造而言,本文通用构造未使用计算效率低的密码学基础工具,表明了本文的通用构造方法具有较高的计算效率.
关键词 哈希证明系统, 身份基哈希证明系统, 身份基加密机制, 抗泄露攻击
计算机
信息安全
论文
Website
Google Scholar
李顺东, 王文丽, 杜润萌
中国科学: 信息科学, 2021, 51(1): 75-88
摘要 安全多方计算是国际密码学界研究的热点,百万富翁问题是安全多方计算最基础最重要的问题,是构造其他安全多方计算协议的基本模块.这个问题已经有许多解决方案,但除了基于混淆电路的协议之外,目前基于公钥加密算法的解决方案几乎都是半诚实模型下的解决方案,抗恶意敌手的解决方案极少,仅有的个别解决方案效率很低,这制约着恶意模型下许多安全多方计算问题的解决.抗恶意敌手的解决方案更符合安全多方计算的实际应用场景,研究抗恶意敌手的百万富翁问题解决方案,具有重要的理论与现实意义.本文首先设计了一个半诚实模型下百万富翁问题的解决方案,进一步分析了恶意敌手可能的恶意行为,并用零知识证明和分割选择阻止或发现这些恶意行为,将半诚实模型下安全的计算协议改造成恶意模型下安全的计算协议,并用理想–实际范例证明了协议的安全性,分析了恶意敌手攻击成功的概率和方案的效率.理论分析表明与现有方案相比,我们提出的方案效率至少提高6倍.
关键词 安全多方计算; 百万富翁问题; 恶意模型; 分割–选择; 零知识证明; 理想–实际范例; secure multiparty computation; millionaires' problem; malicious model; cut-and-choose; zero-knowledge proof; ideal-real paradigm;
计算机
信息安全
论文
Website
Google Scholar
卢向敏, 王兴伟, 易波, 李婕, 黄敏
中国科学: 信息科学, 2020, 50(12): 1903-1918
摘要 软件定义网络(software defined networking, SDN)作为一种新型的网络架构,将网络的控制平面与数据转发平面分离,实现了可编程化控制,为互联网提供了改善网络全局性能的新思路.虽然SDN具有全局视角优势,但在处理互联网海量数据时也存在性能瓶颈:频繁的层间通信会使控制器计算效率下降,海量的流表项数据使得交换机存储压力过大.为了进一步提升SDN的性能使其适应互联网的海量流量处理,本文提出了面向互联网的SDN流量多粒度处理机制,将SDN架构应用到互联网骨干网的流量处理中,分别从路由和调度两个方面设计并实现了流量多粒度处理机制.仿真结果表明:本文设计的流量多粒度处理机制能减少层间通信次数,减少下发流表项,维持负载均衡,提高了路由选取的正确性和有效性,提升了SDN性能,进而提升了处理互联网海量数据的能力.
关键词 软件定义网络; 互联网; 多粒度路由; 流量调度; 性能优化; software defined networking; Internet; multi-granularity routing; traffic scheduling; performance optimization;
计算机
信息安全
论文
Website
Google Scholar
朱方东, 李涛, 杨进
中国科学: 信息科学, 2020, 50(10): 1529-1543
摘要 否定选择算法(negative selection algorithm, NSA)是人工免疫系统的核心基础算法.孔洞是引起NSA检测率低的重要因素.传统NSA未考虑孔洞的分布,采取在特征空间内通过完全随机的方式盲目生成检测器以修复孔洞,导致孔洞修复效果不佳,并且淘汰无效的检测器也异常耗时.孔洞问题在生物免疫系统中也同样存在.生物免疫系统利用MHC分子针对孔洞产生的特殊形态,对免疫细胞的发育过程进行限定,从而训练出覆盖孔洞的免疫细胞,进而解决孔洞问题.受此启发,本文提出一种基于免疫MHC的否定选择算法——孔洞修复方法 MHC-NSA.首先以训练样本生成的维诺图(Voronoi)对形态空间进行划分,利用维诺图的最邻近特性,在维诺图中两类点处快速生成两类检测器,以较小训练代价达到对非自体空间较好的覆盖;其次模拟MHC针对孔洞所具有的特殊形态,对所产生的孔洞位置进行定位,并限定该位置生成孔洞修复检测器,从而提升孔洞修复效果.理论分析表明,MHC-NSA所生成的孔洞修复检测器可将孔洞最高占比降低62.8%,且MHC-NSA的时间复杂度由传统NSA算法的指数阶降低到多项式阶.在UCI数据集Balance Scale上的实验表明, MHC-NSA的检测器训练时间较典型NSA算法代表RNSA, V-Detector和BIORV-NSA在分别降低53.73%, 96.43%和92.66%的同时,检测率分别提升69.57%, 44%和17.54%.
关键词 人工免疫系统; MHC; 否定选择算法; 孔洞; AIS; MHC; NSA; Holes;
计算机
信息安全
论文
Website
Google Scholar
王璞玉, 张海
中国科学: 信息科学, 2020, 50(10): 1511-1528
摘要 本文关注敏感数据的隐私保护问题,开展满足差分隐私的分布式Logistic回归模型研究.通过对算法输出结果加扰动,实现分布式差分隐私.进一步,为了防止计算机信息交互过程中可能产生的隐私泄露,针对算法迭代过程加扰动的方式提出了基于Alternating Direction Method of Multipliers(ADMM)算法的分布式Logistic变量扰动算法,并给出算法的理论界估计.实验表明,所提算法可有效地处理分布式存储数据并保护其隐私.
关键词 差分隐私; 分布式算法; Logistic回归; ADMM算法; differential privacy; distributed algorithm; logistic regression; ADMM algorithm;
计算机
信息安全
论文
Website
Google Scholar
曹怀虎, 张艳梅, 王坚, 李海峰, 崔丽欣
中国科学: 信息科学, 2020, 50(2): 261-274
摘要 传统的区块链结构,由于其固有的响应速度慢,不能适应大规模实时响应的应用场景,本文针对这一问题,提出了一种DAG (directed acyclic graph)区块链理论架构,将传统区块链的链式处理过程转变为并行的处理过程,使得快速响应成为可能.在此基础上,面向DAG区块链环境中非独立任务调度问题,提出了基于确定性退火技术的混合分割遗传任务调度算法.实验结果显示,该算法能够适应DAG区块链节点的异质性、动态性和广域性,其调度的性能也比传统的调度算法有所改善,在优化任务完成时间的同时,兼顾了负载均衡问题,有效地提高了响应速度,是解决DAG区块链环境中非独立任务调度问题的可行方法.
关键词 有向图; 遗传算法; 并行; 任务调度; 优化; 负载均衡; directed graph; genetic algorithms; parallel; task-scheduling; optimization; load balancing;
计算机
信息安全
论文
Website
Google Scholar
任雪斌, 徐静怡, 杨新宇, 杨树森
中国科学: 信息科学, 2019, 49(12): 1586-1605
摘要 群智感知系统通过对高维感知数据的发布和分析为人们带来巨大数据价值的同时,也给参与者的隐私带来了极大的隐患.目前,各种基于差分隐私的隐私保护方法被提出,但大部分方法不能同时解决高维感知数据间复杂的属性关联问题和来自不可信服务器的隐私威胁问题.基于此,本文提出了基于Bayes网络的高维感知数据本地隐私保护发布机制.该机制实现了用户端的本地数据保护,杜绝了其他方直接访问用户原始数据的可能,根本上保护了用户的数据隐私.感知服务器端在接收到用户本地隐私保护的数据后,基于Bayes网络方法对高维数据的维度相关性进行识别,将高维数据属性集划分为多个相对独立的低维属性集,进而依次合成新的数据集,可以有效地保留原始感知数据的属性维度相关性,保证合成数据集与原始数据集具有尽可能相似的统计特性.通过大量仿真实验验证了该方法的有效性,实验结果表明该方法在有效的本地隐私保护下的合成数据具有较高的数据效用性.
关键词 群智感知系统; 感知数据; 高维数据; 本地差分隐私; Bayes网络; crowd sensing system; crowdsourced data; high-dimensional data; local differential privacy; Bayesian network;
计算机
信息安全
论文
Website
Google Scholar
付剑晶, 陈德人, 徐达文, 毛家发
中国科学: 信息科学, 2019, 49(4): 464-485
摘要 数字图像内容的恶意篡改可能导致严重后果.随着图像分辨率的提高及其在网络上流通数量的快速增长,图像往往要经过双重压缩:压缩(JPEG/JPEG2000)发布→解码→应用领域的处理(常规信号处理/安全性攻击/内容的恶意篡改)→再次压缩(JPEG2000/JPEG)发布,才能进入末端检测.如何在双重压缩环境下有效判定图像内容是否遭篡改及定位篡改位置是个亟待解决的问题.本文提出了一种基于旋转向量的新颖的水印表示方法及其调制算法,并在此基础上建立了半脆弱水印方案用于图像内容认证.理论分析了水印的稳定性,使该水印方案具有理论基础;详细阐述了以特征抽取与重构、水印嵌入与提取、篡改检测与定位为主要内容的认证方案;分析了水印的鲁棒性、安全性和相关检测性能.理论分析与实验表明:该方案水印透明性好,针对不同的攻击鲁棒性好且分布稳定;在双重压缩环境下能有效区分恶意篡改与保持内容的处理并定位篡改区域;安全性好,能抵制水印攻击、拼贴攻击和伪造攻击.与相关方案相比,本文方案综合性能优越,适用于双重压缩环境下的内容认证,扩大了基于水印的内容认证的应用范围.
关键词 图像水印; 半脆弱水印; 恶意篡改; 内容认证; 双重压缩; image watermark; semi-fragile watermark; malicious tampering; content authentication; double compression;
计算机
信息安全
论文
Website
Google Scholar
惠妍, 张雪锋
中国科学: 信息科学, 2019, 49(1): 42-56
摘要 为了提高指纹模板的安全性、不可逆性等性能,本文设计了一种基于局部细节点三维映射的指纹模板生成方法.首先对指纹图像进行预处理,提取指纹的细节点特征,并采用参数自适应的环形区域对细节点进行筛选,然后将细节点投影到直线上,并对投影后的向量集合进行量化、映射和取模运算生成固定长度的二进制比特串,最后结合用户PIN码生成指纹模板.在指纹数据库FVC2002-DB1和-DB2上的实验结果表明,该方法生成的指纹模板在认证性、可撤销性和不可逆性等主要性能上相比几种典型方法更具优势.
关键词 局部细节点; 三维映射; 参数自适应; 比特串; 指纹模板; local minutiae; three-dimensional mapping; parameter adaptive; bit-string; fingerprint template;
计算机
信息安全
论文
Website
Google Scholar
尹浩, 郭东超, 吕勇强, 杨鹏, 赵志为, 张尧学
中国科学: 信息科学, 2018, 48(12): 1651-1669
摘要 网络空间安全攸关人类福祉与国家利益,但当前网络空间安全存在重大挑战:互联网体系结构具有优越的互联互通性和开放性,但也导致其安全问题无法彻底解决,处处设防却处处难防;传统安全防御机制依赖安全威胁的先验信息,难以应对不断演化的安全威胁.为了应对上述挑战,本文提出了一种新型网络空间安全防御理论体系:构建与互联网主结构平行的"动态、异构、冗余"的基于播存思想的次结构网络,辅助现有互联网体系结构而形成双结构网络;提出不依赖安全威胁先验信息的数据与知识联合驱动的新型主动防御机理;提出双网透明接入与前置主动防御技术等关键支撑技术.为改变我国网络空间安全领域受制于人、被动防御的现状,本文试图从演进式改变网络体系结构角度提出完备解决方案.
关键词 双结构网络; 主动防御; 统一内容标签; 透明接入; 大数据; dual-structural network; active defence; uniform content label; transparent access; big data;
计算机
信息安全
论文
Website
Google Scholar
陈振华, 李顺东, 陈立朝, 黄琼, 张卫国
中国科学: 信息科学, 2018, 48(2): 187-204
摘要 点和区间关系的保密判定在范围查询中应用非常广泛,但目前已存的解决方案大多只保护了一方的隐私,而另一方的隐私并未得到保护.此外,已存方案给出的点和区间都是离散的整数(或有理数)范围.针对这些问题,本文利用安全多方计算的思想设计了保密判定点和区间关系的2种协议,不但同时保护了两方的隐私,而且将数域推广到连续的实数.本文首先利用0-1编码并结合Goldwasser-Micali同态加密给出了全隐私判定一个整数点是否在一个离散整数区间上的协议1;然后利用函数的单调性和Paillier同态加密给出了全隐私判定一个实数点是否在一个连续实数区间的协议2.最后,给出了本文协议的一个应用实例.理论和实验分析显示:本文的两个协议在取得较优通信效率的同时都取得了全隐私性.此外,协议2相比以往的方案,第一次给出点和连续实数区间的判定方法,在保持较优效率和良好性能的同时取得了通用性.
关键词 点和区间; 全隐私; 安全多方计算; 实数; 同态加密; point-range; full privacy; secure multiparty computation; real number; homomorphic encryption;
计算机
信息安全
论文
Website
Google Scholar
王春鹏, 王兴元, 张川, 朱晓强, 夏之秋
中国科学: 信息科学, 2018, 48(1): 79-99
摘要 立体图像因其强烈的沉浸感,近年来受到广泛关注,与之对应的立体图像的版权保护问题日趋紧迫.目前绝大多数用于图像版权保护的水印算法都是针对平面图像的,用于立体图像的水印算法较少.即使是立体图像水印算法,大部分算法未能很好体现和保留左右视角分量内部的特定联系,因而说必然影响算法的鲁棒性.本文提出面向立体图像的三元数极谐-Fourier矩(ternary polar harmonic Fourier moments,TPHFM),并基于此和混沌映射,提出一种鲁棒立体图像零水印算法.首先使用线性和非线性混合耦合时空混沌系统对原始二值logo图像进行混沌化,然后计算原始立体图像的TPHFM并选择适用于零水印算法的精确矩,然后计算精确矩的幅值来构造二值特征图像并使用Sine映射和Cosine映射对其进行置乱,最后将置乱的二值特征图像与二值混沌logo图像进行异或操作得到构造的零水印图像.仿真实验表明,本文算法对常规图像处理和几何攻击均具有较好的鲁棒性,并优于三元数圆谐-Fourier矩(ternary radial harmonic Fourier moments,TRHFM)算法和其他零水印算法.
关键词 三元数; 极谐-Fourier矩; 三元数极谐-Fourier矩; 立体图像; 零水印; 线性和非线性混合耦合时空混沌系统; Sine映射; Cosine映射; ternary number; polar harmonic Fourier moments; ternary polar harmonic Fourier moments; stereo image; zero-watermarking; mixed linear-nonlinear coupled map lattice; Sine mapping; Cosine mapping;
计算机
社会媒体
论文
Website
Google Scholar
韩忠明, 王宇航, 陈福宇, 杨伟杰, 毛雅俊
中国科学: 信息科学, 2023, 53(2): 234-249
摘要 动态网络链路预测是目前复杂网络的热点研究方向,网络表示学习可以有效学习到节点的相似性,从而为链路预测提供基础.现有的动态网络表示学习方法大多先将动态网络进行离散窗口化,然后在静态网络快照图上建模,这样很难有效处理具有细粒度时间特性的动态网络.本文提出了一种可以学习动态网络中复杂的时间特性的链路预测模型,该模型使用连续时间事件序列表示动态网络,对网络中的连续时间信息和结构演化特征进行学习,并提出了基于时间注意力的信息传递机制来模拟网络中信息的扩散与聚合,最后将链路预测转化为分类问题.实验在4个真实动态网络数据集以及模拟网络上进行,并以ap和auc作为评价指标.真实网络实验结果证明该模型能够较好地学习网络演化的连续性,得到更有效的节点表示,从而提升了链路预测效果.模拟网络的实验结果表明链路预测的效果和网络模型相关,但本文模型仍可以获得较好的预测效果.
关键词 链路预测; 连续时间; 动态网络; 表示学习; 复杂网络; link prediction; continuous time; dynamic network; representation learning; complex network;
计算机
社会媒体
论文
Website
Google Scholar
罗妹秋, 张春霞, 彭成, 张鑫, 郭贵锁, 牛振东
中国科学: 信息科学, 2022, 52(11): 2037-2057
摘要 知识图谱补全是知识图谱构建、自然语言处理和知识工程等领域的重要研究课题.知识图谱不仅是实现通用领域和专业领域精准知识服务的知识支撑,而且是信息检索、问答交互和信息推荐等领域取得突破性进展的必要基础.知识图谱的低质量和小规模是阻碍知识图谱广泛应用的主要瓶颈.知识图谱补全的目的是构建大规模高质量的知识图谱,以不断更新和扩充知识图谱.针对现有知识图谱补全方法难以从非结构化文本等辅助信息中提取深层次语义特征的问题,本文提出一种基于解析图嵌入和加权图卷积网络的知识图谱补全方法.一方面,该方法通过加权图卷积网络,对实体描述文本的语义依存分析进行建模,构建语义依存解析图嵌入;另一方面,引入了实体描述文本的多粒度句嵌入生成方法,旨在于构建能够捕获多粒度语义、深层次语义特征的实体表示学习.通过在两个公开数据集上的实验结果表明了本文知识图谱补全方法优于现有方法,验证了本文方法的有效性和优越性.
关键词 知识图谱补全; 解析图嵌入; 加权图卷积网络; 语义依存分析; 实体表示学习; knowledge graph completion; parsing graph embedding; weighted graph convolutional network; semantic dependency parsing; entity representation learning;
计算机
社会媒体
论文
Website
Google Scholar
鲍宇, 黄书剑, 周浩, 李磊, 戴新宇, 陈家骏
中国科学: 信息科学, 2022, 52(10): 1808-1821
摘要 文本复述可以辅助机器翻译、智能问答、文本分类等任务,是非常重要的自然语言处理任务.近年来,一些研究探索了基于结构变换的文本复述,从无监督学习的概率化表示空间中采样多个句法表示并生成多个复述.然而,通过后验分布采样句法表示生成的复述往往高度相似,缺乏多样性;另一方面,从先验分布采样句法表示又难以保证与给定的语义表示相匹配,导致生成的复述质量欠佳.本文提出了基于句法模板的文本复述模型,引入了句法模板隐变量建立语义空间和句法空间的联系,并进一步提出了两步采样策略:(1)使用先验分布采样句法模板,使得采样的句法表示更加多样化;(2)使用后验分布采样句法表示,以确保句法表示与语义表示的匹配.实验表明,两步采样策略有效地结合了先验采样和后验采样的优势,生成的文本复述可以在具备良好生成质量的同时保持着更好的多样性,取得了当前最佳的复述性能.
关键词 无监督复述; 变分自编码器; 句法结构; 采样; unsupervised paraphrasing; variational autoencoder; syntax structure; sampling;
计算机
社会媒体
论文
Website
Google Scholar
张麒, 吴宾, 孙中川, 叶阳东
中国科学: 信息科学, 2022, 52(10): 1775-1791
摘要 序列化推荐因其实用性和较高推荐精度在近期受到了人们广泛关注.不同于传统推荐方法,序列化推荐的核心在于如何基于用户近期交互行为来捕获用户的短期兴趣.现有工作或者依次考虑用户交互序列中物品之间的成对关系,忽略了更为重要的多对一关系;或者将用户最近交互的多个物品视为集合,忽略了物品之间的相对次序.这不仅未能充分挖掘物品之间的复杂关系,而且未准确刻画用户兴趣的演变过程.为此,本文提出门耦合胶囊网络(gating coupled capsule network, GCC),一种从个体层、联合层以及局部有序性3个层面细粒度分析物品间关系对于用户短期兴趣影响的方法.借助胶囊网络的空间感知能力, GCC引入个性化胶囊模块建模用户高阶时序信息,其不仅能够捕获物品间的联合层关系,也保留了物品间的局部有序性.另外,本文在GCC中设计了用于建模物品间成对关系的个性化门单元模块,以此捕获个体层关系对于用户短期兴趣的影响.在4个真实推荐场景下的实验结果表明, GCC相比于主流序列化推荐方法在多个评价指标上具有显著的性能优势.
关键词 胶囊网络; 序列化推荐; 门单元机制; 隐式反馈; 推荐系统; capsule networks; sequential recommendation; gating mechanism; implicit feedback; recommender systems;
计算机
社会媒体
论文
Website
Google Scholar
闫昭, 项欣光, 李泽超
中国科学: 信息科学, 2022, 52(6): 1069-1082
摘要 会话推荐旨在根据用户在会话中的短期行为,预测用户的后续行为,多应用于用户匿名访问网站的场景.会话推荐的核心在于商品之间协同关系的建模,以提升推荐结果的性能.现有方法大都挖掘商品交互顺序信息以计算商品间的协同关系.这种方式仅仅考虑了商品之间的相邻交互的信息,忽视了历史交互信息.其实,若两个商品共享相同的历史交互信息,即它们具有一定的协同关联性.例如,在两个商品交互序列为I_1-I_2-I_3和I_1-I_2-I_4的会话中,商品I_3与I_4的历史交互信息均为I_1-I_2,则商品I_3与I_4极有可能具有较强的关联关系.因此,本文提出了一种新颖的会话推荐模型IHGCN,通过分析会话的商品交互序列建模商品之间的关联关系,同时挖掘了相邻交互信息和历史交互信息.为了从这些交互信息中协同分析出商品特征,所提出方法使用图结构构建商品之间的关系,并引入图卷积网络从商品关系图中学习商品特征.该方法使用特征维度级的细粒度注意力机制挖掘户的全局偏好,并融合用户的局部偏好;基于学习得到的商品特征和用户偏好特征生成最终的推荐结果.本文在3个公开数据集上进行了验证分析,与当前最好的相关方法的比较结果表明所提出方法 IHGCN的有效性和优越性.
关键词 会话推荐; 图卷积网络; 商品交互相似性; 用户偏好; 注意力机制; session-based recommendation; graph convolutional network; item interaction similarity; user preference; attention mechanism;
计算机
社会媒体
论文
Website
Google Scholar
李志欣, 凌锋, 唐振军, 马慧芳, 施智平
中国科学: 信息科学, 2021, 51(12): 2053-2068
摘要 跨媒体哈希检索将不同媒体数据编码到公共二值哈希空间中,从而可以有效地测量不同模态样本之间的相关性.为了进一步提高检索性能,提出基于多头注意力网络的无监督跨媒体哈希检索方法.首先,利用多头注意力网络生成哈希码矩阵,使图像和文本能获得更好的匹配.其次,构造一个辅助相似度矩阵,用以整合来自不同模态的原始邻域信息.通过辅助相似度矩阵与哈希码矩阵的协同学习,能够捕获不同模态之间和相同模态内部的潜在联系.此外,设计了两种损失函数训练网络模型,并使用批量归一化和更换哈希码生成函数的策略对模型进行优化,使模型的训练速度得到大幅提升.在3个数据集上的实验表明,本方法的平均性能比目前国际上先进的无监督方法有显著提升,充分证明了本方法的有效性和优越性.
关键词 卷积神经网络; 多头注意力网络; 跨媒体哈希检索; 无监督学习; 协同学习; 辅助相似度矩阵; 批量归一化; convolutional neural network; multi-head attention network; cross-media Hashing retrieval; unsupervised learning; collaborative learning; auxiliary similarity matrix; batch normalization;
计算机
社会媒体
论文
Website
Google Scholar
刘小洋, 何道兵, 刘超, 张宜浩
中国科学: 信息科学, 2021, 51(11): 1867-1884
摘要 针对目前社交网络上信息传播动力学的研究成果中,未能从社会物理学层面揭示微观个体上的随机性和无序性与宏观群体上的可知性和可控性之间的关系问题,本文提出了一种基于时变阻尼运动的信息传播动力学模型(time-varying damped motion, TVDM).首先,深入分析社交网络中信息传播现象,从时间、空间、主体(行为人)、客体(信息) 4个维度提取关键特征;然后,从带阻尼的简谐运动视角、内外力系合力作用视角、信息能量转化视角、时变系统与信号变换视角,揭示了社交网络上信息传播的物理学本质规则和作用机制;最后,通过数值模拟实验验证了网络上个体行为服从统计规律性.实验结果表明:提出的时变阻尼运动信息传播动力学模型精度为91%,构建的社交网络信息传播动力学模型TVDM是合理有效的.
关键词 社交网络; 动力学; 信息能量; 阻尼运动; 时变系统; social network; dynamics; information energy; damping motion; time-varying system;
计算机
社会媒体
论文
Website
Google Scholar
黄振华, 王振宇, 江莉, 张睿, 雷昶, 刘星炜, 谢晓辉
中国科学: 信息科学, 2020, 50(12): 1882-1902
摘要 2020年年初,新型冠状病毒感染的肺炎(COVID-19)爆发,中国采取了全面严格的防控举措全力抗击疫情.地方疫情指挥部门及时通报疫情感染数据,有助公众了解疫情的发展,及时做好防护措施.各地患者病例详情数据主要以文本形式记录,信息描述复杂,且各省市汇报的格式各异,处理难度较大.我们面向全国湖北省外近二分之一匿名的患者病例详情数据,提出了应用自然语言处理技术,辅助病例数据结构化的方法.该方法可以在标记样本较少的情况下,借助预训练模型,准确有效地提取出病例文本中的关键信息.通过对较大规模患者结构化病例数据的挖掘,本文详细分析了新型冠状肺炎总体发病性别和年龄分布特点、主要感染原因、潜伏期特点及疫情趋势等特征.由于潜伏期等时间延迟的存在,确诊人数往往不能反映一个地区的真实感染情况,结合出行大数据,本文提出了一个合理推断武汉市等城市实际感染人数的方法.该方法有助于人们提前估计地区疫情发展情况,及早采取防护措施.也可以辅助地方相关部门科学决策,尽早调度医务人员和分配医疗资源.
关键词 新型冠状病毒; 结构化病例; 自然语言处理; 预训练模型; COVID-19传播特征; 出行大数据; coronavirus; structured medical cases; natural language processing; pretrained models; COVID-19 transmission characteristics; big data of traveling;
计算机
社会媒体
论文
Website
Google Scholar
王鸿伟, 过敏意
中国科学: 信息科学, 2020, 50(12): 1867-1881
摘要 在很多在线推荐系统场景中,用户和系统的交互通常都会按照时间间隔划分成一系列的会话.本文研究了如何在基于会话的推荐系统中对用户兴趣进行建模.现有的工作或者假设会话之间相互独立,忽略了历史会话中包含的长期用户兴趣信息;或者将用户在一个会话中的短期兴趣视为静态不变.这两者都无法充分刻画实际场景中的用户兴趣和行为.我们提出了循环记忆网络RMN,一种刻画了用户长期和短期兴趣的基于会话的推荐系统. RMN基于循环神经网络模型,其核心部分是一个储存了用户长期偏好的兴趣记忆模块.另外,我们在RMN中设计了一个会话内的记忆读取单元和一个会话间的记忆写入单元,这两个单元分别用于刻画短期(即一个会话内)的用户兴趣波动和长期(即跨越多个会话)的用户兴趣转移.我们在真实的电影推荐和职位推荐数据集上进行了实验,实验结果表明RMN相比于现有方法而言取得了显著的性能提升.
关键词 推荐系统; 会话; 长短期用户兴趣; 循环神经网络; 记忆网络; recommender systems; session; long-short term user preferences; recurrent neural networks; memory networks;
计算机
社会媒体
论文
Website
Google Scholar
蔡剑平, 雷蕴奇, 陈明明, 王宁, 张双越
中国科学: 信息科学, 2020, 50(10): 1544-1558
摘要 作为推荐系统的重要组成部分,协同过滤已成为了当今主流的推荐方法之一.其中基于潜在因子的协同过滤常采用SVD推荐模型分析用户喜好.近年来,随着SVD推荐模型研究的深入, SVD++,TrustSVD等一类带有隐式反馈的SVD推荐模型被相继提出.此类模型能更有效地从有限的数据源中挖掘有用信息并取得了较好的效果,因此受到了人们广泛关注.然而,现有文献大多关注于模型设计,缺乏专门针对带有隐式反馈的SVD推荐模型的高效求解算法.为此,本文首先研究了一般性的SVD推荐模型梯度求解框架,然后以SVD++推荐模型为突破口,基于块梯度下降方法设计了高效求解算法BCDSVD++并解决了容量矩阵求逆、稀疏数据优化处理等两个关键问题.实验表明,本文所设计的BCDSVD++算法具有比传统的并行梯度下降法更高效的求解效率及收敛能力.
关键词 SVD推荐模型; 隐式反馈; SVD++; 块坐标下降法; 协同过滤; SVD recommendation model; implicit feedback; SVD++; block coordinate descent method; collaborative filtering;
计算机
社会媒体
论文
Website
Google Scholar
高嘉良, 仇培元, 余丽, 黄宗财, 陆锋
中国科学: 信息科学, 2020, 50(7): 1055-1068
摘要 景点推荐系统可以帮助游客过滤大量的无关信息,还能辅助商家发掘潜在的顾客.然而,现有的基于传统方法的推荐系统,如基于内容的推荐或协同过滤系统,虽推荐过程相对透明直观,但由于数据稀疏性的存在,推荐结果往往不够准确;基于深度学习的推荐方法,虽在一定程度上提高了推荐结果的精度,但由于缺乏可解释性和透明度,难以满足部分用户理解推荐依据的愿望,也阻碍了此类方法的推广应用.为了解决当前方法所存在的局限,本文引入基于知识图谱的景点推荐框架,将推荐过程与知识图谱嵌入相结合,推断用户兴趣在知识图谱上的传播路径,以此作为推荐依据.此外,本文通过对真实旅游数据的多角度时空分析,探究旅游活动的时空规律,并将其应用于景点推荐框架中,提出一种面向旅游的基于知识图谱的可解释推荐方法——Geo-RippleNet,并通过构建基于开放网络资源的旅游知识图谱,对Geo-RippleNet进行了全面的实验验证.结果表明,本文提出的基于知识图谱的景点推荐方法,不仅可以最大限度地吸收知识图谱丰富的语义信息,从而实现可观的性能提升,还能充分利用图谱的关系知识,推理兴趣传播路径,以增强推荐结果的可解释性.此外,将旅游活动的时空规律融入到上述推荐框架中,能够还原用户出游和决策的时空过程,进一步提高方法的性能表现.
关键词 旅游知识图谱; 景点推荐; 可解释性; 推荐系统; 旅游管理; tourism knowledge graph; attraction recommendation system; interpretability; recommendation system; tourism management;
计算机
社会媒体
论文
Website
Google Scholar
刘铭, 郑子豪, 秦兵, 刘一仝, 李阳
中国科学: 信息科学, 2020, 50(7): 1033-1054
摘要 随着网络信息的剧增,信息流服务备受用户关注.在信息流服务中,如何衡量文本之间的相关度进而从多来源的信息渠道中过滤掉冗余信息提升推荐满意度成为至关重要的环节.当前主流的文本相关度计算方法均是将文本表示为向量,进而通过衡量向量之间的相似度来度量文本间的相关度.然而,信息流中的文本多为新闻文本,这些文本的核心是其描述的事件,基于此需要从事件的角度挖掘文本的核心特征进而利用其计算文本间的相关度.当前针对事件的研究大多数着眼于句子级别.事实上,在计算文本相关度时,需要从篇章级别把握文章的内容.故此,篇章级的事件分析更有影响力.为此,本文在句子级事件抽取的基础上,提出了一种篇章级的事件表示方法,其利用句子级事件的抽取结果构建篇章事件连通图,并选取图中重要的节点作为篇章级事件的代表,之后利用篇章级的事件表示结果来度量文本之间的相关度.实验显示,本文提出的文本相关度计算方法要远好于传统的文本相关度计算方法.
关键词 篇章事件连通图; 篇章级事件相关度; 文本排序; 关键子句筛选; 子句连通图; passage event connection graph; passage-level event correlation; textrank; selection of key sentence; sentence-level connection graph;
计算机
社会媒体
论文
Website
Google Scholar
张雪英, 张春菊, 吴明光, 闾国年
中国科学: 信息科学, 2020, 50(7): 1019-1032
摘要 地理知识是人类对地理现象或事物空间分布、演变过程和相互作用规律的认知结果.当前大数据环境下的地理信息服务,普遍存在"数据海量、信息爆炸、知识难求"现象.地理知识图谱是一种利用语义网络对地理概念、实体及其相互关系进行形式化描述的知识系统,在地理知识理解、地学问题求解、时空预测决策等方面具有巨大的应用潜力.地理知识除了具有通用知识的内涵和特点之外,还具有特定的时空特征和地学机理特点.因此,地理知识图谱构建和应用既具有一定的通用性,同时具有一定的专业特殊性.本文结合地理知识的时空特征和知识图谱的表达形式,提出了一种顾及时空特征的地理知识图谱构建方法.首先,系统梳理了地理知识图谱构建的基本思路和技术流程,并简要阐述了地理知识获取、地理知识抽象与表达、地理知识组织与管理3个关键环节的主要研究内容及其进展.其次,从地理学回答的基本问题出发,对地理知识的内容特征进行概括和抽象,构建了涵盖"地理概念–地理实体–地理关系" 3个层次的地理知识表达模型,用于描述不同粒度地理知识语义单元的基本组成及其逻辑关系.最后,借鉴知识图谱采用的语义网络知识表示方法,提出了基于"过程–关系"的地理知识表示方法.该方法以时间和空间特征为基本条件,以地理实体的状态划分为基础,实现了地理实体演化过程以及复杂地理关系的形式化描述.本文的研究成果有效解决了融合时空间维度的地理知识结构化表达和形式表示问题,为地理知识获取、融合、推理与应用奠定了基础.同时,在地质、环境、气象等地学领域具有一定通用性,对地学知识服务的推进具有重要参考价值.
关键词 地理实体; 时空特征; 地理知识表达模型; 地理知识形式化; 地理知识图谱; geographical entity; spatio-temporal feature; geographical knowledge representation model; geographical knowledge formalization; geographical knowledge graph;
计算机
社会媒体
论文
Website
Google Scholar
杨一帆, 马进, 王海涛, 何正球, 陈文亮, 张民
中国科学: 信息科学, 2020, 50(7): 1003-1018
摘要 一个准确丰富的人物关系图谱不仅能够为大众提供人物实体的清晰介绍和人物之间的相互关联,而且能够为智能服务系统提供有效的知识支持.目前大多知识来源均以百科类表格数据为起点,在此基础上构建知识图谱.本文主要描述如何充分利用百科类文本数据构建高质量的人物关系图谱.为解决表格数据中存在属性缺失和错误的问题,我们采用模式匹配和深度学习模型相结合的策略从文本数据中自动学习属性值,进行属性补全和纠错,有效提高了知识图谱的覆盖率和正确率.
关键词 知识图谱; 人物关系图谱; 属性补全与纠错; 信息抽取; knowledge graph; inter-personal relation knowledge graph; attribute identification; information extraction;
计算机
社会媒体
论文
Website
Google Scholar
李冬, 申德荣, 寇月, 林梦儿, 聂铁铮, 于戈
中国科学: 信息科学, 2020, 50(2): 221-238
摘要 现实世界中的实体连同关联关系构成了一种网络关系结构即异构信息网络.利用链路预测技术可以预测出异构信息网络中存在但未被观察到,或者未来可能会出现的链路,更好地帮助用户理解网络的结构生成和演化规律.然而,目前链路预测技术缺乏对多种特征的有效融合而影响预测准确性,且难以适应异构信息网络的异构性和动态性.本文提出了一种层次化混合特征图模型(hierarchical hybrid feature graph, HHFG),充分考虑了异构信息网络的拓扑特征、语义特征和时序特征.提出了一种基于HHFG的链路预测算法,基于混合特征在HHFG上做随机游走,并采用梯度下降法学习特征权重,转移系数等参数,有效地保证了链路预测的准确性.通过实验验证了本文所提出的关键技术的可行性和有效性.
关键词 链路预测; 层次化混合特征图; 异构信息网络; 随机游走; 参数学习; link-prediction; hierarchical hybrid-feature graph; heterogeneous information networks; random walk; parameters learning;
计算机
社会媒体
论文
Website
Google Scholar
李丽双, 周安桥, 刘阳, 钱爽, 耿浩彭
中国科学: 信息科学, 2019, 49(8): 1019-1030
摘要 特定目标情感分类是一个极具挑战的任务,其目的是确定上下文语境中某些实体所表达的情感.由于目标实体的情感依赖于实体本身以及对上下文的理解,在分类时应该同时考虑句子和目标实体,并且需要将目标实体与上下文语义进行充分的整合.因此,本文提出:(1)句子、目标实体联合编码方法;(2)基于动态注意力DAGRU (dynamic attention gated recurrent unit)的特定目标情感分析方法.联合编码是指同时对句子和目标实体进行语义编码,能为目标实体增加上下文语义;动态注意力机制能动态地改变模型对上下文单词的注意力以及目标实体的表示,从而更有效地获取上下文情感特征,使模型更准确地识别不同目标实体的情感类别.本文模型在SemEval2014的两个数据集Laptop, Restaurant上进行实验,实验结果表明,基于动态注意力DAGRU的模型相比基于标准注意力的模型结果有显著提高.
关键词 注意力机制; GRU; 情感分析; 深度学习; 自然语言处理; attention mechanism; GRU; sentiment analysis; deep learning; natural language processing;
计算机
社会媒体
论文
Website
Google Scholar
陈龙, 饶琪, 刘扬
中国科学: 信息科学, 2019, 49(8): 1005-1018
摘要 作为一种意合型语言,汉语由字组词的特性明显,字面义词的词义大体可由其构词结构和语素概念来表达,但对非字面义词的处理存在偏差,这也是语言深度理解中的一个棘手问题.本文从语言认知的角度出发,提出了适用于汉语词的非字面义的知识表示方式:发掘《现代汉语词典》中的3524个非字面义二字词,判定它们作为隐喻或转喻现象的非字面义类型,标注其在《同义词词林》中的源域、目标域,并选取面向计算的适合的字面义词承担者.该工作首次在词汇级别上,系统地揭示了汉语隐喻和转喻现象的数量、类型及语义域映射分布状况,并且在算法框架不变的情况下,显著改善了词义相似度计算效果.这些思路、做法及语言资源建设,有望推动人文领域和计算应用等相关工作的深入开展.
关键词 汉语概念词典; 语素; 语素概念; 语义构词; 字面义; 非字面义; 隐喻; 转喻; Chinese object-oriented lexicon; morpheme; morphemic concept; semantic word formation; literal meanings; non-literal meanings; metaphor; metonymy;
计算机
社会媒体
论文
Website
Google Scholar
周经亚, 樊建席, 王进
中国科学: 信息科学, 2018, 48(3): 329-348
摘要 在线社交网络的兴起吸引了越来越多用户的加入,面对数以亿计的用户量,如何以一种可扩展的方式存储用户数据已成为社交服务提供商和学术界共同关注的热点问题.目前广泛采用的分布式键值存储通过Hash方法将用户数据随机放置在不同的存储服务器上,这种方法会导致数据中心内部巨大的通信量,不利于社交网络的扩展.本文针对社交网络中用户交互的特点,提出一种社交图划分与数据复制相结合的数据放置方法;进一步考虑数据中心网络拓扑,针对具体拓扑结构,设计数据放置算法,并分别讨论了算法对社交网络规模的增量调整以及分布式实现.在真实数据集上的比较实验结果表明本文所提出的算法能够有效降低社交网络数据中心内部通信量,增强其可扩展性.
关键词 在线社交网络; 数据放置; 数据中心网络; 社交局部性; 位置局部性; online social networks; data placement; data center networks; social locality; position locality;
计算机
软件
论文
Website
Google Scholar
杨培忠, 王丽珍, 王晓璇, 周丽华
中国科学: 信息科学, 2022, 52(6): 1053-1068
摘要 空间并置(co-location)模式挖掘旨在发现空间特征间的关联关系.一个并置模式是空间特征集合的子集,它们的实例在空间中频繁并置出现.传统的并置模式挖掘方法大多基于表实例计算模式的并置程度,但表实例的生成和存储将导致巨大的时间、空间消耗.针对这一问题,本文提出了一种基于列计算的空间并置模式挖掘方法,不再生成表实例,只需要搜索模式的参与实例.为了加速参与实例搜索,设计了实例搜索空间剪枝、候选参与实例验证、频繁性提前感知等优化策略.在此基础上,提出了CPM-Col算法,讨论了算法的复杂度、正确性和完备性.在真实和模拟数据集上进行了大量实验,实验结果表明,本文提出的算法比其他7个baseline算法具有更好的性能和可扩展性,特别地,CPM-Col算法的效率提升达到数倍至数个量级.此外,实验验证了本文提出的优化策略的有效性.
关键词 空间数据挖掘; 并置模式; 列计算; 搜索算法; 剪枝技术; spatial data mining; co-location pattern; column calculation; search algorithm; pruning technique;
计算机
软件
论文
Website
Google Scholar
王磊, 张云秋, 徐丙凤, 徐逸卿
中国科学: 信息科学, 2021, 51(9): 1438-1450
摘要 随着全球云计算产业规模的迅速增长,采用按需付费的方式,基于云服务组合实现大规模软件服务的动态集成和协同,从而构造复杂软件,已成为一种切实可行的方法.所构建的组合云系统运行在动态、不确定的环境下,如何应对系统运行可靠性数据流的概念漂移问题,保障系统运行质量,是一个亟待解决的挑战性问题.为给针对组合云系统的可靠性自适应提供早期指导,本文基于主动式缺陷管理思想,研究组合云系统运行风险的在线感知方法,提出基于Sinkhorn距离的可靠性概念漂移在线度量方法 RCDMeas.这一方法通过引入熵正则化和不动点迭代,计算系统历史累积的可靠性流数据和临近的可靠性流数据的分布距离,从而识别组合云系统可靠性概念漂移及系统潜在运行风险.大规模数据实验结果验证了本文方法的有效性.本文的工作对服务组合系统的自动化运维具有重要的理论意义与实际应用价值.
关键词 组合云系统; 可靠性; 概念漂移; 在线; 运行质量保障; composite cloud systems; reliability; concept drift; online; execution quality assurance;
计算机
软件
论文
Website
Google Scholar
潘峰, 巩敦卫, 田甜, 姚香娟, 李吟
中国科学: 信息科学, 2021, 51(4): 565-581
摘要 测试是提高软件可靠性的重要方法.消息传递并行程序中存在的不确定通信语句,使得进程执行顺序具有不确定性,这增加了测试该类程序的难度.鉴于进程执行顺序对目标路径覆盖难易程度的影响,本文研究消息传递并行程序多路径覆盖调度序列排序方法,以提高多路径覆盖测试数据生成的效率.首先,在每个调度序列下,以每个采样的程序输入执行程序,生成路径覆盖矩阵;然后,针对每条目标路径,分别计算与路径覆盖矩阵中每条路径的相似度,生成多个路径相似度矩阵;接着,基于这些路径相似度矩阵的特征量,评价调度序列的性能,并依此对调度序列排序;最后,基于调度序列排序集,使用随机采样法,生成覆盖所有目标路径的测试数据,并使用缺陷检测平均百分比(average percentage of faults detected, APFD)指标评估调度序列排序集.将所提方法应用于9个基准并行程序中,并与随机方法和传统方法进行比较.实验结果表明,所提方法对路径覆盖率没有影响,但显著减少了被测程序执行次数和运行时间.
关键词 消息传递并行程序; 多路径覆盖; 测试; 调度序列排序; 路径相似度; message-passing parallel program; multi-path coverage; testing; scheduling sequence sorting; path similarity;
计算机
软件
论文
Website
Google Scholar
申博, 张伟, 赵海燕, 金芝, 吴艳红
中国科学: 信息科学, 2021, 51(2): 206-230
摘要 拼图游戏是一类复杂问题的典型代表.这类问题的复杂性体现在其无法通过自上而下、集中控制的方式进行有效求解.通常情况下,拼图游戏由一个玩家独立完成,或由几个玩家围坐在一起协同完成.本文提出一种基于互联网人类群体智能的拼图问题求解方法.该方法使用一种被称为"探索–融合–反馈"的回路用于支持人类玩家群体在互联网环境中进行并行、协同的拼图问题求解.其中,探索活动由玩家实施,融合与反馈活动由拼图环境自动实施.在探索活动中,每个玩家独立进行拼图问题的求解,不与其他玩家发生直接的交互.在任何时刻,一个玩家探索活动的结果是一个关于当前拼图问题的片段解,以及一组被该玩家判断为错误的图块邻接关系.在融合活动中,拼图环境实时地将所有玩家的当前探索结果融合在一起,形成一个不断演化的群体观点图.在反馈活动中,对于每一个玩家,拼图环境根据该玩家的当前探索结果和当前的群体观点图,向该玩家推荐特定的信息,以加速其拼图进程.我们实现了一个支持上述方法的多人在线拼图环境,并在2~10人规模的玩家群体中进行了初步的实验.实验结果表明:(1)在这一多人拼图环境中,拼图求解时间大致正比于玩家数量的倒数,且以玩家群体中的最强个体为基准点,群体拼图效率能够实现31.36%~64.57%的提升;(2)在该环境中,最快完成拼图的玩家获得的反馈信息平均具有86.34%的准确率,且随着群体规模的增加,反馈信息在最快玩家拼图结果中的平均占比逐渐从20%增加到45%左右;(3)相比于面对面协同的群体拼图求解方式,该环境展示出更好的群体规模可扩展性,且拼图结果总是具有100%的正确率,而拼图问题自动求解算法平均只具有52%的正确率.我们希望本文工作能够为探索群体智能在互联网环境下的更广泛应用提供一些有用的信息或观点.
关键词 人类群体智能; 互联网; 复杂问题求解; 拼图问题; 信息融合与反馈; collective human intelligence; Internet; complex problem solving; pictorial jigsaw puzzle; information integration and feedback;
计算机
软件
论文
Website
Google Scholar
赵鑫, 郭成昊, 黄强, 张煜, 于靖
中国科学: 信息科学, 2020, 50(11): 1665-1679
摘要 围绕如何构建能够在高动态战场环境下持续保障多样化任务完成的指挥控制系统,依据可成长软件理论、方法,提出了一套指挥控制系统的自主适变解决方案;首先建立了具备自主适变能力的指挥控制系统总体架构模型,并构建了面向深度软件定义的核心任务保障框架;在此基础上,给出了基于"环境认知环–决策执行环"的"双环"自主适变机制,以实现面向任务保障的主动感知、适变控制和重构演化;最后基于所构建的技术验证原型系统进行了运行等级转进、资源受损下的业务持续运行等典型场景下的仿真试验验证.
关键词 指挥控制系统; 可成长软件; 自主适变; 核心任务保障; command and control systems; growing software systems; autonomous adaptability; core-mission assurance;
计算机
软件
论文
Website
Google Scholar
唐震, 王伟, 黄宇, 李艳林, 纪树平, 宋傲, 魏峻, 黄涛
中国科学: 信息科学, 2020, 50(11): 1645-1664
摘要 配置管理是支撑云服务提供商管理大规模容器集群的重要基础设施.这一规模的集群通常包含百万量级的容器实例,如何根据不同业务场景的需求,及时可靠地将配置更新推送至对其感兴趣的容器实例,是亟待解决的关键问题.然而,现有方法仍存在不足之处.保障顺序一致性的共识算法限制了集群的扩展能力,难以适用于大规模集群.反熵算法存在长尾现象,时延难以保障,不适用于推送关键的配置更新.为了应对上述挑战,本文提出了一种面向大规模集群的柔性配置更新推送方法.这一方法基于发布/订阅机制,引入基于完全N叉树拓扑的可定义的多层次推送,并使用订阅者的部分计算资源协助推送,以提升推送性能;引入容错机制以应对节点失效和网络分区,保障网络分区时多分区读写可用.方法的拓扑参数和策略可根据业务场景对性能、可靠性等维度的不同需求而调整.实验结果表明,与现有的方法相比,我们的方法可以有效降低更新推送的时延,并可有效应对节点失效和网络分区场景.
关键词 更新推送; 配置管理; 完全N叉树; update delivery; configuration management; complete N-ary tree;
计算机
软件
论文
Website
Google Scholar
贾周阳, 李姗姗, 刘晓东, 王戟, 廖湘科
中国科学: 信息科学, 2020, 50(11): 1612-1628
摘要 高质量的日志代码是软件故障诊断的重要依据.由于缺乏统一规范、开发人员不够重视等原因,现有软件中的日志质量参差不齐.目前,已有工作致力于日志的自动化增强,主要分为基于易错模式的方法和基于代码特征的方法,这些方法通过总结软件易错代码模式或学习已有日志代码的代码特征,进而在相应的代码段中自动添加日志语句.但开发人员添加日志代码的意图往往难以用固定的模式或特征来描述,导致日志增强的准确性不高.因此,本文探索了意图敏感的日志增强方法,提出了一种日志意图描述模型(log-intention description model, LIDM),在此基础上设计和实现了自动化日志增强工具SmartLog. SmartLog利用LIDM提取日志代码意图,挖掘日志增强规则,进而实现意图敏感的日志自动增强.本文在6款成熟且被广泛使用的开源软件上对SmartLog的有效性展开了评估.评估结果显示, SmartLog的准确性相比两个已有最好的日志增强工具分别提升43%和16%.此外,本文收集了软件演化过程中86个开发人员增加日志的实例,并使用SmartLog和两个已有工具分析每次日志演化的旧软件版本,发现3个工具可自动在新软件版本添加的日志分别是49, 10, 22个,软件演化效率相比已有工作显著增强.
关键词 日志增强; 故障诊断; 日志演化; 软件意图; 日志自动化; log enhancement; failure diagnosis; log evolution; software intention; log automation;
计算机
软件
论文
Website
Google Scholar
冯洋, 王祎, 房春荣, 郭楠楠, 陈振宇
中国科学: 信息科学, 2019, 49(11): 1412-1427
摘要 构建高可信众包群体是众包活动的一个重要挑战.目前,众包机制研究主要集中在激励众包个体,而忽略了能够反映微服务质量的高诚信众包群体的构建.本文根据通过融合委托–代理模型和信号博弈理论提出了一种新颖的高可信众包群体构建机制.该机制实现了众包工人和发包方的信息交换,并通过随机质量审查来为诚信/失信工人提供动态的经济激励/惩罚.本文通过大规模的仿真实验来对该机制进行验证.实验结果表明该机制具有良好的有效性和高效性,能够通过极小的代价让能力强但失信的工人在任务提交前改正行为做出诚信决策.
关键词 可信众包; 众包机制; 信号博弈理论; 委托代理模型; trustful crowd-sourcing; crowd-sourced mechanisms; signaling game theory; principal-agent model;
计算机
软件
论文
Website
Google Scholar
周明辉, 张宇霞, 谭鑫
中国科学: 信息科学, 2019, 49(11): 1399-1411
摘要 随着互联网不断发展,软件开发(尤其是全球开源开发)面临诸多问题和挑战,如分布在全球的开发者个体差异明显,群体协作的困难度增加,并且广泛的社会参与形成复杂生态等.这些问题使得软件开发呈现出很强的社会学特征.因此,本文提出软件数字社会学来刻画和应对以上问题的挑战,涉及个体学习、群体协作和可持续生态.本文对核心研究方法——软件开发活动数据的挖掘和分析进行了讨论,并初步探讨了已经形成态势的开源供应链的重要问题.软件数字社会学可以启发研究者们更好地理解软件开发面临的关键挑战并探索更好的解决方案.
关键词 软件数字社会学; 软件活动数据; 个体学习; 群体协作; 开源生态; 软件供应链; 数据质量; software digital sociology; software-activity data; individual learning; group collaboration; opensource ecosystem; software supply chain; data quality;
计算机
软件
论文
Website
Google Scholar
陈俊洁, 胡文翔, 郝丹, 熊英飞, 张洪宇, 张路
中国科学: 信息科学, 2019, 49(10): 1283-1298
摘要 编译器缺陷报告在编译器质量保证中具有重要作用,而重复缺陷报告往往带来不必要的人力、时间等资源浪费.为了识别编译器重复缺陷报告,本文提出了一种静态的重复缺陷报告识别方法IdenDup.该方法可以有效解决两个场景下的重复缺陷报告问题,即模糊测试(fuzz testing)所产生的缺陷报告和缺陷管理系统中不同来源的缺陷报告.具体来说, IdenDup利用缺陷报告中静态文本和程序特征来识别重复缺陷报告,其中程序特征包括程序词法、语法,以及本文首次提出的数据流特征.特别地,程序数据流特征指的是程序中变量使用路径(变量使用方式及使用方式的顺序)特征.之后,我们使用C语言的两个主流编译器GCC和LLVM作为实验对象,对IdenDup的效果进行了实验探究.实验结果表明, IdenDup可以有效地识别上述两个场景下的重复缺陷报告,并且超过已有方法.
关键词 编译器调试; 编译器缺陷报告; 重复缺陷报告; 数据流分析; 静态方法; compiler debugging; compiler bug report; duplicate bug report; dataflow analysis; static approach;
计算机
软件
论文
Website
Google Scholar
廖小飞, 陈意诚, 张宇, 金海, 刘海坤, 赵进
中国科学: 信息科学, 2019, 49(8): 988-1004
摘要 强连通分量(strongly connected component, SCC)算法可以将一个有向图缩略为有向无环图(directed acyclic graph, DAG),广泛应用于可达性查询等有向图分析应用.尽管现有工作已经提出多种面向静态有向图的强连通分量算法,但是它们需要高额的运行时开销来反复对整个图进行全量计算,以响应现实世界中普遍存在的动态有向图结构的频繁变化.其实,在通常情况下,动态有向图每次改变量极小(少于5%).其允许我们以增量的方式对动态有向图进行强连通分量计算,以缩短响应时间.因此,为解决此问题,本文提出了一种高效的面向动态有向图的增量强连通分量算法Incremental Strongly Connected Components Algorithm,简称Inc-SCC,通过对不必要的计算进行裁剪以减少算法的数据访问量和计算量,并利用SCC的不相交性进行并行处理以提升SCC计算效率.其次,提出了一种启发式优化方法进一步加快算法收敛速度.实验结果显示,本方法可以用于实时响应有向图持续性动态变化,并且当整个有向图的边变化比例为5%时,本方法相对于现有算法的加速比可达2.8到12倍,当整个有向图的边变化比例为0.5%时,本方法相对于现有算法的加速比可达2.9到12倍.
关键词 强连通分量; 动态有向图; 增量计算; 收敛; 有向无环图; strongly connected components; evolving directed graph; incremental computation; convergence; directed acyclic graph;
计算机
人机交互
论文
Website
Google Scholar
王慧, 姚乃明, 董健, 朱频频, 陈辉
中国科学: 信息科学, 2018, 48(4): 475-484
摘要 以聊天机器人为代表的Bots带动了以用户为中心的全新交互体验.基于多通道自然语言交互的Bots不再依赖于桌面的图形环境,源于桌面隐喻的传统WIMP(windows,icon,menu,pointor)范式也不再适用于基于Bots的人机交互,因此需要建立一种新的支持移动交互的界面范式来规范界面的描述.为此,本文对化身隐喻(avatar metaphor)进行扩展,提出了基于化身交互隐喻的ASLI(avatar,scenario,language,instrument)界面范式,并给出了基于ASLI范式的界面实例和交互框架,为基于Bots的人机交互系统提供了界面设计的指导.最后,讨论了未来ASLI范式的平台化发展趋势和衍生的生态系统.
关键词 Bots; 人机交互; 界面范式; 化身隐喻; Bots; human-computer interaction; interface paradigm; avatar metaphor;
计算机
人机交互
论文
Website
Google Scholar
刘胜航, 陈辉, 朱嘉奇, 武汇岳, 熊金泉, 王宏安
中国科学: 信息科学, 2018, 48(4): 466-474
摘要 随着认知科学与移动计算技术的发展与应用,如何构建与评估自然用户界面成为越来越重要的问题.为此,本文在分析了自然人机交互主要特征的基础上,指出了自然语言的使用及其语义理解的重要性,借用语言学的语义三角形模型,提出了基于语义三角形的自然人机交互模型.该模型诠释了自然人机交互场景下,人与计算机之间信息流转与理解过程.最后,基于该模型给出了自然性、连续性和易学性3个评估要素的评估思路.
关键词 自然人机交互; 自然用户界面; 语义三角形; 自然人机交互模型; 用户界面评估; natural HCI; NUI; semiotic triangle; natural HCI model; user interface evaluation;
计算机
人机交互
论文
Website
Google Scholar
王党校, 郑一磊, 李腾, 彭聪, 王丽君, 张玉茹
中国科学: 信息科学, 2018, 48(4): 449-465
摘要 人机和谐是人机交互的理想境界和永恒追求.近年来人工智能的蓬勃发展使得机器智能不断进步,引发了对于人类智力造成挑战的担忧.能否利用多模态人机交互技术实现人类智能的训练和强化,是人机交互研究的新命题.神经可塑性研究成果表明,人类的核心认知能力,如注意力控制能力、工作记忆容量等,有望通过视听觉交互任务、触觉交互任务、经颅电磁刺激、脑机接口等技术进行训练和强化.本文通过剖析虚拟现实系统的沉浸感、交互性、想象性的本质优势,结合工程控制论思想,提出面向人类智能增强的视听触觉多模态有机融合的人机交互机制.通过构建可控认知负荷、及时生理反馈、双向体脑交互的新型人机交互系统,探索基于Hebbian learning可塑性机制的智能增强方法.该研究将为揭示和认识人脑神经可塑性机制提供新的研究工具,同时将促进新型人机交互的硬件设备和软件方法研究,并将在个性化教育、神经康复、特种职业认知能力强化等领域产生应用价值.
关键词 神经可塑性; 触觉交互; 视听触融合; 人机交互; 注意力; 工作记忆; 智能增强; neural plasticity; haptic interaction; haptic-visual-aural multisensory feedback; human-machine interaction; attention; working memory; cognitive enhancement;
计算机
人机交互
论文
Website
Google Scholar
杨明浩, 陶建华
中国科学: 信息科学, 2018, 48(4): 433-448
摘要 本文首先简要回顾了认知科学在单通道信息加工及多通道信息融合方面的假定;其次,介绍了计算机科学在多通道信息融合方面相对于单通道信息处理增强的理论模型及实验验证.在各通道特征能够同时获得并统一表示的前提下,多通道人机交互信息的融合可以转化为分类或者回归问题求解.对于实际的交互系统,目前的多通道信息融合技术除了依赖单通道信息识别的准确性外,还依赖于交互系统设计的合理性.最后通过一个多通道信息融合的人机交互的实例,讨论了目前多通道交互系统的缺陷,并给出多通道人机交互信息融合智能方法未来的一个突破方向.
关键词 多通道信息融合; 人机交互; 机器学习; 模式识别; 认知科学; multi-modal information fusion; human-computer interaction; machine learning; pattern recognition; cognitive science;
计算机
人机交互
论文
Website
Google Scholar
易鑫, 喻纯, 史元春
中国科学: 信息科学, 2018, 48(4): 419-432
摘要 本文阐述了通过Bayes方法来预测用户交互意图的建模方法过程和推理过程.在自然交互界面上,用户不再是严格地通过离散明确的交互操作完成交互,而是通过连续、非确定的多模态数据表达交互意图.在解释用户的交互意图时,既可以使用"黑盒子"的机器学习方法,也可以利用"白盒子"的基于用户行为建模的方法.后者中的用户建模,其本质是通过计算的方法来刻画用户的行为能力,对于理解用户意图和探索自然交互的计算原理具有重要的科学意义.文章回顾了近年来人机交互研究中主要采用的智能算法,向读者厘清不同方法之间的差别,并通过我们实验室的具体研究工作展示用户建模的方法和Bayes推理的建模方法过程和推理过程.
关键词 Bayes方法; 机器学习; 意图推理; 用户建模; Bayes method; machine learning; intent prediction; user modelling;
计算机
人机交互
论文
Website
Google Scholar
张小龙, 吕菲, 程时伟
中国科学: 信息科学, 2018, 48(4): 406-418
摘要 本文首先介绍范式的含义,然后讨论人机交互领域中范式这一概念的使用.以人机交互领域最有影响力的WIMP范式为例,讨论界面范式所包含的主要成分,并在此基础上分析了目前主要的智能系统的界面的特点和不足.最后本文提出了针对智能系统界面设计的RMCP界面范式,强调智能系统界面设计需要考虑系统的角色(role)、交互模态(modal)、交互命令(commands)和信息展示方式(presentation style)这几个基本因素.
关键词 人机交互; 界面范式; 智能系统; human-computer interaction; interface paradigm; intelligent system;
计算机
体系结构
论文
Website
Google Scholar
裴颂文, 姬燕飞, 沈天马, 刘海坤
中国科学: 信息科学, 2019, 49(9): 1138-1158
摘要 随着大数据技术的快速发展,大规模访问存储器的需求随之剧增,导致访问动态随机访问存储器DRAM的高耗能问题越来越突出.大容量、低能耗的非易失性内存NVM技术逐渐成熟,有望被广泛应用于异构内存计算机系统.基于访问内存页的历史记录,本文针对异构内存系统提出了一种双向哈希链表的异构内存页迁移机制(THMigrator),将频繁访问的内存页从PCM或STT-RAM迁移到DRAM,并用能效分析模型(EEAM)评估了异构内存系统的能效.实验结果表明, THMigrator迁移机制比采用多级队列迁移机制MQMigrator的系统计算性能提升了9.3%,系统平均能效比提升了17%;THMigrator比采用随机迁移机制CoinMigrator的系统平均能效比提升了26%.
关键词 页迁移; 双向哈希链表; 异构系统; 非易失性内存; 迁移方法; page migration; two-way Hash chain list; heterogeneous systems; non-volatile memory; migration algorithm;
计算机
体系结构
论文
Website
Google Scholar
严佳乐, 张颖, 涂锋斌, 杨建勋, 郑时轩, 欧阳鹏, 刘雷波, 谢源, 魏少军, 尹首一
中国科学: 信息科学, 2019, 49(3): 314-333
摘要 当前人工智能引发了全球的热潮,它涵盖了图像识别、视频检索、语音识别、自动驾驶等各类智能应用.在人工智能算法中,神经网络算法扮演着举足轻重的作用,也成为了当前的研究热点.但是神经网络算法本身具有灵活性高、计算复杂、数据量大的特点,这也对计算平台提出了高性能、低功耗、高灵活性及高存储等方面的需求.针对神经网络专用芯片,本文提出了可重构硬件架构来满足神经网络的灵活性需求,以可重构架构为基础的Thinker系列可以执行多类神经网络运算.在该架构基础上,本文探究了相应的数据访存优化方案来降低功耗.在存储系统优化方面,基于eDRAM的神经网络加速方案和计算存储一体化ReRAM方案可以满足神经网络计算在存储性能及低功耗方面的需求,它们配合可重构硬件架构可以实现全新的神经网络加速框架.在高效计算方面,本文针对低比特神经网络的标准卷积计算提出基于积分和基于滤波器拆分特征重建的优化方案,以此满足高性能需求.
关键词 人工智能; 神经网络算法; 神经网络专用芯片; 可重构架构; 低功耗; artificial intelligence; neural network algorithms; neural network accelerator; reconfigurable hardware architecture; low power;
计算机
体系结构
论文
Website
Google Scholar
吕平, 刘勤让, 邬江兴, 陈鸿昶, 沈剑良
中国科学: 信息科学, 2018, 48(3): 315-328
摘要 体系结构在信息系统中起着举足轻重的作用,不仅决定了系统的功能和性能,而且决定了系统的效能和安全,因此,体系结构直接决定着信息系统的先进性.本文在介绍体系结构概念的基础上,对体系结构的发展进行了归纳总结,分析指出体系结构刚性是当前信息系统灵活性和高效能无法兼备的问题本质,提出了以软件定义互连和软件定义节点为特征的新一代软件定义体系结构,基于软件定义体系结构实现了Web服务、口令字恢复和图像识别3种典型系统,对比测试表明,软件定义体系结构系统较传统通用系统性能提升29.4~344.5倍,效能提升13.7~315.4倍,证明了软件定义体系结构的高灵活性和高效能.
关键词 信息系统; 软件定义互连; 软件定义节点; 软件定义体系结构; information system; software defined interconnection; software defined node; software defined architecture;
计算机
体系结构
论文
Website
Google Scholar
石峰, 陈旭, 尹飞, 王小军, 胡森森, 计卫星, 王一拙, 高玉金, 卫晋
中国科学: 信息科学, 2018, 48(1): 100-114
摘要 片上网络中路由算法的设计对芯片的性能有直接的影响.本文针对TriBA-Net网络提出一种新颖的最短路径.路由算法.首先,基于TriBA-Net网络设计了一种编码方法,该编码方法中所用到的文字1,3,2的集合与群论中的三文字集S_3群具有相同的含义.其次,设计了一种相隔节点间的通信模型,根据通信路径端点的可能状态,将通信划分为6种宏观数据流动模式.最后,利用S_3群的循环置换特性对通信模型进行简化,在XC6VLX550TL芯片上完成了SPR4T路由器的设计实现.实验结果表明,在27个节点的TriBA-Net网络性能测试中,在均衡负载模式下,与SPORT路由算法相比,SPR4T路由算法的饱和注入率提升7.5%,吞吐率提升7.7%,而且有效降低了硬件以及功耗的开销.
关键词 片上网络; 路由算法; 编码方法; 拓扑结构; 性能评估; networkon-chip; routing algorithm; coding scheme; topology; performance evaluation;
计算机
机器学习
论文
Website
Google Scholar
徐淼, 周志华
中国科学: 信息科学, 2018, 48(1): 47-59
摘要 现实机器学习任务中一个样本通常和多个标记相关,但获取完整的标记信息需耗费大量人力物力,因此多标记学习经常会遇到标记缺失的情况.将未缺失的标记看作不完全的标记矩阵,将样本特征作为辅助信息,则可通过矩阵补全方法来解决该问题,以往研究主要针对线性可分情形,本文提出KernelMaxide方法,在处理线性不可分多标记数据中缺失的监督信息的同时,不仅能利用数据的非线性结构,还能考虑标记之间的相互关系.该方法依据矩阵核范数的表示定理,构建了基于核矩阵的核范数最小化优化目标以及相应的优化算法,并用Nystrm方法缓解核矩阵的存储和计算开销问题.实验显示出KernelMaxide的优越性能.
关键词 机器学习; 多标记学习; 矩阵补全; 核方法; Nystrm方法; machine learning; multi-label learning; matrix completion; kernel method; Nystrm method;
计算机
理论
论文
Website
Google Scholar
周慧思, 欧阳丹彤, 刘梦, 田乃予, 张立明
中国科学: 信息科学, 2019, 49(6): 685-697
摘要 部分最大可满足性问题(partial maximum satisfiability problem, PMS)是最大可满足性问题(maximum satisfiability problem, MaxSAT)的泛化问题,在很多领域中得到广泛应用.目前,在工业诊断实例方面PMS求解仍有待改进,在对基于随机搜索的PMS算法深入研究基础上,本文首次提出一种结合结构特征的随机搜索方法 (structure characteristics partial MaxSAT, SCPMS).首先,依据单元传播规则结合问题结构特征逐步将PMS问题中硬单元子句分成两部分,从而构造出因缺乏部分硬单元子句使得问题可满足的子问题;提出结合结构特征的随机搜索指导策略,对新的子问题再次利用单元传播找出原问题中的硬单元子句中硬阻塞变量,再结合子句特征翻转相应软阻塞变量,从而提高随机搜索的求解效率.实验结果表明,提出的SCPMS与最新的两个算法DeciDist和DistUp相比,在基于模型诊断问题(model-based diagnosis, MBD)的工业实例上, SCPMS求得的不满足软子句数有较大程度的减少.
关键词 PMS; 单元传播; 最大可满足性问题; 随机搜索; 基于模型的诊断; PMS; unit propagation; SAT; stochastic search; model-based diagnosis;
计算机
生物信息学
论文
Website
Google Scholar
路畅, 陈霞, 王峻, 余国先, 余志文
中国科学: 信息科学, 2018, 48(8): 1035-1050
摘要 蛋白质功能自动标注是生物信息学领域的关键问题之一.蛋白质功能标注信息来源广泛,噪声标注信息不可避免地被引入.已有蛋白质功能预测研究更关注预测功能信息完全未知(或部分已知)蛋白质的功能,极少关注识别蛋白质的噪声功能标注.本文提出一种基于稀疏语义相似度的蛋白质噪声功能标注识别方法 (identifying noisy functional annotations of proteins using sparse semantic similarity,NFA).NFA首先利用一个蛋白质–功能标签关联矩阵存储蛋白质功能标注信息,对不同证据的功能标注信息分别加权,再利用功能标签间层次结构关系向上传播这些权重到拓展的功能标注上;其次,在加权后的关联矩阵上利用l1-norm约束的稀疏表示计算蛋白质之间的语义相似度;最后基于一个蛋白质的语义近邻蛋白质的功能标注信息投票识别该蛋白质的噪声功能.在酵母菌和拟南芥这两个模式生物上的实验结果表明,NFA较现有算法能更准确识别蛋白质噪声功能标注,剔除NFA识别出的噪声功能标注能够提升现有蛋白质功能预测算法的精度.
关键词 蛋白质功能; 噪声功能标注; 稀疏表示; 语义相似度; 标签结构; protein function; noisy functional annotations; sparse representation; semantic similarity; label structure;
计算机
社交媒体
论文
Website
Google Scholar
单丽莉, 林磊, 孙承杰
中国科学: 信息科学, 2019, 49(1): 17-41
摘要 为了更有效地挖掘用户、上下文和广告之间的三维交互关系,张量分解模型开始被用于解决实时竞价广告响应预测问题.然而实时竞价广告响应预测面临严峻的数据稀疏和冷启动问题,尤其是广告转化率预测,单纯地依靠某类或某些信息很难有效地解决这些问题,只有同时综合利用各种各样的异质、异构信息才能有效地应对这些问题.本文面向张量分解模型,提出了基于异构信息融合的综合解决方案来解决数据稀疏问题.该方案针对不同信息的性能、类型、结构、存在方式和作用特点等,提出了不同的融合策略和不同的实现方法,提升了基于张量分解模型的广告响应预测方法的可靠性和准确性,有效地缓解了需求方平台进行广告响应预测时面临的严峻数据稀疏问题.在选定数据集上基于异构信息融合的模型预测性能与基准方法相比取得了显著的提升.
关键词 实时竞价广告; 广告响应预测; 张量分解; 异构信息融合; 数据稀疏; 冷启动; 预测方法; real-time bidding; response prediction; tensor decomposition; integration of heterogeneous information; data sparsity; cold start problem; prediction method;
计算机
社交媒体
论文
Website
Google Scholar
高金华, 刘悦, 程学旗
中国科学: 信息科学, 2018, 48(11): 1575-1588
摘要 社交网络的功能正逐步由网络社交转变为社交媒体,极大地方便了消息的传播,也使得消息的流行度预测问题变得更具有挑战性.传统的流行度预测方法包含基于特征的有监督学习方法和基于随机过程的传播动力学建模方法.其中,基于随机过程的传播动力学建模方法由于具有更好的个体预测能力,吸引了研究人员的广泛关注.但是,现有的传播动力学建模方法在建模时,都忽略了社交平台中消息传播所呈现出的去中心化特点.本文以微博平台中消息的传播数据为基础,分析了微博消息的去中心化传播现象,并提出了一种叠加自增强泊松过程(reinforced Poisson process, RPP)模型的方法来刻画消息的传播动力学变化.每一条信息的传播过程都被拆分为几个传播子过程的叠加,而每个传播子过程可以用RPP模型很好的建模.在真实数据集上的结果表明,本文所提出的方法在刻画消息的传播过程以及预测消息的流行度变化等方面,都要优于现有的方法.
关键词 社交网络; 社交媒体; 流行度预测; 去中心化; RPP模型; social network; social media; popularity prediction; decentralization; RPP model;
计算机
社交媒体
论文
Website
Google Scholar
廖祥文, 黄知, 杨定达, 程学旗, 陈国龙
中国科学: 信息科学, 2018, 48(11): 1558-1574
摘要 在社交媒体谣言检测问题上,现有的基于特征表示学习的研究工作大多数先把微博事件划分为若干个时间段,再对每个时间段提取文本向量表示、全局用户特征等,忽略了时间段内各微博间的时序信息,且未利用到在传统机器学习方法中已取得较好效果的文本潜在信息和局部用户信息,导致性能较低.因此,本文提出了一种基于分层注意力网络的社交媒体谣言检测方法.该方法首先将微博事件按照时间段进行分割,并输入带有注意力机制的双向GRU网络,获取时间段内微博序列的隐层表示,以刻画时间段内微博间的时序信息;然后将每个时间段内的微博视为一个整体,提取文本潜在特征和局部用户特征,并与微博序列的隐层表示相连接,以融入文本潜在信息和局部用户信息;最后通过带有注意力机制的双向GRU网络,得到时间段序列的隐层表示,进而对微博事件进行分类.实验采用了新浪微博数据集和Twitter数据集,实验结果表明,与目前最好的基准方法相比,该方法在新浪微博数据集和Twitter数据集上正确率分别提高了1.5%和1.4%,很好地验证了该方法在社交媒体谣言检测问题上的有效性.
关键词 谣言检测; 分层注意力网络; 社交媒体; 时序信息; 深度学习; rumor detection; hierarchical attention network; social media; time series information; deep learning;
计算机
社交媒体
论文
Website
Google Scholar
何云琪, 刘苏文, 钱龙华, 周国栋
中国科学: 信息科学, 2018, 48(11): 1546-1557
摘要 生物医学实体识别(如基因/蛋白质、化学物和疾病等)是生物医学文本挖掘的基础,它对生物医学实体关系的抽取和生物医学知识库的建立等方面都有着重要的研究意义.针对目前的疾病名称识别中存在的问题,本文提出了一系列新的句法特征和语义特征来提高疾病名称识别的性能,其中句法特征包括组块和依存信息,语义特征包括疾病名称的缩写信息、字典信息和疾病概念之间的上下位关系等.在NCBI疾病语料库上的实验表明,结合一系列句法和语义特征的CRF模型可以显著提高疾病实体识别的性能,取得了目前该语料库上的最高F1值85.3%.
关键词 疾病名称识别; 条件随机场; 句法特征; 语义特征; disease name recognition; conditional random fields; syntactic features; semantic features;
计算机
社交媒体
论文
Website
Google Scholar
马语丹, 赵义, 金婧, 万怀宇
中国科学: 信息科学, 2018, 48(11): 1533-1545
摘要 实体关系抽取是信息抽取领域的重要任务之一,也是知识图谱构建的一个关键环节.现有的关系抽取方法大多都是围绕实体对从句子中抽取上下文语义特征,然后进行关系分类,这忽略了实体在整个语料集中的全局上下文特征.本文提出了一种新颖的结合实体共现信息与句子语义信息的神经网络(CNSSNN)模型,用于实体关系抽取.该模型首先构造整个语料集蕴含的实体共现关系网络,并通过引入注意力机制有侧重地提取实体的网络环境信息,从而为各个实体生成语料级全局上下文特征,同时利用双向门控循环单元网络(bi-GRU)为实体对提取句子级上下文语义特征,最后将语料级特征和句子级特征结合起来,进行实体关系抽取.在公开数据集和人工标注的数据集上的实验结果表明,本文提出的方法其准确率和召回率要明显优于其他现有方法.
关键词 信息抽取; 实体关系抽取; 实体共现网络; 注意力机制; 门控循环单元; information extraction; entity relation extraction; entity co-occurrence network; attention mechanism; gated recurrent unit;
计算机
社交媒体
论文
Website
Google Scholar
安波, 韩先培, 孙乐
中国科学: 信息科学, 2018, 48(11): 1521-1532
摘要 基于知识库的问答系统能够根据知识库中的事实自动回答自然语言的问题.简单问题是指可以通过知识库中单一的事实来进行回答的问题,这类问题也是最常见的问题.但是当面对大规模的知识库时,简单问题依然存在很大的挑战.当前的端到端(end-to-end)模型主要依赖于对问句、实体和关系的文本描述进行表示学习,进而根据这些表示来计算实体、关系与问句的语义相关度,忽略了知识库中的实体和关系的结构信息.而这些结构信息,对于问句中实体和关系的识别有重要作用.本文采用一种融合文本和知识的表示学习方法,通过文本表示和组合模型来学习问句和知识的表示,同时使用知识的结构信息来约束文本的表示和组合.在基于知识的问答任务上的结果表明,本文提出的方法学习到的问句和知识的表示能很好地反映问句与知识之间的语义相关性,并显著地提升了问句中实体链接和关系识别的准确率.
关键词 问答系统; 知识库; 文本组合; 知识表示; 文本表示; question answering system; knowledge base; word composition; knowledge representation; text representation;
计算机
社交媒体
论文
Website
Google Scholar
徐琳宏, 林鸿飞, 祁瑞华, 杨亮
中国科学: 信息科学, 2018, 48(11): 1510-1520
摘要 谐音双关语的识别是幽默研究领域的一个重要分支,并逐渐发展为一个新兴的研究领域.本文提出一种基于4个维度特征集的谐音双关语识别模型,其中4个维度包括语义透明度、语义相关度、语音扩展性和语法特征集.语义透明度包括词项统计和语句字符长度两个特征,语法特征集包括人名、大写、时态、词性和位置5个特征.将这4个维度的9个特征加入到二叉判定树中,使用K-Means聚类获取阈值,完成双关语的识别.本文的实验数据来自于SemEval2017任务7的语料,取得了较好的效果, F1值高于参赛队中的第一名,实验证明基于4个维度特征的二叉判定树分类方法在谐音双关语识别中是有效的,并且在多个特征中,语音扩展性和语法特征集的效果比较明显,这也符合谐音双关语识别中语音作用较大的预测.
关键词 谐音双关语; 情感分析; 二叉判定树; 语义特征集; 聚类; heterographic pun; sentiment analysis; binary decision tree; semantic feature set; cluster;
计算机
社交媒体
论文
Website
Google Scholar
谭红叶, 闫真, 李茹, 敬毅民
中国科学: 信息科学, 2018, 48(11): 1497-1509
摘要 幽默生成是计算创造性任务之一,能够赋予计算机一定的个性化与创造性,而且可以提升用户体验.本文以笑话的生成进行汉语幽默生成的探索性研究.首先提出一个符合当前自然语言生成技术的笑话生成任务:给定笑话的主体部分,生成相应的笑点句.然后,尝试了基于经典编码器–解码器框架的方法与基于生成对抗网络的方法来完成该任务.为了克服编码器–解码器框架中对幽默特点没有建模的局限,本文在生成对抗网络方法中融入了歧义性、不一致性、语音相似性、普遍性等笑话属性特征来评价、指导笑话的生成.实验结果表明:在生成对抗网络方法中融入笑话属性特征后,系统输出构成笑话的比例提升6个百分点.尽管从总体来看系统自动生成的笑点句构成笑话的比例还偏低,但本文通过对幽默生成问题的研究探索,带动了对创造性语言生成问题的洞察与理解,标志着我们向创造性语言生成的探索迈进了一步.
关键词 幽默生成; 笑话生成; 深度学习; 编码器–解码器框架; 生成对抗网络; generation of humors; generation of jokes; deep learning; encoder-decoder framework; generative adversarial networks;
计算机
网络
论文
Website
Google Scholar
赵玉宇, 程光, 李昊冬, 张慰慈
中国科学: 信息科学, 2019, 49(10): 1321-1332
摘要 网络智能终端的普及和发展对网络总体的拥塞控制和以时延、抖动为主的服务质量提出了更高的要求和挑战.现有的网络中间设备,主要依靠队列管理控制时延,解决拥塞.针对现有主动队列管理算法易导致的高时延和网络资源分配不公下的大量丢包问题,本文提出了面向时延需求的主动队列管理(time demand-active queue management, TD-AQM)方法.该方法将队列管理的基础从端系统和中间设备得到的网络测量反馈回归到写入数据报文IP层option字段的时延需求,即报文在路由器最长存在的时间上.为了避免洪峰效应, TD-AQM利用限制向下查找范围和遏制格子虚占用命中率方法,将数据包按照时延需求插入队列.实验结果表明, TD-AQM能够有效地维持队列的稳定性,保证数据报文按照时延需求出队并相较现有队列管理算法提高了吞吐率等各项性能.
关键词 主动队列管理; 时延需求; 洪峰效应; 队列稳定性; 低时延; active queue management; time delay demand; peak effect; queue stability; low delay;
计算机
软硬件协同
论文
Website
Google Scholar
侯能, 何发智, 周毅, 陈壹林
中国科学: 信息科学, 2018, 48(8): 978-999
摘要 软硬件划分是软硬件协同设计中的关键步骤,决定了哪些功能由硬件执行,哪些功能由软件执行.软硬件划分属于NP难问题.现代嵌入式系统的复杂性提高,造成软硬件划分问题规模变大,需要采用启发式方法求解.禁忌搜索是求解软硬件划分的有效方法.然而,算法的求解过程非常耗时.已有的禁忌搜索求解软硬件划分是串行实现,要折中考虑解的质量和算法的运行时间.这种考虑牺牲了解的质量.本文提出基于GPU的自适应邻域压缩(compacting neighborhood)禁忌搜索的软硬件划分算法.首先,提出自适应策略.自适应策略能够增强算法的搜索集中性,提高解的质量.GPU的大规模并行特性可以降低算法的运行时间.其次,为了使算法在GPU上高效地执行,提出基于GPU的任务图表达、线程–候选解映射、数据布局和访存等一系列优化策略.最后,实验采用统一设备架构(CUDA)编程,并根据相关基准任务图,通过不同的计算–通信比和实时约束条件,对提出的方法进行验证.结果表明,本文方法的解质量要优于已有的方法.对比将自适应邻域压缩禁忌搜索自然移植到GPU后的运行时间,提出的GPU上的执行优化策略明显地降低了求解时间.另外,在更大规模的软硬件划分上验证了基于GPU的方法在时间上的优势.
关键词 软硬件协同设计; 启发式方法; 图形处理单元; 禁忌搜索; 自适应算法; hardware-software codesign; heuristic methods; graphics processing unit; tabu search; adaptive algorithms;
控制
人工智能系统
论文
Website
Google Scholar
王尔申, 刘帆, 宏晨, 郭靖, 何宁, 赵琳, 薛健
中国科学: 信息科学, 2022, 52(12): 2254-2269
摘要 随着无人机智能化水平的提高和集群控制技术的发展,无人机集群对抗智能决策方法将成为未来无人机作战的关键技术.无人机集群对抗学习环境具有维度高、非线性、信息有缺失、动作空间连续等复杂特点.近年来,以深度学习和强化学习为代表的人工智能技术取得了很大突破,深度强化学习在解决复杂环境下智能决策问题方面展现出了不俗能力.本文受多智能体集中式训练–分布式执行框架和最大化策略熵思想的启发,提出一种基于非完全信息的多智能体柔性行动器–评判器(multi-agent soft actor-critic, MASAC)深度强化学习方法,建立基于多智能体深度强化学习的无人机集群对抗博弈模型,构建连续空间多无人机作战环境,对红蓝双方无人机集群的非对称性对抗进行仿真实验,实验结果表明MASAC优于现有流行的多智能体深度强化学习方法,能使博弈双方收敛到收益更高的博弈均衡点.进一步对MASAC的收敛情况进行实验和分析,结果显示MASAC具有良好的收敛性和稳定性,能够保证MASAC在无人机集群对抗智能决策方面的实用性.
关键词 深度强化学习; 多智能体; 对抗博弈; MASAC; 无人机集群; deep reinforcement learning; multi-agent; confrontation game; MASAC; UAV clusters;
控制
人工智能系统
论文
Website
Google Scholar
李守义, 陈谋, 王玉惠, 吴庆宪, 贺建良
中国科学: 信息科学, 2022, 52(12): 2239-2253
摘要 在真实的空战对抗环境中,不确定性广泛存在.本文考虑人机对抗场景中的空战决策问题,提出了一种非完备策略集下的博弈决策方法.首先,将对抗的无人机群和有人机群的动态博弈过程分解为不同的决策阶段,并将当前的决策阶段建模为一个零和博弈模型.所建模型考虑了有人机群的策略不完全可知的情形,并用一个不确定效用矩阵来描述这种非完备策略.随后,基于矩阵博弈中的最大最小策略概念,提出了非完备策略下博弈模型的求解方法,从而给出了无人机群的决策序列.最后通过仿真实验验证了所提方法的有效性.
关键词 无人机; 空战决策; 人机对抗; 非完备策略集; 博弈论; 最大最小策略; unmanned air vehicle(UAV); air combat decision-making; human-computer gaming; incomplete strategy set; game theory; maximum-minimum strategy;
控制
人工智能系统
论文
Website
Google Scholar
王欢, 周旭, 邓亦敏, 刘小峰
中国科学: 信息科学, 2022, 52(12): 2225-2238
摘要 在空战研究领域,战术决策旨在提高博弈对抗收益,进而提升战机攻击效率.现有战术决策算法大多基于规则方法设计,当应用于多机空战的复杂环境时则存在设计难度大,难以求解最优解等问题.本文提出一种分层决策多机空战对抗方法,首先,在训练初始阶段借鉴已有人类专家经验,指导模型训练;其次,根据战术动作类型设计分层动作决策网络,降低动作决策空间维度;最后,将训练产生的对抗经验按阶段分解,降低策略学习难度.在多机空战仿真环境中进行了实验验证,相比于现有多机空战决策方法,本文提出的方法在训练收敛性和决策性能方面均具有更好的表现.
关键词 多机空战; 动作决策网络; 博弈; 分层强化学习; 决策收益; multi-aircraft air combat; action decision-making network; game; hierarchical reinforcement learning; decision gain;
控制
人工智能系统
论文
Website
Google Scholar
黄蕾, 朱进, 段福庆
中国科学: 信息科学, 2022, 52(12): 2178-2194
摘要 非完全信息下的人机对抗通常可以通过双人零和博弈模型加以描述,反事实后悔最小化(counterfactual regret minimization, CFR)是处理非完全信息双人零和博弈的一种流行算法.然而现有CFR及其变体算法在迭代过程中使用固定的后悔值计算和策略更新类型,在非完全信息扩展式博弈下表现各有优劣,泛化性能薄弱.针对这一问题,本文将强化学习近端策略优化(proximal policy optimization,PPO)算法与CFR算法相结合,提出一种PPO-CFR算法,通过训练出理性的智能体,从而实现CFR迭代过程后悔值计算和策略更新类型的自适应选择,以提高算法的泛化性能,并实现非完全信息扩展式博弈的策略优化.本文采用通用的扑克博弈实验验证所提算法,并制定逐步奖励函数训练智能体的动作策略,实验结果表明,与现有方法相比, PPO-CFR算法具有更好的泛化性能和更低的可利用度,迭代策略更为逼近纳什均衡策略.
关键词 非完全信息; 扩展式博弈; 反事实后悔最小化; 近端策略优化; 博弈决策; incomplete information; extensive game; counterfactual regret minimization; proximal policy optimization; game decision-making;
控制
人工智能系统
论文
Website
Google Scholar
游诗艺, 康宇, 赵云波, 张倩倩
中国科学: 信息科学, 2022, 52(12): 2165-2177
摘要 在人机共享自主中,人和智能机器以互补的能力共同完成实时控制任务,以实现双方单独控制无法达到的性能.现有的许多人机共享自主方法倾向于假设人的决策始终“有效”,即这些决策促进了任务的完成,且有效地反映了人类的真实意图.然而,在现实中,由于疲劳、分心等多种原因,人的决策会在一定程度上“无效”,不满足这些方法的基本假设,导致方法失效,进而导致任务失败.本文提出了一种新的基于深度强化学习的人机共享自主方法,使系统能够在人类决策长期无效的情况下完成正确的目标.具体来说,我们使用深度强化学习训练从系统状态和人类决策到决策价值的端到端映射,以显式判断人类决策是否无效.如果无效,机器将接管系统以获得更好的性能.我们将该方法应用于实时控制任务中,结果表明该方法能够及时、准确地判断人类决策的有效性,分配相应的控制权限,并最终提高了系统性能.
关键词 人机系统; 共享自主; 非全时有效决策; 深度强化学习; 仲裁; human-machine system; shared autonomy; non-full-time effective decision; deep reinforcement learning; arbitration;
控制
人工智能系统
论文
Website
Google Scholar
黄煌, 李谋, 刘磊, 汤亮, 刘昊, 谢心如, 刘乃龙, 魏春岭, 邢琰, 姜甜甜, 胡海东, 常亚菲, 胡勇, 杨孟飞
中国科学: 信息科学, 2022, 52(11): 2093-2105
摘要 以卫星、飞船、深空探测器为代表的航天器是一类典型的无人系统,经历了从自动化到自主化的不断发展.为提升航天器对未知空间环境和复杂空间任务的适应能力和智能自主水平,以空间无人系统为研究对象设计了具有学习和推理能力的无人系统智能架构,给出架构的组成及功能;接着分析该架构中学习和推理能力的运作机制,并针对架构所需的动作库和知识库的构建、更新与扩展方法等关键技术提出解决方案;最后通过地外星表巡视采样任务示例,具体说明在该智能架构下的新知识生成、基于知识的推理和自主执行任务的过程,以及过程中知识库、环境、任务和动作库之间的交互关系.
关键词 学习和推理能力; 空间无人系统; 智能架构; 动作库; 知识库; learning and reasoning capabilities; space unmanned system; intelligent architecture; action library; knowledge library;
控制
人工智能系统
论文
Website
Google Scholar
代学武, 程丽娟, 崔东亮, 俞胜平, 袁志明, 应志鹏
中国科学: 信息科学, 2022, 52(5): 890-906
摘要 随着我国高速铁路建设成网,行车密度不断提高,在出现突发事件导致列车晚点时,行车调度的复杂性和难度急剧增加,如何动态调整列车群运行,以减少晚点,提高准点率是运行调整的核心.本文提出了一种适用于突发事件下高速列车群运行调整的无模型强化学习方法.首先将多个列车在多个车站和闭塞区间的运行调整建模为受约束的资源占用和配置的多阶段序贯决策过程,提出了基于动态时空拓扑矩阵的车站和区间统一化建模方法.针对高铁列车群时空关联强的特点,首次提出了一种包含车辆位置、路网资源等时空分布信息的强化学习状态空间、动作空间和回报函数,构建了有效的奖励反馈机制.然后,针对高铁运行系统搜索空间巨大的难点,提出了启发式动作子空间自适应生成方法,利用部分显式静态约束构建启发式规则减少搜索空间,有效减少了无模型强化学习的试错次数,提高了求解效率,也保留了无模型通用性好的优点.最后,基于京广高铁实际案例的仿真分析表明,在发生不同时空范围的大风限速,导致多车延误的事件下,所提出的算法均能较好收敛,明显减少列车群内晚点传播,与MILP, ACO, FCFS方法相比,列车群的平均晚点时间可减少2%~20%.
关键词 强化学习; 时空拓扑矩阵; 列车运行调整; FCFS算法; 优化; reinforcement learning; spatio-temporal topology matrix; train rescheduling; FCFS algorithm; optimization;
控制
人工智能系统
论文
Website
Google Scholar
孙翊文, 王宇璐, 傅昆, 王征, 张长水, 周东华, 叶杰平
中国科学: 信息科学, 2021, 51(5): 822-833
摘要 门控循环单元(gated recurrent unit, GRU)是一种有代表性的深度神经网络,它在众多序列学习任务中达到了国际领先的水平.然而,在门控循环单元的每个时间步之间,输入信息与隐含状态信息缺乏交互,这对更好地挖掘上下文语义信息带来了挑战.针对这个问题,本文提出了一个新颖的序列学习通用的语义特征提取模型:交互门控循环单元(interactive gated recurrent unit, InterGRU),可以让输入与隐含状态向量在各时间步间进行多轮充分的交互.并且,在到达时间估计(estimated time of arrival, ETA)这个有代表性、有挑战的时空序列预测任务上,本文提出了一套基于交互门控循环单元的深度学习框架(InterGRU-ETA).本文在来自滴滴出行平台真实场景下的海量数据集上充分地实验验证了InterGRU-ETA.结果表明,我们的框架在预测准确率上优于目前国际上最先进的方法.这反映了交互门控循环单元在捕获序列语义信息上的性能优势和广阔前景.
关键词 门控循环单元; 到达时间估计; 深度学习; 时空序列预测; 智能交通系统; gated recurrent unit; estimated time of arrival; deep learning; spatio-temporal forecasting; intelligent transportation systems;
控制
人工智能系统
论文
Website
Google Scholar
冯夫健, 黄翰, 吴秋霞, 凌霄, 梁椅辉, 蔡昭权
中国科学: 信息科学, 2020, 50(3): 424-437
摘要 高清图像(高分辨率图像)前景遮罩提取问题是图像合成、自动前景提取等图像处理领域的热点难题,其本质是前景背景像素对的大规模组合优化问题,目前相关研究成果较少.本文针对问题维度过高难以直接求解这一问题,设计了基于RGB聚类的多类协同优化策略,以实现决策空间的有效降维;给出协同目标反馈的分组优化策略,通过将协同目标中的最优前景背景像素对作为启发式信息反馈给每个分组,实现大规模组合优化问题的分组协同求解.在分组优化策略的基础上,论文提出了基于分组协同的群体竞争优化算法(competitive swarm optimization algorithm based on group collaboration,GC-CSO),为高维优化问题分析提供了借鉴.为了验证所提方法的有效性,本文选用alpha matting基准数据集作为测试数据,通过与群体竞争优化算法、典型带分组策略的大规模优化算法进行对比分析,验证了:(1)基于RGB聚类的协同优化策略可以显著地降低问题维度;(2) GC-CSO算法提高了高清图像前景遮罩的提取精度.
关键词 高清图像; 前景遮罩; 大规模优化; 协同优化; 群体竞争优化; high-resolution images; alpha matting; large-scale optimization; cooperative optimization; competitive swarm optimizer;
控制
人工智能系统
论文
Website
Google Scholar
廖作文, 龚文引, 王凌
中国科学: 信息科学, 2020, 50(3): 396-407
摘要 求解非线性方程组要求在一次运行中同时求解(联解)其多个根,在数值计算中这是一项重要但困难的工作.为了实现非线性方程组多根求解,本文提出了一种改进的环拓扑混合群体智能算法,其主要特点是:(i)设计一种改进的环形拓扑结构,以弥补基于下标的相邻个体在搜索空间上不相邻的缺点,进而能更有效利用邻域信息;(ii)采用混合的群体智能方法以提升算法的搜索能力;(iii)引入个体重新初始化机制,以增强群体多样性.为了验证算法的性能,选择8个含有多个根的非线性方程组作为测试集.实验结果表明,所提出的方法不仅能在一次运行中找到多个根,而且与代表性算法对比,在找根率和成功率上有着显著优势.
关键词 非线性方程组; 群体智能; 多根联解; 人工蜂群算法; 环拓扑; nonlinear equations; swarm intelligence; simultaneously multiple roots locating; artificial bee colony; ring topology;
控制
人工智能系统
论文
Website
Google Scholar
王涛, 尹刚, 余跃, 张洋, 王怀民
中国科学: 信息科学, 2020, 50(3): 318-334
摘要 互联网技术的发展对软件开发技术、运行形态和服务模式都产生了前所未有的影响,以开源和众包为代表的大规模群体协作实践所蕴含的群体智能机理为网络时代的软件开发带来重大启示.本文以开源和众包大规模实践为案例,深入分析了开源创新和众包生产模式,凝练提出了以大众化协同、开放式共享和持续性评估为核心的群智软件开发机理,从群体协作基础环境、群体协作机制模型和群体协作支撑技术3个方面,深入讨论了基于群智的群体化软件开发服务环境涉及的关键要素以及我们的开源实践,并提出了群智软件开发未来面临的重大挑战,希望能为网络环境下基于群智的群体化软件开发提供有益的视角和借鉴.
关键词 开源; 众包; 群智; 群体化开发; 大众化协同; 开放式共享; 持续性评估; open source; crowdsourcing; crowd intelligence; crowd development; crowd collaboration; open sharing; continuous evaluation;
控制
复杂网络与系统
论文
Website
Google Scholar
李志强, 李文鸽, 何秋锦, 宋金利, 杨俊起
中国科学: 信息科学, 2022, 52(7): 1302-1316
摘要 合作博弈中的参与人只将合作、不合作作为自己的策略,而双合作博弈是合作博弈的一般化,参与者以合作、不合作和弃权作为自己的策略,以获得自己所在的联盟利益的最大化,从而使自己的收益达到最优.与合作博弈一样,如何分配参与者联盟获得的总收益是双合作博弈的一个重要研究问题.本文利用矩阵半张量积工具,研究了双合作博弈的Shapley值计算问题.首先构造了双合作博弈的Shapley矩阵,然后将双合作博弈的Shapley值计算转化为双合作博弈的特征函数矩阵与Shapley矩阵乘积形式.本文得到的Shapley值矩阵计算公式形式简洁,不但简化了计算,而且为双合作博弈的研究提供了新的工具.
关键词 合作博弈; 双合作博弈; Shapley值; Shapley矩阵; 矩阵半张量积; cooperative game; bicooperative game; Shapley value; Shapley matrix; semi-tensor product of matrices;
控制
复杂网络与系统
论文
Website
Google Scholar
李梢, 张鹏, 古槿, 江瑞, 李衍达
中国科学: 信息科学, 2022, 52(5): 856-869
摘要 在生物医学大数据时代,如何全面有效地发现致病基因、药物靶标等关键要素,从整体上理解宏观表型的微观本质,是目前信息科学与中西医学交叉研究面临的重大共性挑战之一.生物系统是典型的复杂系统,克服上述挑战的关键是:如何通过深入理解复杂生物系统的“关系”本质,解决复杂系统多层次信息融合难题以及生物医学大数据中广泛存在的维度高、噪声大、样本少等难点.“生物网络”是构成复杂生物系统的基础,反映人体内部基因和基因产物等各种生物分子的相互关系、生物分子与疾病和药物等不同层次的关系,生物网络已被广泛用于生物医学大数据的分析.李梢课题组从20余年前开始中西医药与生物网络的关联研究,率先提出“网络靶标”假说,并进行方法构建与应用.本文对基于生物网络的关系推断理论与方法进行总结与思考.首先,从原理上,发现疾病宏观表型与微观分子在复杂生物网络中存在“层次模块化关系”,即宏观层次的涌现在微观上具有局域模块性,宏观表型越相似,微观致病基因或药物靶标在网络上的模块性关联越强.其次,从方法上,给出基于生物网络从生物医学大数据、少量目标样本中推断关键生物要素的“关系推断”一般性方法框架:以层次模块化关系为基础,从全局角度进行关系网络构建、关系表示与建模、未知关系推断,实现关系的实体化、数学化、整体化.进而,从应用上,基于生物网络的关系推断方法在致病基因与药物靶标预测、疾病标志物识别、中医药机制解析等方面表现出很好的性能.综上,关系推断方法能够为从系统角度和分子水平揭示中西医药科学原理提供系统解决方案,也为网络药理学等新兴学科提供重要的原理和方法学支撑.
关键词 复杂生物网络; 模块化; 多层次关联; 关系推断; 小样本推断; 网络药理学; complex biological network; modularity; multilevel relationship; relationship inference; small-sample inference; network pharmacology;
控制
复杂网络与系统
论文
Website
Google Scholar
吴晓群, 孟涵怡, 陆君安, 胡捷, 韩秀萍
中国科学: 信息科学, 2021, 51(11): 1931-1945
摘要 多层网络的结构和动力学是目前网络科学研究中的前沿方向.在多层网络中单层之间的连接方式直接影响整个多层网络的动力学、传播、扩散和同步.对于多层网络的一般结构,目前还没有系统的理论和方法,人们只能从简单的多层网络结构入手,来探索层间连接如何影响多层整体动力学行为.本文的工作针对单层是链状结构的双层网络,通过图论理论和数值计算探讨这一问题,寻找层间连接的优化方式.首先,根据主稳定函数方法,在同步域无界的条件下证明了各层结构相同的多层网络在任意层间部分连边方式下,均存在层间耦合强度阈值,使得整个网络同步能力达到最大,且最大同步能力就是其单层网络的同步能力.其次,仿真得到双层链状网络在层间两条连边下的最优连边位置分别为各条链的1/4和3/4处;最差连边位置分别为其端点及相邻次端点处.本文还分别利用主稳定函数方法以及"网络最短距离"结构指标,细致地讨论了单层节点数分别为4N, 4N+1, 4N+2, 4N+3情况下的层间最优连边方式.结果表明:单层节点数4N对应有4种层间最优连边方式,其他3种情况下层间最优连边方式均唯一.最后,本文提出了最优层间耦合强度的表达式,并通过计算不同节点数情况下网络的最优层间耦合强度,验证了该表达式的正确性.
关键词 多层网络; 同步能力; 链状网络; 层间连边方式; 层间耦合强度; multi-layer networks; synchronizability; chain networks; inter-layer connection modes; inter-layer coupling strength;
控制
复杂网络与系统
论文
Website
Google Scholar
高超, 蒋世洪, 王震, 邓越, 范懿, 李学龙
中国科学: 信息科学, 2021, 51(9): 1490-1506
摘要 定量评估城市轨道交通站点的重要性有助于优化城市轨道交通网络,提升针对突发事件的应急管理能力.现有工作常根据轨道拓扑结构或静态客流的分布来识别关键站点,然而,由于居民日常出行行为展现时空变化特征,它们对关键站点的识别也有重要影响.为此,本文提出一种结合轨道网络拓扑结构和动态客流的拓扑–客流中心性指标来动态识别轨道交通关键站点.首先,将轨道交通网络拓扑结构抽象为节点负载网络,利用节点负载刻画客流时变特征.其次,利用级联失效模型对比拓扑–客流中心性指标与其他中心性指标对网络平均效率、极大连通系数和损失客流的影响.大量实验表明所提指标能有效识别轨道交通网络中的关键站点.同时,关键站点会随客流演变展现出动态变化特征,特别是当客流量波动剧烈时最为显著.
关键词 交通网络; 关键站点; 中心性指标; 动态客流; 级联故障; traffic networks; influential station; centrality measures; dynamic passenger flows; cascading failure;
控制
复杂网络与系统
论文
Website
Google Scholar
陶海成, 卜湛, 曹杰
中国科学: 信息科学, 2021, 51(7): 1131-1145
摘要 在复杂网络研究领域,社区隐藏算法旨在破坏社区发现算法的有效性,从而隐藏用户之间的关系,达到保护用户隐私的目的.现有的社区隐藏算法寄希望于已有用户改变自己的社交关系实现该目标,这对用户影响较大,操作空间比较小.不同于此类算法,本文所提的算法从增加节点及其相应边的角度出发,即伪造用户及其关系,最大程度降低了对用户的影响,将社区隐藏问题转换为网络增长问题.首先基于ratio association和ratio cut,提出两种更适合社区隐藏的指标;然后基于强化学习框架,定义动作空间为不同的网络增长模型,将两个指标在l个阶段的一致性策略值作为网络的状态表示,并将指标值作为奖赏值;最后采用两种策略来对指标进行优化,即给每个Q函数赋予权重的标量化多目标Q-learning算法以及基于Pareto最优算法的多目标Q-learning算法.在真实数据集上的大量实验表明,相比于现有最新的社区隐藏算法,本文所提算法展现出更好的有效性.
关键词 社交网络分析, 社区发现, 社区隐藏, 多目标优化, 强化学习
控制
复杂网络与系统
论文
Website
Google Scholar
廖好, 黄晓敏, 吴子强, 周明洋, 毛睿, 汪秉宏
中国科学: 信息科学, 2021, 51(7): 1116-1130
摘要 链路预测任务是根据已知的网络结构和节点属性等信息来预测网络中产生新链路的可能性.它是网络科学中的一个基础性问题,具有重要的理论研究和实际应用价值.近年来,网络表示学习领域的学者利用深度学习提取网络复杂特征,大幅度提高了链路预测效果.实际网络中节点具有局部聚类现象,然而,当前的网络表示学习侧重于提取网络全局特征,忽略了局部信息特征.针对这个问题,我们提出了能够学习网络中节点在不同社区中局部特征表示的模型network-splitter.该模型利用重叠社区思想,在每个社区中创建节点的一个角色副本,并学习该角色副本的特征表示.最后将节点在不同社区中对应的角色副本信息通过神经网络综合,得到的综合向量包含网络全局特征和节点局部特征,并可应用到链路预测任务中.本文的实验结果表明, network-splitter模型与最新的网络学习表示方法相比具有很强的竞争力.
关键词 链路预测, 复杂网络, 网络表示学习, 局部节点特征, 重叠社区
控制
复杂网络与系统
论文
Website
Google Scholar
张俊杰, 胡文峰, 彭涛, 阳春华
中国科学: 信息科学, 2021, 51(3): 413-429
摘要 在高铁日常运营中,地质灾害或设备故障等突发事件导致铁路行车区间中断,长时间的区间中断通常会导致大面积的列车晚点,给旅客出行带来极大的延误,如何在区间中断下对列车进行实时调整是高速铁路调度运行的一项重要课题.本文针对固定时间的区间中断,构建了列车运行速度调整和运行图调整的混合整数非线性规划(mixed integer nonlinear programming, MINLP)模型.在该模型中,除了常见的取消车次和延迟发车调度策略,还将降速运行策略考虑在内,在满足行车安全和车站通行能力的约束条件下,以3种调度策略的加权延误影响最小化为目标.该模型基于列车运动学模型计算列车降速运行带来的延误时间,并通过移动闭塞原理控制列车运行安全间隔.本文建立的模型可由商业优化软件CPLEX直接求解,并保证运行调整方案的实时性.模型还讨论了取消车次、延迟发车和降速运行这3种调度策略对总延误时间的影响,最后以京沪高铁实例进行验证.验证结果表明该模型是合理有效的,通过模型求解能对实际问题给出合理的调度方案并提高列车终到正点率.
关键词 高速列车调度; 区间中断; 实时运行调整; 降速运行; 混合整数非线性规划; high-speed train scheduling; segment blockage; real-time operation adjustment; deceleration operation; mixed integer nonlinear programming;
控制
复杂网络与系统
论文
Website
Google Scholar
马小博, 彭嘉豪, 薛磊, 管晓宏
中国科学: 信息科学, 2019, 49(12): 1640-1658
摘要 近年来,重庆公交坠江、无锡重型卡车超载致高架坍塌等一系列重特大灾难性事故的发生暴露了信息化时代交通工具运行中安全防范与应急处置机制的严重缺失. 5G通信时代的来临,无疑为这一问题的解决带来了巨大历史机遇.本文针对交通工具运行中预防重特大事故及取证分析的需求,基于5G通信技术,提出基于事件的交通工具运行中信息物理融合安全治理框架.该框架围绕交通工具运行安全问题的特性——"高速运动状态下网络资源的可用性、信息物理融合下安全目标的复杂性",通过精准感知物理层、通信层、社会层3个层面的不安全事件,综合利用泛在智能感知、边缘–云计算等技术,从交通工具的物理设备信息安全、车辆状态安全、车辆环境安全、网络安全4个维度,构建一体化的交通工具智能安全应对方案,服务于"事前全时预判、事中即时报警、事后回放取证"的安全目标.
关键词 5G; 车联网; 信息物理融合系统; 综合安全; 事件驱动; 5G; Internet of vehicles; cyber-physical systems; hybrid security; event driven;
控制
复杂网络与系统
论文
Website
Google Scholar
赵志纯, 李炳照, 胡进, 王越
中国科学: 信息科学, 2019, 49(12): 1559-1571
摘要 在现实动态强对抗强约束的社会环境下,固化的人工系统架构通常无法满足复杂多变的服务任务需求.本文根据多活性代理系统理论,增强管理者的管控作用,通过替换主代理或增加新的活性代理,对系统架构进行调整,使人工系统的活性自组织机理机能发生改变,使环境对抗矛盾发生转变占据主导地位,系统功能活性得以保持和提升,以满足任务需求.本文首先对多活性代理系统理论进行了简要回顾,然后提出了基于多活性代理的人工系统架构调整方法,最后以对抗美制P2V-7侦察机入侵的防空系统为实例对所提方法的有效性进行了验证.
关键词 多活性代理系统理论; 人工系统; 活性代理; 系统架构调整; 活性度; multi-living agent system theory; artificial system; multi-living agent; system architecture adjustment; livelihood degree;
控制
复杂网络与系统
论文
Website
Google Scholar
唐堂, 胡进, 贾丽娟, 王越
中国科学: 信息科学, 2019, 49(12): 1545-1558
摘要 面对充满动态未知强对抗挑战的复杂应用环境,人工系统的构建需要科学系统性地设计新方法.本文以多活性代理理论为指导,以自组织机理机能活性的存在为前提,结合系统功能要求及约束的上界,将多活性代理系统服务功能活性度作为各层次研发运筹的依据,提出了基于多活性代理的高性能人工系统总体设计方法,并针对对抗矛盾动态加剧的情况展开了应对分析,最后以高摧毁率对抗入侵流的对空末端防御系统的设计分析为例,验证了所提出设计方法的有效性.
关键词 人工系统; 多活性代理系统; 系统架构; 活性度; 末端防御系统; artificial system; multi-living agent system; system architecture; living degree; terminal defense system;
控制
复杂网络与系统
论文
Website
Google Scholar
王越, 马成, 贾丽娟, 李炳照
中国科学: 信息科学, 2019, 49(12): 1535-1544
摘要 本文由人类社会总是由低级到高级进化的"自组织"机理论起,讨论了在现实开放复杂巨系统环境下,系统"自组织"与"他组织"的辩证关系及人类主导社会发展核心因素群表达.并由若干实例说明在时空域复杂强约束对抗环境中,系统本身"自组织"机理机能难以完成对系统服务功能的质变性动态调整要求,表明系统"自组织"实践应用具有局限性,从而引出了耗散自组织理论拓展——"多活性代理"理论方法.即以实践领域高水平专家主导,以"他组织"模式结合运用多活性代理理论方法,主导信息系统服务功能在复杂严峻对抗环境中动态调整适应需求.为了进一步探讨并支持实践应用,我团队撰写了系列文章,本文主要介绍理论概述、构造核心思路以及扼要分析系统构建、架构调整、单代理调整和增强管控代理能力4种应用模式.本专刊其他两篇文章"基于多活性代理的高性能人工系统总体设计方法研究"和"基于多活性代理的人工系统架构调整方法"结合实例分别选择一种应用模式进行展开,通过定性分析结合定量建模,对应用模式加以验证说明.
关键词 复杂系统; 多活性代理理论; 耗散自组织理论; complex system; multi-living agent theory; dissipative self-organization theory;
控制
复杂网络与系统
论文
Website
Google Scholar
陈增强, 王晶晶, 韩晓光, 张青
中国科学: 信息科学, 2019, 49(11): 1488-1501
摘要 本文基于矩阵半张量积方法研究了带有敌对输入的异步时序机的控制问题.首先,利用矩阵半张量积,给出了带有敌对输入的异步时序机动态行为的代数表示.接着,通过分析具体的控制过程设计了具有最小状态集的控制器并给出了控制器状态转移结构矩阵和输出结构矩阵的赋值算法.其次,基于带有敌对输入的异步时序机的代数表示和控制器的赋值算法给出了整个闭环系统的动态行为的代数表示,从而验证本文理论结果的正确性.最后,利用具体实例说明了本文所提方法的的可行性和有效性.
关键词 敌对输入; 异步时序机; 矩阵半张量积; 控制器; 转移结构矩阵; 输出结构矩阵; adversarial input; asynchronous sequential machine; semi-tensor product of matrices; controller; transition structure matrix; output structure matrix;
控制
复杂网络与系统
论文
Website
Google Scholar
周明洋, 吴向阳, 曹扬, 罗燎, 李晓宇, 廖好, 汪秉宏
中国科学: 信息科学, 2019, 49(10): 1333-1342
摘要 网络中的少量关键节点对政务舆情、病毒等信息扩散具有重要影响,因此关键节点挖掘是网络科学的关键问题之一.经典方法通过单个节点重要性指标选择关键节点,而多个重要节点的综合影响力更值得讨论.基于此,本文从多节点的综合影响力角度出发,基于Rayleigh熵机制,首先分析了个体影响力和多节点的综合影响力之间的关系,指出多节点的综合影响力小于单节点的影响力之和.然后提出了一个指标刻画多节点的综合影响力,并设计了一个高效的贪婪算法选择一组关键节点,从而最大化多节点的综合影响力. 4个真实网络上的信息传播实验验证了新算法的有效性.
关键词 传播; 传播源; 综合影响力; 复杂网络; 网络科学; spreading; spreaders; influence of grouping; complex networks; network science;
控制
复杂网络与系统
论文
Website
Google Scholar
孙秋野, 张一, 王睿, 刘振伟
中国科学: 信息科学, 2019, 49(8): 1066-1082
摘要 本文提出了一种超越结构能控性的研究微电网能控性的方法,证明了系统低通滤波器的截止频率是影响控制微电网所需的最少控制器数目的一大因素,该方法适用于实际微电网.此外,基于微电网特征矩阵的列初等变换,识别微电网中需要独立和非独立控制的节点,进而提出一种通用的系统控制矩阵构造方法,实现完全控制微电网的状态.进一步,根据节点状态误差曲线,证明所构造的控制矩阵可以保证微电网的能控性.最后以含7个分布式电源的微电网为例进行仿真验证,仿真结果验证了本文所提方法的有效性.
关键词 能控性; 最少控制器; 特征矩阵; 控制矩阵; 最小能量控制器; controllability; minimum controller; feature matrix; control matrix; minimum energy controller;
控制
复杂网络与系统
论文
Website
Google Scholar
周明, 武昭原, 贺宜恒, 李庚银, 赵彤, 龙苏岩
中国科学: 信息科学, 2019, 49(8): 1050-1065
摘要 针对中国电力市场深化改革以中长期交易和现货交易并举的发展模式,以及希望借助现货市场提高风电等不确定性新能源消纳水平的需求,本文设计了一种考虑中长期电量交易和风电参与的日前市场交易和结算模式,提出了中长期合同电量与日前交易相结合的方式;针对风电出力的不确定性,采用多概率场景表征,并建立了日前电量–备用联合出清概率模型.通过算例分析及与日前电量–备用序贯出清模型对比说明了所提模型的有效性.研究成果为我国电力市场由以中长期交易为主的电量市场向中长期交易和电力现货交易并举的市场过渡提供分析工具.
关键词 交易模式; 日前市场; 中长期交易; 风电场景; 联合出清; trading mode; day-ahead market; medium-and long-term transactions; wind power scenario; joint optimization;
控制
复杂网络与系统
论文
Website
Google Scholar
郭田德, 韩丛英, 李明强
中国科学: 信息科学, 2019, 49(6): 739-759
摘要 基于学习的两个主要研究内容,本文提出了学习的二元分层模式,给出了前端学习、后端学习、前后端组合学习和前后端融合学习的概念,构建了前后端融合学习的理论框架与最优化模型;针对前端学习,模拟大脑的分级工作机制,提出了数据与模型混合驱动的逐层数据再表达的方法;最后,以视觉(图像)学习为例,本文给出了一种数据与模型混合驱动的逐层数据再表达的具体方法.
关键词 机器学习; 模式识别; 数据表达; 数据与模型混合驱动; machine learning; pattern recognition; data representation; hybrid driven by data and model;
控制
复杂网络与系统
论文
Website
Google Scholar
李东, 程鸣权, 徐杨, 袁峰, 陈奕男, 付雅晴
中国科学: 信息科学, 2019, 49(5): 613-629
摘要 本文提出一种基于平均互信息的最优社区发现方法 AMI (average mutual information),该方法通过计算社区划分时的平均互信息值找出最优的社区划分.将AMI方法作用在非重叠社区发现算法GN和重叠社区发现算法COPRA上分别获得改进的AMI-GN算法和AMI-COPRA算法.将AMI-GN算法与GN, FN, IE算法进行对比实验,实验结果表明AMI-GN算法相较于其他算法提高了社区发现的质量.将AMI-COPRA算法与COPRA, LPPB算法进行对比实验,实验结果表明AMI-COPRA算法大幅度提升原始COPRA算法的稳定性,大大减少了平均迭代次数,加快了算法的收敛速度.相较于LPPB算法,发现社区的质量相差不大,但AMI-COPRA算法比LPPB算法更加稳定.研究表明,运用AMI方法可有效地改进典型的非重叠社区发现算法和重叠社区发现算法的性能.
关键词 AMI-COPRA算法; AMI-GN算法; 平均互信息; AMI方法; 社区发现; AMI-COPRA algorithm; AMI-GN algorithm; average mutual information; AMI method; community detection;
控制
复杂网络与系统
论文
Website
Google Scholar
李志强, 宋金利, 杨剑
中国科学: 信息科学, 2018, 48(9): 1214-1226
摘要 概率布尔网络是研究社会网络上的观念动力学以及基因调控网络的重要模型.对概率布尔网络的研究主要是利用Markov理论对系统的状态转移矩阵进行分析,矩阵的半张量积是将逻辑动态系统转化为代数形式的重要工具.本文主要利用矩阵的半张量积研究概率布尔网络到概率转移矩阵的逆问题,即将状态空间框架下的概率转移矩阵还原为原始的概率布尔网络.首先给出从状态概率转移矩阵构造概率布尔网络的算法,其次考虑到从概率状态转移矩阵到概率布尔网络构造的不唯一性,进一步改进了概率布尔网络逻辑表达的重构算法,最后通过实例检验了算法的有效性,并对未来的研究方向作出展望.
关键词 概率布尔控制网络; 矩阵半张量积; 逻辑实现; 概率转移矩阵; 重构; probabilistic Boolean control network; semi-tensor product of matrices; logical realization; transition probability matrix; reconstruction;
控制
复杂网络与系统
论文
Website
Google Scholar
谭玉顺, 费树岷, 刘金良
中国科学: 信息科学, 2018, 48(9): 1198-1213
摘要 为了减轻网络负荷和提高网络系统性能,本文基于混合触发传输机制研究了网络对抗攻击环境下的一类具有随机节点的复杂网络系统的H_∞状态估计问题.首先,考虑到系统状态波动较大时,传统事件触发机制会导致丢失一些重要信息,设计了一组分布式混合触发器,然后考虑信息在传输过程中可能发生的随机网络攻击和延迟,建立了一个新的复杂网络系统的状态估计模型,利用Lyapunov稳定性理论和随机分析技术,给出了状态估计系统渐近稳定的充分条件,在此基础上采用线性矩阵不等式的方法得到了状态估计器增益和混合触发器的未知参数.最后利用一个数值仿真验证了所提出的方法的有效性.
关键词 复杂网络; 混合触发机制; 对抗性网络攻击; 状态估计; 矩阵不等式; complex network; hybrid-triggered scheme; adversarial network attacks; state estimation; matrix inequalities;
控制
复杂网络与系统
论文
Website
Google Scholar
张维存, 魏伟
中国科学: 信息科学, 2018, 48(7): 947-962
摘要 基于虚拟等价系统理论统一分析和理解针对线性被控对象的,由任意控制策略和任意参数估计算法构成的自校正控制系统的稳定性、收敛性,给出了各种情况下便于工程应用的判据,这些判据的共同特点是不需要参数估计的收敛性.考虑到模型参考自适应控制可视为自校正控制的一种特殊情况,因此,本文方法和结论也可用于模型参考自适应控制系统的稳定性和收敛性分析.最后,用仿真结果验证了虚拟等价系统理论的有效性.
关键词 自适应控制; 稳定性; 收敛性; 虚拟等价系统; adaptive control; stability; convergence; virtual equivalent system;
控制
复杂网络与系统
论文
Website
Google Scholar
艾川, 陈彬, 刘亮, 董健, 何凌南, 赖凯声, 邱晓刚
中国科学: 信息科学, 2018, 48(7): 932-946
摘要 随着互联网和在线社交媒体的快速发展,社交网络中的信息传播十分迅速并难以掌控,社交网络中信息传播的规律研究需要进行大量的网络传播计算实验.当前以SIR模型为基础的网络传播实验广泛应用于疾病传播研究和信息传播研究.目前受限于硬件、软件等原因还很难进行超大规模的网络传播计算.然而当前互联网信息传播呈现出用户规模大、信息多、传播速度快的特点,以往基于抽象简化方法设计的小规模网络传播实验渐渐难以满足日益增长的计算需求.本文借助Spark平台,实现了超大规模网络传播计算实验算法,将该算法与Nepidemix单机传播计算组件进行了性能对比,论证了其优势和不足.该算法在有足够集群计算资源时可以进行上亿规模节点的网络传播实验,并且开发难度小,基于此可以高效地进行大规模复杂网络中的信息传播仿真,为舆情传播、监测、预测和干预等研究奠定了基础.
关键词 信息传播; 分布式计算; SIR模型; 复杂网络; 仿真方法; information dissemination; distributed computing; SIR; complex networks; simulation method;
控制
复杂网络与系统
论文
Website
Google Scholar
项伟, 吴迎年
中国科学: 信息科学, 2018, 48(7): 919-931
摘要 使用脑电信号控制智能轮椅是智能轮椅的一种新型控制方式,其控制中最大的问题在于脑电信号的识别与分类,尤其是对多种脑电信号的分类.为了提高多种脑电信号识别与分类的准确度,本文提出了将改进共空间模式与深度信念网络运用于脑电信号识别与分类中.采用Emotiv EPOC+脑电采集仪采集多种脑电信号,改进共空间模式针对多种脑电信号进行特征信号提取,深度信念网络对提取的特征信号进行识别与分类.实验表明,提出的改进共空间模式与深度信念网络的分类准确率高于传统脑电信号的分类方法,在未来研究多种脑电信号的识别与分类上提供了一种研究思路.
关键词 脑机接口; 脑电信号; 改进共空间模式; 深度信念网络; brain-computer interface; EEG signals; improved-common spatial patterns; deep-belief network;
控制
复杂网络与系统
论文
Website
Google Scholar
谭家驹, 秦乐, 赵新, 郭雪梅, 王国利
中国科学: 信息科学, 2018, 48(7): 903-918
摘要 为有效对抗窄带射频层析成像测量过程中所存在的多径干扰,实现对阴影衰落的有效估计,本文结合结构化聚集Bayes压缩感知理论,依据阴影衰落所具有的稀疏性和空间区域聚集性特征,构造阴影衰落分布的聚集稀疏先验模型,建立射频层析成像的结构化稀疏Bayes学习机制,增强射频链路对阴影衰落与其他多径衰落的辨别能力,有效抑制伪影的产生,提升射频层析成像技术对观测目标的识别性能,更好地服务于无源位置感知的实际应用.
关键词 窄带射频传感网络; 无源位置感知; 射频层析成像; 多径干扰; Bayes压缩感知; narrowband radio frequency sensor networks; device-free localization; radio tomographic imaging; multipath interference; Bayesian compressive sensing;
控制
复杂网络与系统
论文
Website
Google Scholar
金炜东, 杨沛, 唐鹏
中国科学: 信息科学, 2018, 48(7): 888-902
摘要 基于图像的接触网异常检测中,鸟巢检测是其中一种典型的异常状况.但在接触网图像数据中含有鸟巢的图像只占总数据很小的一部分,属一类典型的不平衡数据分类问题.使用机器学习模型解决该类不平衡数据问题,模型对于数据特征的学习能力非常关键.生成对抗网络(generative adversarial networks,GANs)可以无监督地学习到丰富的数据特征,其优异的数据特征捕获能力被越来越多地证实和应用.但由于GANs模型自身结构及原理所限,直接将其用作图像分类模型效果并不理想.本文针对图像分类任务对GANs模型进行了研究和改进,提出了双判别器生成对抗网络(double discriminator generative adversarial networks,DDGANs),在接触网鸟巢检测中取得了令人满意的分类效果.同时DDGANs也是一种有效的半监督学习模型,对MNIST标准数据集的实验表明,与其他模型相比,准确率和收敛速度获得了明显提高.
关键词 生成对抗网络; 半监督学习; 不平衡数据分类; 异常检测; 接触网; GANs; semisupervized learning; unbalanced data classification; anomaly detection; catenary;
控制
复杂网络与系统
论文
Website
Google Scholar
魏亚冰, 赵艳敏, 唐贻发, 王芬玲, 史争光, 李匡郢
中国科学: 信息科学, 2018, 48(7): 871-887
摘要 基于空间方向的有限元方法和时间方向的L1-CN格式,本文针对二维两项时间混合分数阶扩散波动方程进行数值分析.首先,给出该方程的全离散逼近格式,并证明其无条件稳定性.然后,严格证明L~2模意义下的收敛结果和H~1模意义下的超逼近结果O(h~2+τ~(min{2-α)1,~(3-α}))(0<α_1<1,1<α<2),这里h和τ分别表示空间和时间步长.进一步地,利用插值后处理技术导出H~1模意义下的整体超收敛结果.最后,借助于数值算例进一步展示理论分析的正确性和高效性.
关键词 分数阶扩散波动方程; 有限元方法; L1-CN格式; 稳定性; 超逼近; 收敛和超收敛; two-term mixed time-fractional diffusion-wave equations; finite-element method; L1-CN approximation; stability; superclose; convergence and superconvergence;
控制
复杂网络与系统
论文
Website
Google Scholar
张平改, 费敏锐, 王灵, 彭晨, 周文举
中国科学: 信息科学, 2018, 48(7): 856-870
摘要 炉窑和锅炉燃烧系统是一个复杂的非线性系统.针对当前炉膛火焰燃烧状况识别效果不理想、检测存在延迟等问题,提出了一种自适应颜色模型的火焰识别方法,以改善燃烧火焰的识别效果.首先,根据炉膛火焰燃烧特性设计含变量的自适应颜色模型,并采用最大类间方差法推导出自适应颜色模型中变量阈值的表达式;在此基础上,利用人类学习优化算法快速求解出最佳分割阈值,从而快速、精确地识别出炉膛火焰燃烧状况.最后,开展了仿真实验验证,结果表明所提出方法具有有效性与可行性.
关键词 自适应; 颜色模型; 火焰识别; 人类学习优化; 阈值; adaptive; color model; flame recognition; human-learning optimization; threshold;
控制
复杂网络与系统
论文
Website
Google Scholar
陈凯, 宋晓, 刘敬
中国科学: 信息科学, 2018, 48(7): 841-855
摘要 在计算机视觉领域已经提出了很多物体跟踪算法和多人跟踪算法,但是遮挡一直是跟踪领域一个具有较大挑战性的问题.为了实现在多种遮挡情况下的行人跟踪,本文提出了一种基于深度学习的行人跟踪框架:根据物体检测算法Faster R-CNN训练了一个行人检测算法作为行人跟踪的搜索机制,相比于梯度下降算法这个机制在缩小搜索范围的同时提高了准确度;利用颜色直方图和尺度不变特征相结合作为目标的表示方式,在目标匹配的过程中,基于FCN图像语义分割算法训练了一个针对行人全卷积网络来提取目标模型中的行人信息以便于去除背景的噪声影响.在数据库OTB上与其他跟踪方法进行了比较,结果显示所提出方法比其他跟踪器在有遮挡的情况下提高了跟踪的准确率和成功率.
关键词 Faster R-CNN; SIFT; FCN; 图像语义分割算法; 颜色直方图; Faster R-CNN; SIFT; FCN; image semantic segmentation; color histogram;
控制
复杂网络与系统
论文
Website
Google Scholar
郭圣明, 贺筱媛, 吴琳, 胡晓峰
中国科学: 信息科学, 2018, 48(7): 824-840
摘要 针对传统数据挖掘方法无法深入分析防空体系复杂关联关系和体系能力涌现生成机理的问题,提出一种基于强制自编码神经网络的防空作战体系能力回溯分析方法.以使命任务指标为牵引,利用大数据关联关系分析,复杂网络社团分析及主成分分析等方法,获取相对完备且具有明确军事含义的防空作战指标体系结构,以此先验知识为结构框架,构建结构约束的强制自编码深度学习网络模型,形式化地描述防空体系能力指标之间的级联涌现关系,并在此基础上深入分析体系能力生成机理及贡献度,最后通过仿真实验数据对模型进行了验证.实验结果表明,相对于传统的数据分析方法和深度学习方法,所提模型对防空体系能力指标涌现过程的形式化描述,不仅体现了涌现过程的非线性、不确定性等复杂性特征,同时还赋予指标体系相对明确的物理含义,为辅助指挥员深入认知并管控复杂作战体系提供了可行的方法手段.
关键词 作战体系; 效能评估; 深度学习; 涌现; 体系指标; 贡献度; operational system of systems; effectiveness assessment; deep learning; emergence; indices; contribution rate;
控制
复杂网络与系统
论文
Website
Google Scholar
耿超, 曲世友, 林廷宇, 肖莹莹, 贾政轩, 施国强, 王玫, 马秋丹
中国科学: 信息科学, 2018, 48(7): 810-823
摘要 互联网条件下的制造业协作关系是复杂网络系统.为了充分把握它的内在规律,指导我国制造业与互联网融合发展实现转型升级,本文研究提出"互联网+"条件下制造业协作关系优化升级模型——基于控制理论框架的闭环反馈控制模型,设计基于复杂社会网络理论的分析评估指标体系,并基于大型制造业互联网协作平台实际运行的微观数据进行实证分析.结果表明,"互联网+"有助于显著改善制造业协作关系的质量,提升整体的协作和创新绩效.
关键词 复杂社会网络; 建模与分析; 优化升级; 协作关系; 互联网+制造业; complex social network; modeling and analysis; optimization and upgrading; collaborative relationship; Internet + manufacturing;
控制
复杂网络与系统
论文
Website
Google Scholar
寇力, 范文慧, 宋爽, 尹丽丽
中国科学: 信息科学, 2018, 48(7): 794-809
摘要 装备保障体系在现代战争中起着决定性的作用,若采用实装试验的方式进行研究,耗费的时间、人力、物力成本都较高,故采用计算机建模和仿真的方式比较科学.但装备保障体系作为一个复杂大系统,其组成要素多,交互关系复杂,采用基于离散事件的仿真方法难以揭示体系的特性,因此引入基于多智能体的仿真方法来对装备保障体系进行建模和仿真,可以通过各个智能体自底向上、协作自治的方式来揭示体系的"涌现性".本文对装备保障体系进行了基于智能体的仿真建模,构建了仿真平台的体系架构,对仿真运行管理、时间同步和数据分发等关键技术进行了研究,提出了双向动态粗分链表树的发布订阅算法,最后通过原型系统和案例分析验证了基于多智能体的建模与仿真方法是切实可行的.
关键词 多智能体; 装备保障体系; 建模与仿真; 仿真运行管理; 时间管理; 数据分发; multiagent; equipment support system; modeling and simulation;
控制
复杂网络与系统
论文
Website
Google Scholar
王成恩
中国科学: 信息科学, 2018, 48(7): 783-793
摘要 复杂产品设计需要建立多个学科领域模型,传统设计方法造成大量"模型孤岛"和信息不一致性.为了优化产品全局运行性能,必须集成孤立的多学科模型,实现多学科耦合分析以及多学科设计优化.本文采用基于模型的系统工程(model-based systems engineering,MBSE)方法,研究复杂产品设计过程中多学科建模方法和模型集成技术.在MBSE方法指导下,本文研究和建立了涡轮叶片冷却结构设计的几何模型、气动分析模型、传热分析模型以及设计优化模型等.MBSE建模方法突破了传统的专业界限,在统一体系架构下建立多学科模型,可以消除多学科模型不一致性,以及实现了多学科模型集成.MBSE方法的应用能够提高复杂产品设计效率和水平.
关键词 基于模型的系统工程; 涡轮叶片; 几何模型; 物理模型; 优化模型; model-based system engineering; turbine blade; geometric model; physics model; optimization model;
控制
分布式控制与优化
论文
Website
Google Scholar
徐占伯, 周春翔, 吴江, 刘坤, 管晓宏
中国科学: 信息科学, 2023, 53(3): 517-534
摘要 建筑能源系统能耗总量巨大且用能弹性高,具有很大的节能优化潜力,其提效节能被认为是降低能源电力系统终端碳排放、实现“2030碳达峰、2060碳中和”国家战略目标的重要途径之一.然而,建筑能源系统节能优化面临人员行为与系统能耗交互影响、多种能源介质时空多尺度耦合与供需能量平衡等建模挑战,以及系统决策空间随建筑规模指数增长的维数灾计算复杂性挑战.针对上述挑战,本文从信息物理融合的角度出发,提出了基于节点–流量模型的建筑能源系统分布式优化模型,刻画了电、气、热等能源物理网络与信息网络的交互影响,实现了局部数据采集和计算的一体化结构设计,支撑边云协同计算体系.进而,设计了基于边云协同的分布式迭代优化算法,证明了算法的收敛性,可实现建筑能源系统供需协同优化,并大大降低了对全局信息的依赖性和通信需求.本文以6种不同规模下实际建筑系统的数值测试结果,验证了所提方法的性能和有效性,特别在大规模建筑能源系统上具有良好的应用前景.
关键词 建筑能源系统; 信息物理融合系统; 边云协同计算; 供需协同优化; 系统优化; building energy system; cyber-physical system; edge-cloud computing; supply-demand coordination; system optimization;
控制
分布式控制与优化
论文
Website
Google Scholar
李庆奎, 高雪峰, 彭晨, 张蕴隆, 易军凯
中国科学: 信息科学, 2023, 53(2): 325-343
摘要 产品与供应链协同演进系统(product and supply chain synchronous evolution system, PSCSE)是一类复杂的分布式信息物理系统(cyber-physical system, CPS),含有大量的未建模动态与不确定性.剧烈的需求波动及突发的网络事件,使系统结构参数极易发生变化.产品设计变更是维持PSCSES稳定、满足用户需求及保证经济效益的重要手段.本文研究基于分布式CPS的PSCSES在受到DoS攻击下的应急变更控制问题.首先,针对PSCSES在网络攻击下数据包丢失问题,利用每条子链的历史数据设计基于循环神经网络(recurrent neural network, RNN)的预测器以弥补因网络攻击造成的库存数据丢失;其次,利用博弈论思想将H∞一致性控制问题转化为多人零和图博弈问题,提出一种应急变更补偿机制;进而基于Q-learning的策略迭代技术设计了模型未知的控制器求解算法,实现了系统的库存状态H∞一致性.最后,仿真实验验证了所提方法的有效性.
关键词 网络攻击; 数据驱动; 供应链; 变更控制设计; 多智能体; cyber-attacks; data-driven; supply chain; change control design; multi-agent;
控制
分布式控制与优化
论文
Website
Google Scholar
孟祥正, 吴爱国, 梅杰, 马广富
中国科学: 信息科学, 2023, 53(1): 81-96
摘要 本文主要研究有向图中含弹性关节多机械臂系统的一致性问题,利用模型参考自适应一致性方法,将含弹性关节多机械臂系统的一致性问题转化成参考模型的一致性和单个机械臂系统的轨迹跟踪问题两个子问题.考虑到机械臂的相对角速度信息难以获取的情况,提出了无需相对角速度信息的线性参考模型.在轨迹跟踪算法设计上,利用反步法对单个机械臂系统设计了跟踪控制算法,使得系统达到关节角度趋于一致的结果.
关键词 含弹性关节机械臂; 一致性; 分布式控制; 多智能体系统; 有向图; manipulator with elastic joints; consensus; distributed control; multi-agent systems; directed graph;
控制
分布式控制与优化
论文
Website
Google Scholar
王荣笙, 张琦, 张涛, 林鹏, 丁舒忻, 袁志明
中国科学: 信息科学, 2022, 52(11): 2121-2140
摘要 针对突发事件导致的车站封锁情况,本文以列车运行图为问题对象,以进化计算框架为基础,提出基于问题知识的运行图实时调整方法,通过减小列车总晚点时间,保证高铁运营的安全高效和旅客的满意舒适.首先,基于调整列车发车次序的运行图调整策略提出排列编码方法,用于减少解空间的无效搜索.之后,根据“紧追踪”的列车运行追踪方式,设计启发式解码方法消除所有行车作业约束,提升算法求解效率.最后,将调度员调整运行图的经验作为问题知识,用于初始化进化计算的初始种群,由此提出基于问题知识的启发式种群初始化方法,加快算法前期的收敛速度并提高求解方案质量.以京津高速线为例,在北京南站设置车站封锁下20~150 min不同封锁时长的9个典型场景,选择加强精英保留遗传算法和差分进化算法,分别应用实整数编码和排列编码,与随机种群初始化和启发式种群初始化的不同组合进行仿真实验.仿真结果表明,相较于实整数编码难以获取可行解, 2种进化算法应用排列编码方法后,能在9 s的平均时间内给出列车总晚点时间最小的调整方案.在启发式种群初始化的改进下, 2种进化算法能更快地收敛于近似最优解.选取加强精英保留遗传算法应用排列编码和启发式种群初始化的改进变体,作为本文最优改进进化算法.针对CPLEX无法在10 min获得最优解的7个场景,该改进进化算法都能在20 s内给出近似最优解.
关键词 高速铁路; 列车运行调整; 车站封锁; 进化计算; 遗传算法; 排列编码优化; high-speed railway; train rescheduling; station blockage; evolutionary computing; genetic algorithm; permutation-based optimization;
控制
分布式控制与优化
论文
Website
Google Scholar
任丽娜, 武瀚, 焦晓红
中国科学: 信息科学, 2022, 52(6): 1098-1113
摘要 电动汽车具有移动储能器的特性,对其充放电行为进行合理调度可以对电网负荷起到削峰填谷作用,并提高电网对风光能源的吸纳能力,为此本文研究了含有电动汽车与电网交互(vehicle-to-grid,V2G)的孤岛微电网分布式能量管理策略.首先通过充放电电价诱导机制,提出一种包含电动汽车聚合商的多智能体微电网效益模型,进而考虑实际能源系统在发电损耗及功率平衡约束下的社会效益最大化问题.其次利用微电网内分布式能源之间信息交互,设计基于多智能体一致性理论的优化求解算法,并进一步考虑系统中存在通信随机时延的情况,最终实现社会效益最大化且系统电价达到一致,并对此研究背景下算法的收敛性进行分析,给出了收敛条件.最后采用标准IEEE-11总线结构对系统进行仿真验证,证明了所提控制策略的有效性.
关键词 V2G; 多智能体系统; 发电损耗; 通信时延; 分布式一致性; V2G; multi-agent system; power loss; time delay; distributed consistency;
控制
分布式控制与优化
论文
Website
Google Scholar
韩楠, 罗建军, 柴源
中国科学: 信息科学, 2020, 50(4): 588-602
摘要 对空间中由于燃料耗尽或执行机构故障而失效的航天器进行姿态接管控制能够实现其上高价值有效载荷的再利用,多个微小卫星通过协同,能够以较低的成本对其实施姿态接管控制.微分博弈研究了多个体的最优决策问题,其中各个体通过局部性能指标函数的优化获得控制策略,并实现博弈事先设定的全局目标.本文将失效航天器的姿态接管控制问题转换为多微小卫星的微分博弈问题进行研究.首先建立了多微小卫星的微分博弈模型,设计了微小卫星的性能指标函数,实现了对微小卫星微分博弈问题的数学描述.之后给出了微小卫星微分博弈的HJ (Hamilton-Jacobi)方程,并通过基于单神经网络的策略迭代算法进行了耦合HJ方程解的学习,实现了对微小卫星博弈均衡策略的逼近.最后进行了微小卫星微分博弈学习控制方法有效性的数值仿真验证,仿真结果表明,微小卫星通过学习到的近似博弈均衡控制策略,实现了失效航天器姿态接管控制的全局目标.
关键词 姿态控制; 接管控制; 微分博弈; 博弈控制; 策略迭代; attitude control; takeover control; differential games; game control; policy iteration;
控制
分布式控制与优化
论文
Website
Google Scholar
田磊, 王蒙一, 赵启伦, 王晓东, 宋勋, 任章
中国科学: 信息科学, 2020, 50(3): 408-423
摘要 分布式编队控制是集群智能控制重要的基础性研究课题之一.拒止环境和多任务需求对编队控制提出了新的挑战.本文研究了高阶线性集群系统在拓扑切换情况下的分布式分组时变编队跟踪控制问题.在本文所提出的集群系统模型架构中,智能体被分为3类:虚拟领导者、分组领导者和跟随者.虚拟领导者为整个集群系统宏观运动提供参考轨迹或者跟踪指令.分组领导者一方面跟踪虚拟领导者所提供的轨迹或指令;另一方面通过与其他分组领导者之间的相互协作实现各分组之间的协同配合.跟随者实现对各自分组领导者的时变编队跟踪.在拓扑切换和外部扰动同时存在的情况下,基于智能体之间的局部有限邻居节点之间的相对信息反馈和滑模控制理论构造了分布式分组时变编队跟踪控制协议,并给出了控制协议中未知参数的求解算法,进而利用李雅普诺夫(Lyapunov)理论证明了集群系统在拓扑切换和外部扰动同时存在情况下的闭环稳定性.最后,数值仿真结果验证了本文提出的控制方法能够实现集群系统分组时变编队跟踪控制,并可应用在以无人机集群为代表的实际物理模型中.
关键词 拒止环境; 高阶线性集群系统; 分组时变编队跟踪; 拓扑切换; 外部扰动; denial environment; high-order linear cluster systems; time-varying group formation tracking; switching topologies; external disturbances;
控制
分布式控制与优化
论文
Website
Google Scholar
郑洪宇, 王鹏, 邹涛, 胡静涛, 于海斌
中国科学: 信息科学, 2019, 49(1): 57-73
摘要 针对模型因素引起的预测控制性能退化问题,本文提出一种多变量半自适应预测控制系统架构.该架构将传统的控制模式改变为测试模式,变传统的设定值控制为区间控制,从而实现了测试过程中输出变量的约束满足.所提出的半自适应预测控制体系架构能够在确保生产正常进行的前提下,实现过程的开环测试,提高测试效率,并通过极大化测试信号的幅值来确保测试过程的信噪比.进一步地,将该框架从约束预测控制扩展到双层结构预测控制,引入平衡系数实现经济效益与测试之间的平衡.本文提及的测试方法是一种在线开环测试,避免了闭环测试过程中测试输入信号与不可测噪声的相关性问题.仿真实例验证了该方法的有效性.
关键词 自适应控制; 模型预测控制; 系统辨识; 参数估计; 区间控制; adaptive control; model predictive control; system identification; parameter estimation; zone control;
控制
故障诊断与控制系统安全
论文
Website
Google Scholar
蔡美玲, 汪家喜, 刘金平, 唐朝晖, 谢永芳
中国科学: 信息科学, 2023, 53(5): 972-992
摘要 基于过程中实时采集的多变量时序关联数据进行异常检测是预防工业过程事故、保障系统安全的关键环节之一.然而,工业多变量时间序列异常检测仍面临如下两大难题:(1)时序数据变量间复杂的非线性关联特性缺乏有效的表达方法;(2)正常/异常分布极度不均衡的时间序列间复杂的相关性有待深入挖掘.本文提出一种新的基于多变量时间序列的无监督异常检测方法 ——基于Transformer GAN的多变量时间序列异常检测方法 (TGAN-MTSAD). TGAN-MTSAD采用Transformer网络作为生成对抗网络的基本模型,引入了图注意力层以自动学习时序多元变量间的复杂依赖关系,还应用了patch技巧使模型能够有效捕捉时间窗口内的异常细节信息,并提出了基于重构误差与鉴别误差相结合的异常分数计算方法.采用3个真实世界的数据集对所提方法进行了大量的性能验证与对比实验分析.结果表明, TGAN-MTSAD可以有效检测过程中的时序异常,在大多数情况下优于基线方法,并且具有良好的可解释性,可用于复杂工业异常诊断.
关键词 多变量时间序列; 异常检测; Transformer; 异常分数; 图注意力; multivariate time series; anomaly detection; Transformer; anomaly score; graph attention;
控制
故障诊断与控制系统安全
论文
Website
Google Scholar
姜午恺, 周平
中国科学: 信息科学, 2023, 53(5): 946-971
摘要 针对高维不平衡数据的多工况故障诊断难题,提出一种非平衡数据条件下基于动态自适应迁移的宽度学习方法 (TL-BLS),并应用于污水处理过程的多工况故障诊断.首先,针对工业过程中不同工况下存在数据分布差异过大的问题,采用迁移学习流形变换方法拉近源域数据和目标域数据的距离;其次,针对后续自适应迁移中需要伪标签的条件,提出考虑数据不平衡的两阶段目标域伪标签预测方法,第一阶段使用基于类间关系的伪标签方法得到可靠度高的伪标签,第二阶段使用考虑子集差异的集成方法来获得可靠度更高且兼顾数据不平衡问题的伪标签;最终,建立带流形正则化项和具有动态平衡因子的自适应迁移与宽度学习方法,并在宽度学习系统和自适应迁移中引入权重矩阵来解决数据非平衡的问题,实现多工况过程下的故障诊断.污水处理过程数据实验及其比较分析表明所提方法具有更优的故障识别效果和更好的实用性.
关键词 故障诊断; 迁移学习; 宽度学习系统; 流形学习; 集成学习; 污水处理过程; 非平衡数据; fault diagnosis; transfer learning; broad learning system; manifold learning; ensemble learning; sewage treatment process; imbalanced data;
控制
故障诊断与控制系统安全
论文
Website
Google Scholar
卞嘉楠, 冒泽慧, 姜斌, 马亚杰, 刘文静
中国科学: 信息科学, 2023, 53(4): 699-714
摘要 针对工业生产关键设备故障数据稀疏的问题和故障诊断的需求,本文提出了一种基于知识图谱和多任务学习的工业生产关键设备故障诊断模型MKFD (multi-task learning for knowledge graphenhanced fault diagnosis),通过对故障根因的推断实现故障诊断.设计了多任务学习框架,并构造了一种改进十字绣单元用于实现框架内子任务之间的信息共享.利用运维数据构建故障现象–故障根因关联矩阵,使用多层感知机搭建知识图谱嵌入模型;分别将关联矩阵嵌入和知识图谱嵌入作为多任务学习框架中的两个子任务,通过子任务的交替学习,优化MKFD模型参数,实现对故障根因的推断,从而达到故障诊断的目的.最后,基于国内某工业企业的运维数据所构建的两个工业生产关键设备故障知识图谱对上述方案进行了验证实验,结果证明所提出的方法具有良好的性能.
关键词 故障诊断; 知识图谱; 多任务学习; 工业生产关键设备; 推荐系统; fault diagnosis; knowledge graph; multi-task learning; critical industrial equipment; recommender system;
控制
故障诊断与控制系统安全
论文
Website
Google Scholar
盛立, 牛艺春, 刘诗洋, 王伟亮, 高明, 周东华
中国科学: 信息科学, 2022, 52(11): 2106-2120
摘要 旋转导向钻井系统是油气开发领域的高端装备,其核心部分——动态指向式旋转导向钻井工具的可靠运行是钻井系统正常工作的重要前提.本文基于模型的方法研究了导向钻井工具装备的微小故障检测,有望为系统的运行维护与健康管理提供重要保障.首先,基于机理建模方法得到了导向钻井工具装备的数学模型.然后,利用移动加权平均方法提高了残差对微小故障的敏感性.基于非中心χ~2分布的性质,实现了对微小故障在统计意义下的可检测性分析,得到了保证误报率与漏报率在允许范围内的窗口长度和权值.最后,在旋转导向钻井工具原理样机上进行实验,实验结果验证了所提方法的有效性.
关键词 旋转导向钻井工具装备; 微小故障检测; 故障可检测性分析; 误报率; 漏报率; rotary steerable drilling tool equipment; incipient fault detection; fault detectability analysis; false alarm rate; missed detection rate;
控制
故障诊断与控制系统安全
论文
Website
Google Scholar
刘颖, 李阳光, 瞿树晖, 董纪昌, 王竞凡
中国科学: 信息科学, 2022, 52(10): 1870-1882
摘要 风机状态预测是风电数字化和智能运维的关键环节.深度学习由于在挖掘复杂高维数据隐藏关系上具有强大潜力,逐渐被应用于风机状态预测中.然而深度学习在实际运行中也存在着推理性和解释性差等局限性,如何将领域知识与智能算法有效结合是智能运维的一个重要方向.本文以多元时间序列图神经网络通用框架(multivariate time series graph neural network, MT-GNN)为基础,提出了一个知识嵌入式图神经网络模型(knowledge-embedded graph neural network, K-GNN),对风机多元时间序列状态数据进行预测.在该模型中,本文将知识嵌入模块与图学习模块相结合,通过嵌入相关、因果、专家经验3种知识矩阵,更好地刻画出状态变量之间的关联关系.结果显示,在3种知识嵌入式K-GNN模型中,嵌入了专家经验矩阵的图神经网络模型在预测上的表现更为出色,说明领域知识能够有效提升图神经网络模型的泛化性能和可解释性.本文的研究成果对于风电预测性维护技术的研发和推广具有参考意义.
关键词 风力发电机; 状态预测; 多元时间序列; 专家经验; 图神经网络; wind turbines; state prediction; multivariate time series; expert experience; graph neural network;
控制
故障诊断与控制系统安全
论文
Website
Google Scholar
朱哲人, 张新民, 柴毅, 宋执环
中国科学: 信息科学, 2022, 52(10): 1853-1869
摘要 面向系统状态安全的分析与控制,是目前控制领域内的热点研究之一.针对一类具有可行状态集的动态系统,本文深入讨论障碍函数与状态安全判据之间的相关性,通过设计一种新颖的障碍函数,提出了基于障碍函数的状态安全判据,该状态安全判据可用于此类系统的安全分析、诊断与控制.受启发于倒数障碍函数与零障碍函数,本文设计了一类非正障碍函数,并在此基础上提出了面向可行状态集的动态系统状态安全判据,通过验证该可行状态集的前向不变性,从而保证系统的安全性;根据非正障碍函数,建立了控制障碍函数,以此设计面向动态控制系统的状态安全控制器,保障系统的运行安全.上述理论与方法在一类连续搅拌釜反应器的安全运行控制中得以应用,通过仿真验证,证明了理论与方法的有效性,实现了基于障碍函数的安全控制理论在过程控制中的首次尝试.
关键词 非正障碍函数; 动态系统; 状态安全控制; 安全性判据; 控制障碍函数; non-positive barrier function; dynamical systems; state-safety control; safety criteria; control barrier function;
控制
故障诊断与控制系统安全
论文
Website
Google Scholar
冒泽慧, 顾彧行, 姜斌, 许德智, 孙秀文, 刘文静
中国科学: 信息科学, 2021, 51(6): 997-1012
摘要 高速列车牵引系统的微小渐变故障诊断是保障高速列车安全可靠运行的一项重要任务,传统的数据驱动方法通常难以在故障初期实现微小渐变故障的诊断.本文考虑到传感器时序信号的非平稳特性和微小渐变故障具有的慢时变特性,提出了一种基于改进长短期记忆网络(long short-term memory,LSTM)的微小渐变故障无监督诊断方法.首先,我们提出了一种基于LSTM的改进网络结构,并结合门控循环单元(gated recurrent unit, GRU)解码器,构造了一种对非平稳特性具有鲁棒性的自编码器模型以提取故障特征.进而,采用t-SNE (t-distributed stochastic neighbour embedding)对提取的故障特征向量进行降维,使用DBSCAN (density-based spatial clustering of applications with noise)进行故障聚类与识别,实现了对微小渐变故障的无监督诊断.最后,我们基于CRH_2牵引系统的半物理仿真平台数据对上述方案进行了验证.实验结果表明,该无监督诊断方法对同时包含已知和未知故障的情况能够达到95%以上的诊断准确率.
关键词 故障诊断, 微小渐变故障, 无监督学习, 改进的 LSTM 网络
控制
故障诊断与控制系统安全
论文
Website
Google Scholar
马亚杰, 姜斌, 任好
中国科学: 信息科学, 2021, 51(5): 834-850
摘要 本文针对挠性航天器执行器故障问题,提出了一种基于最小特征值的自适应故障补偿方法.首先,针对由故障和挠性模态引起的系统不确定性进行参数化;其次,为了解决由故障引起的控制增益矩阵的不确定性,构造了新的控制增益矩阵,并利用该矩阵的最小特征值设计标称控制信号;而后,设计自适应律对标称控制信号中的不确定参数进行估计,构成自适应控制信号,保证了系统稳定性和渐近跟踪性能;最后,仿真结果验证了本文提出的自适应控制方法的有效性.
关键词 执行器故障; 自适应补偿; 控制增益矩阵; 挠性航天器; 最小特征值; actuator faults; adaptive compensation; control gain matrix; flexible spacecraft; minimum eigenvalue;
控制
故障诊断与控制系统安全
论文
Website
Google Scholar
冯志超, 周志杰, 胡昌华, 班晓军, 张友民
中国科学: 信息科学, 2021, 51(4): 648-662
摘要 航天继电器作为液体运载火箭等大型结构件复杂电子系统中的关键部件之一,其工作状态直接决定整个系统能否正常工作.本文针对航天继电器使用过程中所面临的高价值样本缺乏、系统复杂、复杂环境干扰等难题,基于考虑属性可靠度的置信规则库(belief rule base with attribute reliability,BRB-r)专家系统提出了一种新的考虑环境干扰的航天继电器故障诊断与容错控制框架.在所提出的新框架中,对航天继电器输出监测指标进行分析,基于BRB-r建立航天继电器故障诊断模型,通过其工作状态评估结果,分为功能正常、功能缺陷和功能丧失3种;然后,针对3种状态分别设计3种控制策略:保持原控制输入、重构控制率和切换备份继电器.本文所提方法通过实验室所搭建的JRC-7M航天继电器测试系统进行了实验验证.
关键词 故障诊断; 容错控制; 航天继电器; 置信规则库; fault diagnosis; tolerance control; aerospace relay; belief rule base;
控制
故障诊断与控制系统安全
论文
Website
Google Scholar
谢春华, 杨辉, 李哲
中国科学: 信息科学, 2021, 51(1): 89-103
摘要 针对遭受稀疏恶意攻击的离散时间线性系统,本文研究其安全控制问题.假设恶意攻击者受有限资源的约束,仅能操控远程控制器和执行器之间的若干通信通道.对于设计者来说,并不知道哪些通道受到攻击,哪些通道没有受到攻击.本文提出了一种新的安全的远程控制方法,它由控制律、切换函数和选择机制构成.选择机制为控制律提供合适的反馈增益,并产生一个切换函数,用以阻止攻击信号进入被控对象.理论分析表明,在基本的和必要的假设条件下,本文考虑的安全控制问题可转化为求解状态反馈镇定问题.本文所提控制方法,能保证闭环系统的稳定性且使其具有"PID"型性能的抗攻击能力.最后,通过对某无人地面车辆系统的仿真实验,验证了理论结果的正确性.
关键词 安全控制; 信息物理系统; 稀疏恶意攻击; 切换策略; 抗攻击性能; secure control; cyber-physical systems; sparse adversarial attacks; switching strategy; attack-resilient performance;
控制
故障诊断与控制系统安全
论文
Website
Google Scholar
胡昌华, 冯志超, 周志杰, 胡冠宇, 贺维, 曹友
中国科学: 信息科学, 2020, 50(10): 1559-1573
摘要 液体运载火箭作为卫星运载的重要平台,对其结构安全性进行准确的评估极其重要.本文针对液体运载火箭实际工作过程中监测数据易受到噪声干扰的问题,基于置信规则库(belief rule base,BRB)提出了一种考虑环境干扰的液体运载火箭结构安全性评估方法.首先,通过分析火箭监测数据的特征,提出了一种基于距离的监测指标不确定度求取方法,通过指标不确定度来反映噪声对于监测数据的影响程度;然后,针对目前置信规则库模型中仅考虑了定性知识的不确定,无法处理监测数据不确定的问题,提出了一种考虑指标不确定度的输入数据匹配度转换方法,监测数据中包含不确定性信息的大小通过剩余匹配度表示;最后,基于BRB构建了液体运载火箭安全性评估模型,对存在不确定性的监测数据进行融合,得到液体运载火箭的安全性状态.通过实验室搭建的基于无线传感网络的运载火箭监测平台验证了所提方法的有效性.
关键词 安全性评估; 液体运载火箭; 指标不确定度; 置信规则库; 无线传感网络; safety assessment; liquid launch rocket; index uncertainty; belief rule base; wireless sensor network;
控制
故障诊断与控制系统安全
论文
Website
Google Scholar
刘强, 詹志强, 王硕, 刘英翔, 方彤
中国科学: 信息科学, 2020, 50(4): 527-539
摘要 高速列车多个轴承动态运行于相似环境造成轴承温度具有空间和时间相关性,可利用轴温相关关系的非期望变化进行轴承故障诊断;但传统的单一模态建模与监控方法未考虑在不同区间运行的列车其轴承温度具有各异的动态特征,难以建模上述关系,易造成误诊断.针对上述问题,本文研究综合利用高速列车轴温监测系统采集的同一列车多轴轴温数据,以及列车控制系统和轴承故障报警系统中的列车运行轨迹数据,提出数据驱动的列车轴承多模态运行监控与故障诊断方法.首先,针对列车通讯异常和传感器故障造成的缺失点和离群点问题,提出线性插值和动态主元搜索相结合的列车轴温数据预处理方法;接下来,依据不同运行区间内轴承温度变化相似性的聚类结果识别出同一列车的不同运行模态,并结合其与故障报警地理信息所提取的运行区间之间的相关性,提出基于列车运行轨迹的运行模态识别方法;在此基础上,提出多模态动态内在典型相关分析(multi-modal dynamic inner canonical correlation analysis, M-DiCCA)列车轴承多模态建模与运行监控方法;其后,提出基于动态时间规整的轴承故障原因诊断方法;最后,采用实际列车运行的轴温数据进行实验验证,结果表明了所提方法的有效性.
关键词 动态数据建模; 动态时间规整; 故障诊断; 多模态建模; dynamic data modeling; dynamic time warping; fault diagnosis; multimodal modeling;
控制
故障诊断与控制系统安全
论文
Website
Google Scholar
臧钰, 蔡伯根, 上官伟, 王化深
中国科学: 信息科学, 2020, 50(4): 511-526
摘要 列车运行控制系统是高速列车信息控制系统的"神经中枢",其结构复杂、组件繁多,其中,车载子系统是列车运行控制系统的核心组成部分,是保证行车安全、提高运行效率的关键.目前,车载子系统的故障数据处理方式仍以人工处理实现故障定位为主,尚未深入到系统故障机理层面,无法实现有效的故障预测.本文分析了车载子系统的结构及系统故障处置现状,总结了现存的主要问题,结合车载子系统结构及各模块性能参数,提出了基于贝叶斯网络(Bayesian network, BN)的系统级故障预测模型构建方法.利用实际系统现场运行数据,采用基于贝叶斯网络的方法进行故障预测,分别在20, 200, 2000,20000组数据条件下实施了验证,故障预测准确率分别为5%, 27%, 92%, 96.3%,在2000组数据条件下同时对隐马尔科夫模型(hidden Markov model, HMM)、神经网络(neural network, NN)与本文所提出的方法进行了对比,预测结果验证了贝叶斯网络在系统级故障预测方面的显著优势.
关键词 高速列车; 列车运行控制系统; 车载子系统; 故障预测; 贝叶斯网络; high-speed train; train control system; on-board subsystem; fault prediction; Bayesian network;
控制
故障诊断与控制系统安全
论文
Website
Google Scholar
姜斌, 陈宏田, 易辉, 陆宁云
中国科学: 信息科学, 2020, 50(4): 496-510
摘要 牵引系统为高速列车的重要组成部分,其可靠性对列车安全运行至关重要.本文利用牵引系统传感器数据,提出了一种最优的数据驱动故障检测与诊断(fault detection and diagnosis, FDD)方法,用于解决动态牵引系统的故障诊断问题.首先,基于传感器数据构建系统模型,用于描述牵引系统动态.然后,通过相关性与子系统辨识技术,定义残差生成器以及故障检测统计量.而后根据改进的支持向量机(support vector machine, SVM),研究了最优的数据驱动故障诊断问题.最后,通过中车株洲电力机车研究所有限公司的高速列车实验平台,验证了所提出方法的合理性与有效性.
关键词 高速列车; 牵引系统; 数据驱动; 故障诊断; high-speed trains; traction systems; data-driven; fault detection and diagnosis; FDD;
控制
故障诊断与控制系统安全
论文
Website
Google Scholar
郭天序, 桑建学, 陈茂银, 张峻峰, 台秀华, 周东华
中国科学: 信息科学, 2020, 50(4): 483-495
摘要 高速列车制动系统是确保列车安全平稳运行的关键系统之一,对其中发生的微小故障进行及时有效的检测可避免事故的发生并提高系统的可靠性.本文首先对高速列车制动系统中的EP阀漏气故障进行了简要分析;其次,提出了一种面向该系统的故障诊断架构;再次,针对故障特点提出了一种基于全局边际判别分析的故障检测方法;最后,在中车青岛四方车辆研究所有限公司的制动试验平台上对本文所提架构和方法进行了有效验证.
关键词 高速列车; 制动系统; 故障诊断架构; 微小漏气故障; 全局边际判别分析(GMDA); high-speed trains; braking system; fault diagnosis framework; incipient leakage fault; global marginal discriminant analysis(GMDA);
控制
滤波、估计与参数辨识
论文
Website
Google Scholar
王芳, 张蓝天, 郭雷
中国科学: 信息科学, 2022, 52(10): 1837-1852
摘要 司法大数据已成为法律实证研究和智慧司法工程建设的重要基础,相应地,数据计算结果的可解释性与可靠性等基础性问题愈加重要.为此,我们对非线性递推辨识理论进行了相应创新,并应用于量刑数据分析.具体来讲,依据相关法律建立了更加符合法逻辑的非线性随机量刑模型(S-模型),应用我们提出的非线性递推辨识算法和建立的关于有限数据样本下辨识精度的数学理论,对近20万故意伤害罪判决数据进行了计算分析.研究发现,与传统线性模型及最小二乘算法相比,基于我们的S-模型和非线性递推辨识算法所给出的计算结果,更符合量刑基本原则和具体规则,可以更准确地反映量刑要素的影响及变化,并具有更好的预测能力.
关键词 非线性模型; 递推辨识算法; 辨识精度保证; 量刑; 故意伤害罪; 司法判决数据; nonlinear model; recursive identification algorithm; identification accuracy guarantee; sentencing; crime of intentional injury; judicial documents data;
控制
滤波、估计与参数辨识
论文
Website
Google Scholar
李海涛, 樊敏, 黄勇, 程承, 李培佳, 张正好
中国科学: 信息科学, 2020, 50(12): 1932-1943
摘要 数据分析表明我国嫦娥三号月球探测器多普勒测速数据存在周期性系统差.根据多普勒测速模型和轨道信息,辅助多普勒测速信息含量分析,推导出周期性系统差产生的原因是测量数据的时标存在偏差,进而提出了自校准和差分统计校准两种补偿时标偏差的方法.计算结果表明,两种方法计算的嫦娥三号多普勒测速数据时标偏差一致.补偿时标偏差后,多普勒测速数据残差均方根(RMS)从1.5 cm/s降低到0.3 mm/s,无明显周期性系统差.以测距和甚长基线干涉(VLBI)测量数据联合定轨的结果为基准,利用时标偏差补偿后的多普勒测速数据联合VLBI测量数据进行定轨,其精度与基准轨道精度一致,位置偏差仅为2.5 m;利用时标偏差补偿后的多普勒测速数据联合测距数据进行定轨,与基准轨道的位置偏差为25 m;单独利用时标偏差补偿后的多普勒测速数据进行定轨,与基准轨道的位置偏差为200 m.
关键词 月球探测; 轨道确定; X频段; 多普勒测速; 时标偏差; lunar exploration; orbit determination; X-band; Doppler measurement; time-tag bias;
控制
导航、制导与控制
论文
Website
Google Scholar
仝秉达, 段海滨, 夏洁, 刘小峰
中国科学: 信息科学, 2022, 52(12): 2213-2224
摘要 基于微分对策的追逃博弈和疆土防御问题是多智能体对抗博弈控制的关键问题之一.本文研究了含障碍物的有界区域中多运动体边界防御博弈方法.首先通过对自然界中生物的捕食逃逸行为进行分析,对多运动体边界防御博弈系统进行了建模,得到不同情况下博弈终止条件和价值函数.其次,本文对含障碍环境下博弈双方的主导区域和界栅面进行了分析,并与无障碍情况进行了对比.最后,数值仿真验证了本文提出的多运动体边界防御方法满足微分对策中的鞍点策略条件和有效性.
关键词 捕食逃逸; 协同控制; 边界防御; 微分对策; 鞍点策略; predation and escape; cooperative control; border defense; differential games; saddle point strategy;
控制
导航、制导与控制
论文
Website
Google Scholar
胡伟, 雍可南, 陈谋
中国科学: 信息科学, 2022, 52(9): 1711-1726
摘要 无人机在现代战争中已发挥重要作用,为夺取海域制空权,航母配备无人机是必然趋势.面向无人机着舰的高精度控制要求,本文针对存在建模误差与外部干扰的无人机,在动态面控制框架下提出一种基于干扰区间观测器的无人机预设性能着舰飞行控制策略.该策略能够对未知项提供区间估计,在前馈补偿未知项的同时,控制律将根据区间估计的宽度动态调节控制器增益,从而保证无人机的轨迹始终处在着舰轨迹约束范围内.同时,在干扰区间观测器与飞行控制律设计过程中,引入非线性增益,有效地处理了着舰机动中的状态非线性耦合.最后,基于Lyapunov函数方法与不变集理论,给出着舰飞行控制策略的参数设计条件,数值仿真也进一步表明该策略的有效性.
关键词 无人机; 着舰控制; 预设性能控制; 干扰观测器; 区间观测器; unmanned aerial vehicle; carrier landing control; prescribed performance-based control; disturbance observer; interval observer;
控制
导航、制导与控制
论文
Website
Google Scholar
程怡新, 许斌, 洪锐
中国科学: 信息科学, 2022, 52(9): 1687-1710
摘要 针对组合动力空天飞行器宽域爬升过程存在的模态转换、气动参数未知以及外界时变干扰等问题,研究了一种基于飞行包线模态划分的切换控制方案.对飞行器六自由度模型和发动机推力模型进行气动和推力特性分析,给出了模态划分结果和模态转换过渡过程.基于切换信号设计建立了空天飞行器切换系统,设计终端滑模软切换控制策略来保证模态的平稳转换,并利用神经网络和非线性扰动观测器协同处理系统不确定性和外界时变干扰.通过多Lyapunov函数方法对闭环切换系统的稳定性进行了分析,且仿真结果验证了所提方法的有效性.
关键词 空天飞行器; 组合动力; 模态转换; 切换控制; 鲁棒自适应控制; aerospace vehicle; combined power; modal transition; switching control; robust adaptive control;
控制
导航、制导与控制
论文
Website
Google Scholar
周同乐, 陈谋
中国科学: 信息科学, 2022, 52(9): 1642-1655
摘要 针对核电站空中动态入侵目标,本文提出了一种基于动态目标概率分布的无人机航路强化学习规划算法,实现了对空中入侵目标的有效拦截.根据入侵目标的状态信息基于概率扩散原理计算目标的概率分布,推理目标可能出现的位置.在此基础上,设计了基于航路点转移规则的行动空间和基于目标概率分布的报酬函数动态更新机制,通过Q-学习不断优化路径,构建了基于目标概率分布和强化学习的无人机航路规划框架,实现了无人机航路强化学习规划.仿真结果表明,该方法能够针对核电站空中入侵目标,实现目标点变化情况下无人机的自主航路规划.
关键词 无人机; 核电站; 航路规划; 动态目标概率分布; 强化学习; UAV; nuclear power plant; path planning; dynamic target probability distribution; reinforcement learning;
控制
导航、制导与控制
论文
Website
Google Scholar
张学伟, 田栢苓, 鲁瀚辰, 谌宏鸣, 宗群
中国科学: 信息科学, 2022, 52(9): 1627-1641
摘要 考虑复杂未知多障碍环境对无人机实时轨迹规划性能的影响,提出了基于Tube-MPC和模型预测路径积分(model predictive path integral, MPPI)控制相结合的多无人机分布式实时轨迹规划框架与方法.首先,考虑无人机在多障碍环境下的避碰避障需求,构造代价函数表征轨迹规划过程中的约束条件,将多无人机的轨迹规划问题转化为随机最优控制问题.其次,借鉴Tube-MPC思想,设计并实现了多无人机分布式轨迹规划框架,通过将低频标称控制器与高频辅助控制器串联保证了系统的实时性和鲁棒性.再次,为避免传统方法在求解过程中的维数灾难,提出基于MPPI的多无人机异步轨迹规划方法,该方法通过基于GPU的并行蒙特卡洛(Monte-Carlo)随机前向采样技术,将多无人机随机最优控制问题的求解转化为给定代价函数下对采样轨迹期望的求解,进而获得最优控制序列,其显著特点是求解速度快且避免了基于梯度求解方法对约束条件和代价函数连续性及凸特性的要求.最后,通过Gazebo虚拟仿真平台,在复杂未知多障碍环境下对算法的有效性进行了验证.
关键词 未知多障碍环境; 多无人机; 在线轨迹规划; 模型预测路径积分; GPU并行加速; unknown obstacle-rich environment; multi-UAV; online trajectory planning; model predictive path integral; GPU parallel acceleration;
控制
导航、制导与控制
论文
Website
Google Scholar
王浩淼, 段海滨, 魏晨
中国科学: 信息科学, 2022, 52(9): 1598-1609
摘要 无人机集群动态资源分配是其任务规划的挑战性关键技术难题.本文提出了一种基于合作竞争机制的动态资源分配方法,将无人机集群与网络进化博弈模型进行对应,建立了基于无人机拓扑网络的博弈模型,通过设计针对特殊个体的调控规则,达到提升系统平均收益的目的.最后,通过无人机博弈模型的仿真实验,根据网络结构、模型参数,以及不同激发机制下系统的稳态结果,验证了本文所提无人机动态资源分配方法的可行性和有效性.
关键词 无人机集群; 公共物品博弈; 动态资源分配; 合作机制; 竞争机制; UAV swarm; public goods game; dynamic resource allocation; cooperative mechanism; competition mechanism;
控制
导航、制导与控制
论文
Website
Google Scholar
潘豪, 胡瑞光, 宋征宇, 邵梦晗
中国科学: 信息科学, 2022, 52(5): 870-889
摘要 飞行故障在线自主辨识与控制重构是实现航天智能飞行的一个重要标志.本文针对运载火箭飞行中的推力矢量极性错误,研究了基于人工神经网络的故障识别与自主重构方法.在明确故障模式基础上,结合扩张状态观测器(extended state observer, ESO)观测结果,提出了考虑模型偏差的仿真训练样本设计方法,并分别采用基于反向传播(back propagation, BP)神经网络和长短时记忆(long short term memory, LSTM)网络方法进行了故障辨识设计,仿真结果表明,两种方法均具有较高识别准确度,均可实现推力矢量极性错误下的平稳自主重构,相比而言,基于滑窗时间序列的LSTM网络方法更具优势,具有较高的识别准确度.
关键词 极性错误; 自主重构; 扩张状态观测器; 反向传播; 长短时记忆; polarity errors; autonomous reconstruction; extended state observer(ESO); back propagation(BP); long short term memory(LSTM);
控制
导航、制导与控制
论文
Website
Google Scholar
石永霞, 胡庆雷, 邵小东
中国科学: 信息科学, 2022, 52(3): 506-520
摘要 针对角速度受限和通信资源有限的航天器姿态系统,考虑转动惯量难以精确获得并且存在外部干扰的情况,提出一种基于神经网络的自适应事件触发姿态机动控制算法.该算法首先基于预设性能技术,将角速度受限约束转换为性能边界约束,进一步通过误差转换,建立姿态系统的等效误差模型,将存在角速度约束的航天器姿态系统机动控制问题巧妙地转化为无约束误差系统的状态有界稳定控制问题;然后,选用径向基神经网络设计自适应律,在线逼近系统中由未知转动惯量带来的不确定性项.与此同时,考虑到星载通信资源有限的问题,通过建立触发控制信号与实时控制信号之间的显式关系,设计一个统一的时变事件触发机制,当触发条件满足时同步更新控制器和自适应律,大大减少了控制器和执行器之间频繁的网络信号传输.此外,触发机制中时变项的引入严格保证了触发控制无Zeno现象发生.最后,仿真结果表明了所提出的姿态控制算法不但能够保证航天器高精度、高稳定度、高鲁棒性地完成指定姿态机动任务,而且可以减少大约97.50%的控制信号更新,这大大缓解了航天器的通信负担.
关键词 航天器; 角速度受限; 预设性能控制; 通信资源有限; 事件触发机制; spacecraft; angular velocity constraint; prescribed performance control; limited communication resources; event-triggered mechanism;
控制
导航、制导与控制
论文
Website
Google Scholar
景奉水, 郑榕樟, 杨国栋, 邓赛, 谭民
中国科学: 信息科学, 2021, 51(11): 1914-1930
摘要 针对低阻尼柔性机构运动中的振动问题,本文提出了一种综合最优双S形轨迹规划法和输入整形法优点的串联抑振轨迹规划方法,其优势是可以有效抑制匀速运动时段的振动.论文从理论分析和数字仿真两个方面对该方法的正确性进行了证明.最后,对该方法在FAST馈源支撑系统的应用结果进行分析,表明其可有效提高并联柔索机构的运动精度,特别在匀速运动时可提高位置跟踪精度超过20%.
关键词 柔性机构; 五百米口径球面射电望远镜; 振动抑制; 轨迹跟踪; 运动规划; soft mechanism; five-hundred-meter aperture spherical telescope; vibration control; trajectory tracking; motion planning;
控制
导航、制导与控制
论文
Website
Google Scholar
蔡星娟, 胡钊鸣, 张志霞, 王茜, 崔志华, 张文生
中国科学: 信息科学, 2021, 51(6): 985-996
摘要 随着无人机应用领域的增多,多无人机协同航迹规划问题变得愈发重要.然而,现存的多无人机协同航迹规划问题大多将多个目标加权转换为单目标问题进行优化,为减少多目标加权的主观性,本文提出一种基于高维多目标优化的多无人机协同航迹规划模型,此模型可以同时优化多无人机航迹距离代价、多无人机航迹威胁代价、多无人机航迹能耗代价,以及多无人机协同性能.同时,为提高高维多目标优化算法在解决此模型时的性能,提出一种基于个体评估交叉策略的NSGA-Ⅲ算法(NSGAⅢ-ICO),可以根据算法运行代数综合评估个体优劣并指导种群交叉操作.仿真结果证明,此模型可以有效地提供多无人机协同航迹,且通过与其他高维多目标优化算法的比较,可以证明此改进算法可以有效地提高多无人机协同航迹规划的多种性能.
关键词 多无人机, 协同航迹规划, 高维多目标优化算法, 个体综合评估
控制
导航、制导与控制
论文
Website
Google Scholar
宁晓琳, 桂明臻, 黄月清, 房建成, 吴伟仁
中国科学: 信息科学, 2021, 51(6): 971-984
摘要 脉冲星导航是一种极具潜力的深空自主导航技术,通常采用脉冲到达时间(time of arrival,TOA)作为量测信息.但脉冲星星历误差和星载原子钟误差等系统误差对导航性能有显著影响.为了解决上述问题,提出了一种基于TOA和时间差分TOA (TDTOA)的增广状态脉冲星组合导航误差抑制方法,通过将每个脉冲星的星历误差和时钟误差增加到状态向量,并利用TOA和TDTOA量测值对其进行估计和校正.仿真结果表明,该方法提高了脉冲星星历误差和时钟误差的可观测性,有效地消除了这些系统误差的影响,导航精度相比传统脉冲星导航提高了29%.
关键词 自主导航, 脉冲星导航, 系统误差, 时间差分, 可观测性分析
控制
导航、制导与控制
论文
Website
Google Scholar
闫东, 陈谋, 吴庆宪, 袁梦顺
中国科学: 信息科学, 2021, 51(4): 663-677
摘要 针对复杂战场环境下确定无人机安全飞行区域的过程中面对的复杂性和不确定性问题,本文提出了一种基于变权理论和马尔可夫模型的无人机安全飞行区域确定方法.根据无人机相对于威胁区域距离的不同,引入变权理论对威胁指标权值进行调整,完成综合威胁大小计算.然后,利用马尔可夫模型对无人机飞行过程中受到的潜在威胁进行预测.接着,使用模糊评估方法评估无人机飞行区域的威胁等级,并引入云模型构建隶属度函数,以提高评估结果的可靠性.最后,根据威胁阈值确定无人机安全飞行区域.仿真结果表明所研究的无人机安全飞行区域确定方法在复杂战场环境下是有效的.
关键词 无人机; 威胁评估; 安全飞行区域; 变权理论; 马尔可夫模型; UAV; threat assessment; flight safety envelope; variable weight theory; Markov model;
控制
导航、制导与控制
论文
Website
Google Scholar
刘钻东, 陈谋, 吴庆宪, 陈哨东
中国科学: 信息科学, 2020, 50(5): 704-717
摘要 实际空战的复杂性和不确定性及部分空战信息未知性,给无人机空战目标意图预测带来巨大挑战.针对非完备信息下无人机空战目标意图预测问题,本文提出了一种基于长短时记忆(long shortterm memory, LSTM)网络的非完备信息下空战目标意图预测模型.采用分层的方法建立空战目标意图预测特征集,并将空战信息编码成时序特征,将专家经验封装成标签,引入三次样条插值函数拟合以及平均值填充法来修补不完备数据,利用自适应矩估计(adaptive moment estimation, Adam)优化算法,加快目标意图预测模型训练速度,以便有效地防止局部最优的问题.最后通过仿真验证了所建立的无人机空战目标意图预测模型能有效预测无人机空战目标意图.
关键词 意图预测; 非完备信息; 长短时记忆网络; 数据修补; Adam; intention prediction; incomplete information; long-short-term memory; data repair; Adam;
控制
导航、制导与控制
论文
Website
Google Scholar
寇展, 吴健发, 王宏伦, 阮文阳
中国科学: 信息科学, 2020, 50(5): 692-703
摘要 本文提出了一种基于深度学习与目标跟踪方法,综合单目视觉和双目立体视觉特点的无人机障碍物实时感知方法.首先,采用深度学习的方法对相机采集的首帧图片进行障碍物检测与识别,并采用目标跟踪算法对首帧检测结果进行实时跟踪,以提高检测系统实时性;同时,使用双目立体视觉技术对当前帧图像进行全图的三维重构,得到环境的空间信息;之后,通过在检测结果的感兴趣区域内进行点云聚类提取等策略并结合上述感知到的信息进行信息融合,得到障碍物的种类、空间位置及轮廓大小.最后,开发实物样机对方法进行验证,结果表明通过采用该方法,无人机在搭载一个双目相机的情况下即可完成对障碍物的实时感知.
关键词 深度学习; 目标跟踪; 无人机; 障碍感知; 双目视觉; deep learning; target tracking; UAVs; obstacle sensing; binocular vision;
控制
导航、制导与控制
论文
Website
Google Scholar
程春, 赵玉新, 李亮, 赵琳
中国科学: 信息科学, 2020, 50(4): 603-616
摘要 北斗卫星导航系统(BeiDou navigation satellite system, BDS)空间信号异常是影响其空间信号质量评估的重要因素,检测并排除空间信号异常不仅是构建BDS空间信号故障模型的重要手段,更有利于保障BDS导航定位的完好性.传统基于事后精密星历与广播星历比对的方法存在时延较大、采样率低等问题,本文提出了一种基于Kalman滤波的载波相位平滑伪距算法,并基于BDS空间信号用户测距误差的统计特性建立了实时估计BDS空间信号用户测距误差方法,从而实时检测并排除BDS空间信号异常.基于国际全球导航卫星系统服务(international GNSS service, IGS)地面观测网1 Hz采样率数据的实验结果表明,所提出方法对BDS空间信号用户测距误差的估计精度为1.15 m,可以有效识别由卫星轨道和时钟故障引起的空间信号异常.
关键词 北斗卫星导航系统(BDS); 空间信号误差; 异常检测; 完好性; BeiDou navigation satellite system(BDS); signal-in-space error; anomaly detection; integrity;
控制
导航、制导与控制
论文
Website
Google Scholar
汪亮, 王文, 王禹又, 侯松林, 乔裕哲, 吴天珩, 陶先平
中国科学: 信息科学, 2020, 50(3): 375-395
摘要 目标搜索问题是现实中一类常见的问题,如灾难现场搜救、战场目标侦察等.无人机由于其灵活性、低成本、可搭载各类传感器并以集群形式开展协作等优势,是解决大范围、高风险区域目标搜索问题的理想技术方案,当前发展迅速.在战场等复杂现实环境中,由于缺乏基础通信设施及干扰的存在,无人机与地面指挥员、无人机之间难以快速、可靠通信,处于通信拒止状态.因此,无人机难以获得指挥员的实时控制信息,需要其具备自主、智能完成任务的能力并开展协同.随着人工智能技术的快速发展,强化学习技术在解决连续决策问题上展现出了较强的潜力.无人机搜索问题作为一种典型的连续决策问题,属于强化学习技术的适用范围.但对于目前的强化学习及人工智能技术能否适用于无人机从而自主决策完成现实场景中的任务这一问题尚存争议,仍有待进一步探索.为此,本文以现实战场环境为背景,对通信拒止及包含两方对抗的战场环境中的目标搜寻问题进行了建模,依据模型构建了对抗仿真平台,并通过实验研究的方式针对以下3个问题展开了探索:(1)强化学习在通信拒止环境下多无人机搜索问题的适用性;(2)各强化学习算法在该问题上的优劣;(3)通信拒止程度对强化学习算法效果的影响.通过运用当前主流的强化学习技术开展仿真实验并定量评估实验结果.本文总结发现:(1)强化学习在解决通信拒止环境下多无人机搜索问题上具备有效性;(2)在与其他算法对抗时,运用基于Deep Q-Network (DQN)强化学习技术的自主决策无人机集群体现出了较强的问题解决能力;(3)通信拒止程度对强化学习算法效果有影响,但在不同的通信拒止程度下,强化学习算法表现相对稳定.
关键词 无人机; 强化学习; 目标搜寻; 通信拒止环境; UAV; reinforcement learning; target searching; communication denied environments;
控制
导航、制导与控制
论文
Website
Google Scholar
宋征宇, 王聪, 巩庆海
中国科学: 信息科学, 2019, 49(11): 1472-1487
摘要 本文针对运载火箭上升段飞行中的推力下降故障,研究在线自主救援的策略和算法.在故障时刻采用迭代制导和数值积分的方法进行运载能力的估计,当判断目标轨道不可达但仍能达到最低可接受的安全轨道时,自主寻找最优救援轨道.首先通过地心角估计,轨道坐标系转换以及凸优化方法,计算在故障时刻轨道面内和地心角约束下的最高圆轨道;随后以该问题的解为初值,利用自适应配点法求解不含上述约束的最优圆轨道;最后根据该圆轨道的高度与目标轨道近地点高度的对比来决策是否需要继续调整其他轨道根数偏差.该方法优先保障轨道高度,并能根据最优性权重优化最接近目标轨道的救援轨道;充分发挥了地心角预估可以简化终端约束条件,凸优化算法收敛性好,自适应配点法在合理初值条件下计算效率高的优势.仿真表明,本文提出的救援策略和算法的适应性、收敛性和实时性能够满足在线应用需求.
关键词 运载火箭; 自主救援; 迭代制导; 凸优化; 自适应配点法; launch vehicle; autonomous rescue; iterative guidance method; convex optimization; adaptive collocation method;
控制
导航、制导与控制
论文
Website
Google Scholar
申燕凯, 段海滨, 邓亦敏, 罗琪楠, 魏晨
中国科学: 信息科学, 2019, 49(10): 1343-1352
摘要 本文研究了鸽群被动式惯性应急避障行为,并将其应用于无人机集群协同飞行验证.自然界中的鸽群在飞行过程中动态调整路线,当遇到障碍物时,产生一种应急行为,即被动地调整自身当前方向,朝着障碍物间的最大缝隙穿越障碍,完成避障.在进行飞行验证前,对设计的无人机集群系统架构进行阐述.然后,通过设置地面静止障碍物应急避障和空中运动障碍物应急避障两种场景对鸽群避障行为进行验证,并给出相应的无人机集群飞行时序图和飞行轨迹图.
关键词 鸽群智能; 应急避障; 无人机集群; 协同控制; pigeon flock intelligence; emergency avoidance; UAV swarm; cooperative control;
控制
导航、制导与控制
论文
Website
Google Scholar
陈祺, 艾剑良
中国科学: 信息科学, 2019, 49(6): 760-774
摘要 针对六自由度高超声速飞行器的飞行控制问题,本文提出了基于非线性动态逆和线性反馈方法建立主控制系统,应用L_1自适应控制理论设计辅助控制系统以提升控制性能的设计方案.首先,对高超音速飞行器模型的速度和姿态角控制通道建立非线性动态逆系统.在这一基础上,采用线性二次型(linear quadratic, LQ)方法设计线性反馈控制器,作为主控制系统完成指令信号的跟踪.其次,应用L_1自适应控制方法设计辅助控制器,以提升控制系统在不确定性存在情况下的性能.仿真结果显示,辅助控制系统能有效提升跟踪控制的精度,提高系统的鲁棒性,并且在输入扰动、气动参数不确定性、参数变化、控制功能部分失效等情况下可取得良好的指令跟踪效果.
关键词 高超音速飞行控制; 非线性动态逆; L_1自适应控制; 扰动与不确定性; 跟踪控制; hypersonic flight control; nonlinear dynamic inversion; L_1 adaptive control; disturbance and uncertainty; tracking control;
控制
导航、制导与控制
论文
Website
Google Scholar
黄锦波, 伍益明, 常丽萍, 何熊熊
中国科学: 信息科学, 2019, 49(5): 599-612
摘要 本文研究了一类由一阶二阶智能体组成的异构系统安全一致性分析与设计问题.首先从拓扑结构角度,通过设立信任节点机制,显著提升了系统网络拓扑的稳健性.然后,针对邻居中敌对节点的攻击行为,分别设计了一阶二阶智能体的控制策略,并给出了系统实现安全一致性目标的充分条件.最后,通过仿真实例验证了理论结果的有效性.
关键词 异构系统; 多智能体系统; 安全一致性; 安全控制; 信任节点; heterogeneous systems; multi-agent systems; secure consensus; secure control; trusted node;
控制
导航、制导与控制
论文
Website
Google Scholar
熊英, 陈谋, 吴庆宪, 杨洁
中国科学: 信息科学, 2019, 49(5): 585-598
摘要 针对变后掠翼飞行器具有多工作模式、大飞行包络的特性,本文建立了非线性多模型切换系统,并研究了机翼后掠角变化过程中对飞行高度和飞行速度的跟踪控制.为了减小姿态系统中不确定性和外部未知扰动的影响,利用非线性干扰观测器对复合干扰进行逼近并设计滑模姿态控制器,保证了良好的姿态跟踪控制效果.采用平均驻留时间方法证明了所设计的控制器能够保证切换系统的稳定性.最后,通过仿真对所提方法的有效性进行了验证.
关键词 变后掠翼近空间飞行器; 切换系统; 干扰观测器; 自适应滑模控制; 平均驻留时间; variable swept-wing near space vehicle; switching system; disturbance observer; adaptive sliding mode control; average dwell time;
控制
导航、制导与控制
论文
Website
Google Scholar
屈小媚, 刘韬, 谈文蓉
中国科学: 信息科学, 2019, 49(5): 570-584
摘要 基于多无人机协作的无源目标定位是无人机在军事侦察等领域应用的关键技术.现有研究大部分针对单目标的无源定位,本文研究利用到达时间差观测对多目标进行无源定位的高效算法.将已有的两步加权最小二乘方法中辅助变量与目标位置的非线性关系作为约束,建立约束加权最小二乘多目标定位模型,并化简为含多个二次不定等式约束的二次规划问题.这是一个NP-hard的非凸优化问题.本文提出一种CWLS (constrained weighted least squares)近似迭代算法,在迭代过程中用线性等式约束近似二次不定等式约束,使其近似优化问题有解析解.理论分析表明,该算法收敛的极限一定是原问题的全局最优解. Monte Carlo实验表明,该算法在绝大部分情况下能快速收敛,且对多目标定位的精度优于两步加权最小二乘方法.
关键词 无人机; 无源定位; 多目标; 到达时间差; 约束加权最小二乘; unmanned aerial vehicle; passive localization; multi-source; time difference of arrival; constrained weighted least squares;
控制
导航、制导与控制
论文
Website
Google Scholar
严飞, 祝小平, 周洲, 唐杨
中国科学: 信息科学, 2019, 49(5): 555-569
摘要 针对侦察/攻击型多无人机协同搜索和攻击作战想定,考虑其中相互耦合的任务分配和航迹规划问题,提出了一种获得最大系统效能的任务分配算法以及同时攻击目标的航迹规划算法.该任务分配算法基于合同网协议,考虑目标的资源需求和无人机的资源约束关系,其目标函数中同时包含执行目标的收益和代价.航迹规划中,考虑无人机的运动学约束和同时攻击目标的需求,提出了基于协同粒子群算法和协同函数、协同变量相结合的算法.仿真结果表明,所提出的任务分配方法较之多项式时间联盟构建算法(PTCFA),能够获得至少8%的效能提升.
关键词 多无人机; 任务分配; 航迹规划; 同时到达; PH曲线; multiple UAV; task allocation; path planning; simultaneous arrival; Pythagorean hodograph curves;
控制
网络化控制系统
论文
Website
Google Scholar
邓甲, 王付永, 刘忠信, 陈增强
中国科学: 信息科学, 2023, 53(1): 97-110
摘要 针对无向通信拓扑下二阶多智能体系统的一致性问题,本文提出了一种基于自适应动态时钟的新型事件触发控制策略.智能体根据自身的动态时钟来确定触发时刻,在触发时刻向邻居广播自身的状态信息并自适应重置时钟.每个智能体只获取邻居在触发时刻的状态信息,且仅依赖自身的状态和邻居在触发时刻的状态来更新时钟和控制信号,无需使用邻居的实时状态信息,也无需使用通信拓扑的任何全局信息.所设计的控制策略有效避免了连续通信,并且是完全分布式的.利用代数图论以及Lyapunov稳定性分析方法证明了所提出的控制策略能保证系统是渐近稳定的并且不存在Zeno行为.仿真示例进一步验证了所提出控制策略的有效性.
关键词 完全分布式一致性; 多智能体系统; 事件触发控制; 自适应动态时钟; Zeno行为; fully distributed consensus; multi-agent systems; event-triggered control; adaptive dynamic clock; Zeno behavior;
控制
网络化控制系统
论文
Website
Google Scholar
宿浩, 张宝琳, 籍艳, 蔡智辉, 薛健, 马慧, 郑元世
中国科学: 信息科学, 2022, 52(12): 2195-2212
摘要 为提高移动多智能体系统的覆盖控制效率,通常要求移动智能体在覆盖控制过程中进行多信息甚至全信息交互.在此情形下,覆盖控制成本和能耗将大幅增加.如何在提高移动智能体覆盖效率的同时,尽可能降低控制成本一直是移动智能体覆盖控制领域的重要课题之一.本文研究非完全信息条件下的移动多智能体覆盖控制方法,提出了基于虚拟排斥力的移动多智能体覆盖控制合作博弈算法.首先,将移动多智能体集群分解为若干个子集群,群中每个智能体只能观测到各自周围一定范围内其他智能体的信息,将移动多智能体集群的覆盖控制问题转化为非完全信息条件下移动多智能体子群的合作博弈分布覆盖问题;其次,给出了各移动智能体子群的博弈规则,并提出了一种基于虚拟排斥力的智能体分布覆盖博弈决策策略,用以计算并确定集群中每个智能体在覆盖控制过程中的新候选位置;第三,将移动多智能体系统覆盖控制问题分解为以刚性虚拟结构为参照系的覆盖控制问题,简化了多智能体系统覆盖控制中位移路径的规划设计.仿真算例表明,本文提出的基于虚拟排斥力的覆盖控制合作博弈算法,可以实现不完全信息条件下移动多智能体系统的分布覆盖控制任务,有效节约移动智能体的覆盖控制成本;同时,和已有的覆盖控制算法相比,本文提出的动态合作博弈覆盖算法,覆盖控制过程中智能体移动次数更少,覆盖率更高.
关键词 动态博弈; 网络覆盖; 分布算法; 多智能体系统; 虚拟排斥力; dynamic game; network coverage; distributed algorithms; multi-agent systems; virtual repulsive force;
控制
网络化控制系统
论文
Website
Google Scholar
徐广通, 孟子阳, 龙腾, 王祝, 孙景亮
中国科学: 信息科学, 2022, 52(8): 1527-1541
摘要 针对通信距离受限下无人机集群轨迹规划时效性与安全性问题,本文构建了分布式滚动规划框架,提出了局部优先级解耦的序列凸优化方法 (local-priority-decoupled sequential convex programming,LPD-SCP),将集群轨迹规划问题分解为一系列短时域单机凸优化子问题,在保证求解效率的基础上确保了轨迹的安全性.本文推导了确保飞行安全的可行规划时域长度,设计了通信距离受限的局部优先级解耦机制,根据通信状态动态调整邻域内无人机规避优先级,实现通信距离受限下的机间避撞.更进一步,定制了轨迹时间一致协调策略,通过更新飞行时间下边界约束,实现邻域内无人机飞行时间一致性.理论分析了所提LPD-SCP能够通过多次滚动规划获得满足约束的集群轨迹.数值仿真试验结果表明:LPD-SCP能够在通信距离受限条件下规划出满足飞行动力学、机间避碰与时间一致约束的协同轨迹,且15架无人机短时域集结轨迹生成时间不大于4 s.
关键词 集群轨迹规划; 通信距离受限; 滚动规划架构; 局部优先级解耦; 序列凸优化; trajectory planning of swarms; communication distance limitation; receding planning framework; local priority decoupling; sequential convex programming;
控制
网络化控制系统
论文
Website
Google Scholar
徐雍, 饶红霞, 王卓, 鲁仁全, 李宗
中国科学: 信息科学, 2022, 52(8): 1513-1526
摘要 本文研究了离散不确定非线性时滞系统在网络传输不可靠情况下的状态估计问题.针对网络传输丢包问题,采用伯努利(Bernoulli)随机模型,建立了控制信号和输入信号的不可靠传输模型.本文通过状态扩展的方法处理不确定非线性项,得到了扩展状态系统.基于不可靠的控制和测量信息,设计了状态预测器和估计器,并给出相应的误差系统.通过设计最优估计器增益,本文给出了状态预测误差协方差的迭代公式.为了进一步提高状态估计器的精度,设计了一种新型的参数迭代优化方法.针对状态预测误差协方差,本文得到了其稳定性的判别准则.最后,通过一例数值仿真,验证了所得结论的有效性.
关键词 网络化控制系统; 扩展状态估计; 时滞; 不确定非线性; 丢包; networked control system; extended state estimation; time delay; nonlinear uncertainty; packet dropout;
控制
网络化控制系统
论文
Website
Google Scholar
邵晋梁, 石磊, 李彤, 张希琳
中国科学: 信息科学, 2022, 52(8): 1500-1512
摘要 本文提出分布式符号簇一致协议,研究合作竞争网络下的多智能体系统链路故障检测问题.首先,应用符号图理论和非负矩阵理论的相关知识分析智能体在符号簇一致性协议下的渐近收敛性和最终收敛状态.其次,通过观察链路发生故障前后智能体收敛状态的变化,给出精确判断故障链路的方法.该方法同时适用于单链路故障和多链路故障的情形.最后,通过数值模拟验证该方法的有效性.
关键词 多智能体系统; 合作竞争网络; 链路故障检测; 一致性; 分布式协议; multi-agent systems; cooperation-competition networks; link failure detection; consensus; distributed protocol;
控制
网络化控制系统
论文
Website
Google Scholar
严沈, 顾洲, 费树岷, Zhengtao DING
中国科学: 信息科学, 2021, 51(8): 1302-1315
摘要 本文针对一类时滞非线性信息物理系统,研究虚假数据注入攻击下基于记忆型事件触发的安全状态估计问题.不同于现有事件触发机制只考虑系统的瞬时信息,本文提出一种基于历史测量输出的记忆型事件触发机制.该机制可以有效减少输出信号随机波动导致的事件触发机制误触发次数,减少不必要的网络资源浪费.采用一个满足Bernoulli分布的随机变量来描述虚假数据注入攻击的随机过程.构造新的包含Legendre多项式的Lyapunov-Krasovskii泛函,采用Bessel-Legendre不等式技术,给出保证估计误差系统渐近稳定与状态估计器设计的充分条件.最后,通过仿真算例验证所提方法的有效性.
关键词 记忆型事件触发; 信息物理系统; 状态估计; 虚假数据注入攻击; memory-based event-triggering; cyber-physical systems; state estimation; false data injection attacks;
控制
非线性系统与控制
论文
Website
Google Scholar
孙霄阳, 周平
中国科学: 信息科学, 2023, 53(4): 715-736
摘要 PID控制一直是应用最广泛的工业控制技术.但是基本PID控制算法仅考虑了动态系统输入–输出的外部特性,缺乏对系统内部状态信息的运用,因而在控制非线性耦合动态系统时往往难以获得满意的控制性能.本文在不改变原有PID控制设置的基础上,提出一种通过未知状态估计与神经网络控制补偿的增强PID (enhanced PID, En-PID)控制方法,可显著增强原有PID控制的性能.首先,采用扩展卡尔曼(Kalman)滤波技术对未知关键状态进行精确估计,并将状态估计值作为神经网络补偿控制器的输入,从而将基本PID控制算法并未使用的过程状态信息引入到控制输入;其次,采用K均值聚类算法求取历史输入数据的聚类中心,以此作为径向基函数(radial basis function, RBF)神经网络补偿器隐含层的中心向量;构建关于控制误差熵的优化性能指标,采用梯度下降算法对神经网络补偿器输出层权值向量进行优化和修正;最后,将RBF网络求取的补偿控制输入与原有PID控制器的基本控制输入进行综合,并共同作用于实际被控系统,实现高性能控制.理论分析和污水处理过程控制实验验证了所提方法的先进性和实用性.
关键词 增强PID控制; 扩展卡尔曼滤波; 径向基函数神经网络; 控制补偿; 熵; enhanced PID control; extended Kalman filtering; RBF neural network; control compensation; entropy;
控制
非线性系统与控制
论文
Website
Google Scholar
李鸿一, 王琰, 姚得银, 周琪, 鲁仁全
中国科学: 信息科学, 2023, 53(1): 66-80
摘要 针对一类具有外部干扰的多四旋翼无人机姿态系统,研究其在无向拓扑下的姿态跟踪问题,提出一种基于事件触发机制的鲁棒自适应滑模控制方法.首先,建立多四旋翼无人机的姿态动力学模型,并引入干扰观测器,对系统受到的未知外部干扰进行估计.其次,为了节约四旋翼无人机的网络传输资源,本文在传感器和控制器之间引入事件触发机制,并结合鲁棒滑模控制算法,设计基于事件触发的鲁棒自适应滑模控制器.此外,通过Lyapunov稳定性理论证明闭环系统中所有信号最终有界,并证明所设计的事件触发机制能够有效避免Zeno行为.最后,仿真结果验证所提控制方法的有效性.
关键词 滑模控制; 事件触发机制; 干扰观测器; 姿态跟踪; 多四旋翼无人机系统; sliding mode control; event-triggered mechanism; disturbance observer; attitude tracking; MQUAVs;
控制
非线性系统与控制
论文
Website
Google Scholar
范利蓉, 王芳, 周超, 王坤
中国科学: 信息科学, 2022, 52(7): 1287-1301
摘要 本文针对非线性多智能体系统一致性跟踪控制问题,设计自适应事件触发控制策略.首先,通过引入非对称障碍Lyapunov函数,使输出误差满足非对称约束条件.其次,采用Lyapunov-Krasovskii(L-K)泛函和Young不等式消除状态时延的影响.利用模糊逻辑系统逼近未知非线性函数.再次,结合有界估计法和光滑函数有效补偿执行器故障和网络引起的误差.基于Lyapunov稳定性理论证明闭环系统半全局有界稳定.最后,通过仿真验证所设计控制策略的有效性.
关键词 多智能体系统; 状态时延; 事件触发控制; 非对称误差约束; 执行器故障; multi-agent systems; state time-delays; event-triggered control; asymmetric error constraints; actuator faults;
控制
非线性系统与控制
论文
Website
Google Scholar
姚慧颖, 赵志良, 陈森, 柴天佑
中国科学: 信息科学, 2022, 52(3): 483-505
摘要 本文针对一类具有强耦合不确定性因素的连续时间多输入多输出非线性系统,提出了基于历史采样数据的不确定性因素补偿控制策略(sampled-data-based compensation control, SDBCC).与基于观测器的不确定性因素补偿控制不同,本文首先利用当前以及历史采样数据计算出由系统非线性耦合未建模动态和外部扰动构成的总扰动在前一采样周期内某时刻的精确值,然后利用该精确值在反馈环节对总扰动进行补偿以消除它的不利影响.连续时间系统在数据驱动的反馈控制作用下构成了一个混杂闭环控制系统,这连同系统的强耦合非线性不确定性因素为控制闭环系统的稳定性收敛性分析带来了挑战.为克服这一难题,本文发展了基于特征值和迭代序列的分析方法,证明了当系统跟踪目标为有界函数时,跟踪误差可随采样周期的减小而任意小,进而当跟踪目标为常数,并且系统的非线性项为时不变连续可微函数时,跟踪误差随时间趋于无穷大而趋近于零.二自由度无人机姿态控制的仿真结果验证了本文所提出方法的有效性和优越性.
关键词 不确定性; 非线性; MIMO系统; PID控制; 数据驱动控制; uncertainty; nonlinearity; MIMO system; PID control; data-driven control;
控制
非线性系统与控制
论文
Website
Google Scholar
陈龙胜, 杨辉
中国科学: 信息科学, 2021, 51(4): 633-647
摘要 针对一类具有未知干扰和多约束的不确定纯反馈非线性系统,提出一种基于干扰观测器的鲁棒自适应抗干扰控制方案.该方法首先基于Butterworth低通滤波器和径向基神经网络设计非线性干扰观测器以实现对系统未知非线性函数和复合扰动的在线精确逼近,并消除"代数环"问题.其次,为确保系统在状态受限、预设性能和输入饱和等多重约束的综合影响下能够对期望轨迹进行稳定跟踪,构造了一种新型的障碍Lyapunov函数,结合辅助有界函数、Nussbaum函数和一阶滑模微分器设计Backstepping控制器,并通过Lyapunov稳定理论分析闭环系统稳定性.最后,仿真结果验证了所提控制方法的有效性.
关键词 径向基神经网络; 非线性干扰观测器; 障碍Lyapunov函数; 多约束; 纯反馈非线性系统; radial basis function neural network; nonlinear disturbance observers; barrier Lyapunov function; multiple constraints; pure feedback nonlinear systems;
控制
非线性系统与控制
论文
Website
Google Scholar
周琪, 林国怀, 马慧, 鲁仁全
中国科学: 信息科学, 2021, 51(4): 618-632
摘要 针对一类具有传感器故障和不对称输入死区的非线性多输入多输出非严格反馈系统,本文提出一种自适应神经网络容错控制方案.控制器的设计以反步法为框架,采用自适应神经网络控制方法处理传感器故障,利用死区斜率的有界性补偿输入死区对系统性能造成的影响,同时引入动态面控制技术克服"计算爆炸"的问题.该控制方法不仅能够保证闭环系统中所有信号半全局一致最终有界,而且能使跟踪误差收敛至原点附近的紧集内.最后通过两个仿真实验验证该控制方法的有效性.
关键词 非线性系统; 传感器故障; 容错控制; 动态面控制; 输入死区; nonlinear systems; sensor faults; fault-tolerant control; dynamic surface control; dead zone inputs;
控制
非线性系统与控制
论文
Website
Google Scholar
刘东, 万雄波, 王亚午, 赖旭芝, 吴敏
中国科学: 信息科学, 2020, 50(5): 718-733
摘要 针对第三关节为被动的平面四连杆(active-active-passive-active,简称AAPA)欠驱动机械臂的位姿控制问题,提出一种基于模型降阶与链式结构的控制策略.整个控制过程被划分为3个阶段.第1阶段,通过控制第四连杆的角度至零,将平面AAPA机械臂降阶为平面虚拟四连杆(active-activepassive,简称AAP)欠驱动机械臂.第2阶段,首先将平面虚拟AAP机械臂的模型转换为标准链式结构形式.然后,设计相应的控制器将平面虚拟AAP机械臂的被动关节控制至其目标位置,同时,将被动连杆的姿态角控制至中间姿态角,从而将平面AAPA机械臂进一步降阶为平面Acrobot.第3阶段,控制平面Acrobot驱动连杆的角度至其目标角度,连带实现对被动连杆的角度控制,最终实现平面AAPA机械臂的位姿控制目标.考虑到平面Acrobot存在角度约束,因此,利用遗传算法协调与优化被动关节的目标位置、被动连杆的中间姿态角、第四连杆的目标角度与被动连杆的目标姿态角,确保平面Acrobot对于系统目标位姿的目标角度解存在.最后,通过仿真验证控制策略的有效性.
关键词 平面四连杆欠驱动机械臂; 位姿控制; 模型降阶; 链式结构; 遗传算法; planar four-link underactuated manipulator; position-posture control; model reduction; chained structure; genetic algorithm;
控制
非线性系统与控制
论文
Website
Google Scholar
周琪, 陈广登, 鲁仁全, 白伟伟
中国科学: 信息科学, 2019, 49(11): 1502-1516
摘要 针对一类具有未知干扰与输入饱和的严格反馈多智能体系统,研究其在有向拓扑下的领导跟随一致性问题,提出一种基于干扰观测器的分布式事件触发控制方法.该方法首先设计干扰观测器估计未知干扰,进而结合动态面控制与自适应反步法设计控制输入.其次,采用相关阈值事件触发控制策略解决通信资源有限的问题,并引入饱和补偿系统补偿控制器信号与执行器信号的不匹配.然后,通过Lyapunov稳定性定理证明闭环系统内所有信号是半全局一致最终有界的.最后,仿真结果验证提出控制方法的有效性.
关键词 多智能体系统; 干扰观测器; 输入饱和; 事件触发控制; 动态面控制; multi-agent systems; disturbance observer; input saturation; event-triggered control; dynamic surface control;
控制
非线性系统与控制
论文
Website
Google Scholar
朱礼营, 邱剑彬
中国科学: 信息科学, 2019, 49(8): 1031-1049
摘要 本文研究多平衡点二维切换线性时不变(LTI)系统极点配置问题.对每一子系统都含有唯一平衡点情形,首先给出了该类多平衡点切换系统可任意切换路径极点配置的一个充要条件.然后,用一个数值算例表明:即使将二维闭环切换LTI系统的所有子系统的全部极点都配置到左复半平面内的两个相同位置,也不能保证该类切换系统在任意切换路径下都稳定.其次,对所有子系统具有单(唯一共同)平衡点和多平衡点情形,分别给出该类切换系统可任意切换路径和任意拟周期/周期切换路径镇定极点配置的若干充分性判据,并据此设计了相应算法.所得结果揭示:用极点配置法来镇定切换LTI系统,可以将部分或全部子系统的全部或部分极点配置到右复半平面内的合适位置.最后,一个数值仿真算例表明所得新结果的有效性和可操作性.
关键词 切换系统; 线性子系统; 状态反馈; 镇定控制; 多平衡点; 极点配置; 算法; switching systems; linear subsystems; state feedback; stabilization control; multiple equilibria; pole assignment; algorithms;
控制
机器人与无人系统
论文
Website
Google Scholar
肖宏远, 刘成菊, 陈启军
中国科学: 信息科学, 2022, 52(10): 1822-1836
摘要 示教学习是解决仿人机器人动态轨迹规划问题的高效方法.示教轨迹作为一种函数型数据,天然地具有耦合的时空特征,需要在函数型数据分析的理论框架下进行研究.传统的示教学习成果以“预处理”的形式解决上述耦合问题,不能充分利用示教轨迹的函数型数据本质.为了充分利用这一本质,本文采用弹性分析方法,将示教轨迹视作函数型数据,解决它们的时–空特征解耦问题.基于解耦后的示教轨迹,本文建立函数型回归模型并将其应用于动态轨迹的生成,实现示教轨迹在不同任务参数下的泛化.在实验中, JACO-2机械臂学习形态各异的技能并在不同的任务参数下完成任务,验证了提出方法的有效性.本文在统一的数学框架下,基于函数型数据分析的数学方法,解决一类仿人机器人的示教轨迹学习与泛化问题,具有较好的理论统一性与可实践性.
关键词 示教学习; 轨迹生成; 函数型数据; 弹性分析; 函数回归模型; learning from demonstration; trajectory generation; functional data; elastic analysis; functional regression model;
控制
机器人与无人系统
论文
Website
Google Scholar
孙永斌, 马宝忠, 贺威, 何修宇, 付强
中国科学: 信息科学, 2022, 52(9): 1656-1671
摘要 仿生扑翼飞行器作为一种新型的飞行器,具有噪声小、隐蔽性好、机动性强、能量利用效率高等优势,在民用和军用领域具有广阔的应用前景.仿生扑翼飞行器的自主飞行能力是高效执行飞行任务的关键.目前,国内外飞行器的自主飞行研究已经取得了一些成果,然而鲜有以仿生扑翼飞行器为载体的研究.仿生扑翼飞行器特有的驱动结构给自主飞行控制研究带来了较大的挑战.本文以仿猎鹰扑翼飞行器作为研究平台设计了自主飞行控制系统.由于仿猎鹰扑翼飞行器的负载较小,本文采用了重量较轻的STM32微型计算平台作为主控芯片设计了硬件系统.由于微型计算平台的算力有限,本文综合考虑制导精度和运算速度,提出了一种线性/非线性切换制导算法,并通过仿真实验与线性制导、非线性制导算法进行了对比,证明了其更加适合于仿猎鹰扑翼飞行器.考虑到仿猎鹰扑翼飞行器的机构滞后问题,对其滚转角和高度设计了一个串级PID控制器.结合面向仿猎鹰扑翼飞行器的地面站软件,最终实现了基于仿猎鹰扑翼飞行器的自主定高圆弧轨迹跟踪任务.
关键词 仿生扑翼飞行器; 自主飞行; 线性制导; 非线性制导; 轨迹跟踪; bionic flapping-wing aircraft; autonomous flight; linear guidance; nonlinear guidance; trajectory tracking;
控制
机器人与无人系统
论文
Website
Google Scholar
李鸿一, 陈锦涛, 任鸿儒, 鲁仁全
中国科学: 信息科学, 2022, 52(9): 1610-1626
摘要 本文面向高层消防救援提出一种基于随机采样的多无人机协同搜索规划方法.首先,受随机树状采样搜索算法启发,提出一种搜索点最优分布方法,利用其在复杂环境下对有限空间重复搜索的特性,同时解决多无人机的路径点分布问题和任务分配问题.其次,设计一种基于交易规则的搜索点优化方法,以进一步提升搜索覆盖范围.然后,利用改进的和声搜索算法得到每架无人机遍历节点的最优顺序,进而获得各无人机的规划路径.最后,采用多线程方法模拟实际任务中的分布式运算,验证所提出方法的可行性.
关键词 高层消防; 随机采样; 和声搜索算法; 多无人机协同; 路径规划; high-rise firefighting; random sampling; harmony search; multi-UAV cooperation; path planning;
控制
机器人与无人系统
论文
Website
Google Scholar
刘卓清, 孙宁, 吴易鸣, 杨桐, 梁潇, 方勇纯
中国科学: 信息科学, 2022, 52(3): 521-538
摘要 为了提高塔式吊车的实际工作效率,往往需要在驱动旋臂和台车的同时改变绳长,以同步实现负载的运输与起落吊运.然而,目前针对变绳长塔式吊车控制问题的研究非常有限,依然处于起步阶段.对于变绳长塔式吊车而言,如何在保证系统良好暂态性能的基础上,减少运输时间、降低系统能耗,并同时实现综合最优是一个亟待解决的实际问题.为此,本文提出了一种考虑状态约束的五自由度塔式吊车多目标最优轨迹规划方法,首次实现了运输时间和系统能耗的Pareto最优,并可从理论上保证状态变量及其对应速度满足物理约束.具体而言,本文通过微分平坦输出信号构造和B样条曲线设计,实现了目标轨迹的定位和防摆性能,并利用改进的非支配近邻免疫算法(nondominated neighbor immune algorithm, NNIA)解决了多目标优化问题.最后,通过多组实际实验验证了所提方法的有效性.
关键词 塔式吊车; 欠驱动系统; 多目标优化; 轨迹规划; 摆动抑制; tower cranes; underactuated systems; multi-objective optimization; trajectory planning; swing suppression;