Vol. 51, No. 9, 2021 封面 目录

摘要

物体分割技术是计算机视觉中的研究热点,在多个领域都有广泛的应用.本文从人类视觉系统对场景中的全局信息和局部细节非常敏感的角度出发,设计了一种新颖、高效且易于计算的增强匹配标准(E_ξ)来评估物体分割模型的性能. E_ξ将局部像素值与全局平均值有机结合,以便评估分割结果与标准结果在图像级和像素级的相似度.在国际主流的4个公开数据集上的大量实验表明, E_ξ在多个方面,如应用关联度、随机偏好度、噪声偏好度、感知度上相比现有广泛采纳的评价标准(IoU和F_β)均有大幅相对提升.通过利用加权二值交叉熵损失函数、本文的增强匹配损失函数以及加权交并比损失函数,本文进一步设计了一套组合损失函数(Hybrid-E_(loss))来促进网络学习到像素级、对象级和图像级的分割特征.定性和定量的结果表明,在3个不同领域的分割任务中使用这一组合损失函数能够进一步提高物体分割的精度.

关键词

物体分割技术; 评价标准; 视觉感知; 增强匹配标准; 损失函数; object segmentation; metric; cognitive vision; enhanced-alignment measure; loss function;

论文

可视身份深度伪造与检测

Deep visual identity forgery and detection

Website Google Scholar
彭春蕾, 高新波, 王楠楠, 李洁
中国科学: 信息科学, 2021, 51(9): 1451-1474

摘要

随着深度学习技术在视频和图像生成领域的广泛应用,视频和图像中的可视身份伪造,特别是人脸伪造结果的逼真程度越来越高,对于身份伪造数据的检测在国家安全和社会稳定等方面均具有重要的研究和应用价值,近年来已成为研究的热点问题.本文从有目标身份伪造和无目标身份伪造两个方面归纳和介绍了可视身份深度伪造的研究方法,并从基于空域线索、时域线索的面向已知伪造类型检测方法、面向未知伪造类型的泛化能力研究,以及面向对抗样本攻击的可信伪造检测研究等多个方面阐述了伪造检测的关键技术,并在总结现有数据集和代表性算法的性能分析基础上,进一步讨论了可视身份深度伪造与检测的关键问题和面临的挑战.

关键词

深度伪造; 人脸替换; 人脸编辑; 表情重演; 人脸生成; 伪造检测; deepfake; face swap; face manipulation; expression reenactment; face generation; forgery detection;

摘要

随着全球云计算产业规模的迅速增长,采用按需付费的方式,基于云服务组合实现大规模软件服务的动态集成和协同,从而构造复杂软件,已成为一种切实可行的方法.所构建的组合云系统运行在动态、不确定的环境下,如何应对系统运行可靠性数据流的概念漂移问题,保障系统运行质量,是一个亟待解决的挑战性问题.为给针对组合云系统的可靠性自适应提供早期指导,本文基于主动式缺陷管理思想,研究组合云系统运行风险的在线感知方法,提出基于Sinkhorn距离的可靠性概念漂移在线度量方法 RCDMeas.这一方法通过引入熵正则化和不动点迭代,计算系统历史累积的可靠性流数据和临近的可靠性流数据的分布距离,从而识别组合云系统可靠性概念漂移及系统潜在运行风险.大规模数据实验结果验证了本文方法的有效性.本文的工作对服务组合系统的自动化运维具有重要的理论意义与实际应用价值.

关键词

组合云系统; 可靠性; 概念漂移; 在线; 运行质量保障; composite cloud systems; reliability; concept drift; online; execution quality assurance;

摘要

随着深度神经网络在机器学习的各个领域获得广泛成功,其自身所存在的问题也日益尖锐和突出,例如可解释性差、鲁棒性弱和模型训练难度大等.这些问题严重影响了神经网络模型的安全性和易用性.因此,神经网络的可解释性受到了大量的关注,而利用模型可解释性改进和优化模型的性能也成为研究热点之一.在本文中,我们通过几何中流形的观点来理解深度神经网络的可解释性,在通过流形视角分析神经网络所遇到的问题的同时,汇总了数种有效的改进和优化策略并对其加以解释.最后,本文对深度神经网络流形解释目前存在的挑战加以分析,提出将来可能的发展方向,并对今后的工作进行了展望.

关键词

深度学习; 对抗攻击; 可解释性; 流形; deep learning; adversarial attack; interpretability; manifold;

Vol. 51, No. 8, 2021 封面 目录

论文

基于格的口令散列方案

Achieving password-hashing scheme over lattices

Website Google Scholar
李增鹏, 汪定
中国科学: 信息科学, 2021, 51(8): 1375-1390

摘要

在可预见的未来,口令仍将是最主要的身份认证方法.口令认证密钥交换协议(password authenticated key exchange, PAKE)是口令认证的重要组成部分,它允许通信双方在不安全的通话信道上建立一个安全的会话密钥.为了缓解服务器被入侵后对存储在服务器上口令的影响,将口令散列之后再存储被广泛推荐,例如使用传统的口令散列函数,如PBKDF2, Bcrypt,和Scrypt.然而,这些口令散列函数依赖复杂的数学问题,安全性证明建立在随机预言机模型(random oracle model,ROM)之上,且需要较大内存支持.为解决上述问题,基于离散对数假设的口令散列方案陆续被提出,如Benhamouda-Pointceva方案(IACR ePrint2013/833)、Kiefer-Manulis方案(ESORICS’14)、Pointcheval-Wang方案(ASIACCS’17)与平滑投影散列函数(smooth projective hash function, SPHF)集成,但这些方案无法实现后量子安全且仍依赖于ROM模型.因此,本文着重研究如何在标准模型下设计后量子安全的口令散列方案,并给出可证明安全性分析.尽管所提方案尚不能应用于实际,但为构造实际的后量子安全的口令认证及密钥交换协议奠定了基础.

关键词

抗量子; 口令认证密钥交换; 口令散列方案; 平滑投影散列函数; 基于格的密码学; quantum resistant; password authenticated key exchange; password hashing scheme; smooth projective hash function; lattice-based cryptography;

摘要

在计算机视觉中,群体分析越来越受到人们的关注,对图像中复杂人群进行分组是群体分析领域的基础技术需求.现有的人群社交分组方法只针对固定人数的小范围场景,不能处理真实世界中的大场景图像.本文提出首个面向十亿像素大场景图像的基于深度学习的细粒度人群社交分组框架,由一种图引导的全局到局部的划分策略与一个学习隐函数表示社交对交互模式的深度社交分组网络组成.该框架可在大范围场景图像上实现准确的人群分组.本文方法同样适用于小场景图像,在小场景图像数据集上的实验结果表明,本文提出的框架相比于现有方法取得了显著的性能提升.相关代码与训练数据即将开源.

关键词

群体; 大场景图像; 深度学习; 社交分组; 图引导; group; large-scene image; deep learning; social grouping; graph-guided;

摘要

曲面拟合是最有效的图像放大方法之一,其关键是构造对图像拟合的曲面.图像细节和边缘等特征对图像的视觉效果起着关键作用,因此,构造拟合曲面的关键之一是保持图像细节和边缘.基于样条和多项式方法构造的拟合曲面不能有效地保持图像的边缘信息,从而使放大图像在边缘处锯齿状明显.本文提出了以边缘和距离为特征约束的图像放大新算法.算法以边缘和距离为约束,在每个像素的邻近区域上构造一张对邻域上像素点拟合的二次多项式曲面片,并在每个四边形网格上构造一张二次多项式中间曲面片.在每个四边形网格上由五张曲面片加权平均生成有理多项式曲面片.该曲面片具有二次多项式逼近精度,产生的图像具有较好的视觉效果.通过构造误差曲面片对二次多项式曲面片进行修正,提高了放大图像的精度和视觉效果.新算法把二次多项式的常数项、一次和二次项采用不同方法分别计算,为构造带约束的多项式函数提供了新技术.实验结果表明,相比于其他算法,本文算法不仅有较高的逼近精度,而且放大图像的视觉效果也较好.

关键词

二次多项式; 边缘和距离约束; 逼近曲面; 逼近精度; 图像放大; quadratic polynomial; edge and distance constraints; approximation surface; approximation accuracy; image magnification;

摘要

圆弧样条普遍用于数控机床的刀具轨迹设计中,希望用尽可能少的圆弧段逼近曲线.现有方法大多是启发式的,圆弧样条曲率的分段常值性质还没有引起足够的重视.本文基于这个内在的稀疏性质,提出基于稀疏表示的G~1圆弧样条自动逼近方法,主要分两步:稀疏优化问题自动检测圆弧间连接点的全局初始化和重新调整连接点位置保证G~1连续性的局部修正.实验结果显示新方法对对称性比较敏感,部分尖锐特征、自交数据也可以逼近得很好,充分说明了新方法的优越性.

关键词

圆弧样条; 稀疏表示; 逼近; G~1连续; arc spline; sparse representation; approximation; G~1 continuity;

论文

方舱计算

Cabin computing

Website Google Scholar
蒋昌俊, 丁志军, 喻剑, 章昭辉, 闫春钢, 张亚英, 王鹏伟
中国科学: 信息科学, 2021, 51(8): 1233-1254

摘要

随着信息技术创新日新月异,数字化、网络化、智能化深入发展,新应用层出不穷、新业态蓬勃发展,对业务系统的敏捷构造和持续运维提出了更高的要求.为此,本文提出了一种新的计算模式:方舱计算.所谓方舱计算,是通过网络访问的,面向IT任务全生命周期的跨域资源配置和协同的计算集成环境.其核心是"方舱专用机动、资源跨域伸缩、系统运维自治".本文给出了方舱计算系统结构及其工作原理,方舱计算系统主要由方舱生成与管理系统、跨域资源管理系统、虚拟数据中心系统和若干网关(方舱网关、虚拟数据中心网关、跨域资源网关等)组成.进而,给出了适于方舱计算的资源分配最优化问题定义,在兼顾数据资源、计算资源和存储资源等的基础上,实现最小化资源成本.通过规划求解器与近似优化算法仿真实验,表明本文的方法能够兼顾数据资源和物理资源的分布,实现方舱资源的优化配置.

关键词

方舱; 虚拟数据中心; 跨域资源管理; 资源分配; 资源分布图; 资源目录; cabin; virtual data center; cross-domain resource management; resource allocation; resource distribution map; resource directory;

摘要

近年来,随着深度学习技术的广泛应用,人机对话研究取得了突破性进展.但是,目前的人机对话系统大多是在人机双方参与的假设下进行设计的,而更具挑战性的人机多方对话的研究和应用尚不成熟.本文将立足于自然语言处理领域,对近几年基于深度学习的多方对话研究进展进行综述.首先从人机对话角度出发,整理多方对话系统的关键问题和已有解决方案;然后,梳理基于多方对话的其他自然语言处理任务;之后,总结已有多方对话研究的数据集,并分析现有数据集的局限性和改进方案;最后,展望多方对话研究的未来发展趋势.

关键词

自然语言处理; 深度学习; 人机对话; 多方对话; natural language processing; deep learning; human-machine dialogue; multi-party dialogue;

Vol. 51, No. 7, 2021 封面 目录

摘要

移动设备的普及带来了移动应用程序市场的蓬勃发展,各类服务提供商通过移动应用程序的权限大量收集用户数据,而数据收集过程往往不为用户所知,因此给用户带来极大的隐私风险.对移动应用程序进行隐私风险评估,不仅有助于规范第三方移动应用市场,而且可帮助用户规避潜在的隐私风险,而如何评估移动应用程序可能带来的最大隐私风险则是当前面临的重大挑战.本文通过研究移动应用程序最大化的数据泄露场景,基于权限请求特征和权限分析原则构建隐私风险最大值量化模型.该模型基于权限敏感度、权限类别异常度、权限使用率和权限调用者数量4个参数,对移动应用程序的潜在隐私风险进行评估.在隐私风险量化和恶意应用检测中,对比当前同类型方法,该模型在真实数据集上效果均较优,说明模型的有效性.实验结果进一步表明,该模型可用于改善现有第三方移动应用市场的隐私风险预警机制,进而保护移动用户的隐私.

关键词

隐私保护, 移动应用程序, 隐私风险量化, 权限分析方法

论文

互联网图像驱动的语义分割自主学习

Autonomous learning of semantic segmentation from Internet images

Website Google Scholar
侯淇彬, 韩凌昊, 刘姜江, 程明明
中国科学: 信息科学, 2021, 51(7): 1084-1099

摘要

针对目标任务收集新类别的海量标注数据通常需要大量时间和人力成本,并已成为语义分割技术投入实际产业应用过程的主要瓶颈.本文旨在以"网络监督"的方式,在仅利用用户提供的目标类别关键词以及相应自动搜索到的网络数据的条件下实现语义分割模型的自主学习.该任务的核心挑战在于网络爬取的图像中存在一定量的类别噪声,从而影响自主学习的可靠性.为了解决类别噪声问题,本文设计了一种新颖的噪声擦除模型.该模型通过每次从小批次样本的置信注意力区域中以跨样本的方式学习语义信息来擦除训练图像中与搜索关键词无关的区域.基于该模型,本文同时提出了一种能够用于训练语义分割模型的高质量伪标注生成方法.在国际主流的公开数据集(PASCAL VOC2012)上的大量实验表明,基于该方法的语义分割模型在利用网络监督与弱监督的条件下均取得了良好结果 (mIoU=62.0%以及66.1%).

关键词

语义分割, 网络搜索, 类别噪声, 噪声擦除网络, 网络监督

论文

复杂担保网络中传染路径的风险评估

Risk assessment for contagion path in complex loan network

Website Google Scholar
程大伟, 牛志彬, 刘新海, 张丽清
中国科学: 信息科学, 2021, 51(7): 1068-1083

摘要

中小企业贷款在促进技术创新、推动经济发展、改善民生和增加就业等方面有着重要的作用.为了满足商业银行的贷款评估标准,很多中小企业选择互相提供担保以获得授信,形成了结构复杂的担保网络.当借款方的贷款违约时,风险则沿着担保方向在网络中层层传播,由此造成的潜在系统性风险给国家的金融安全和监管带来了严峻的挑战.因此,迫切需要发展相应的方法从系统角度对复杂金融担保网络中的传染路径进行风险评估和预测.本文提出了一种基于深度学习的风险评估模型,该方法应用图神经网络和注意力机制直接从网络化的贷款行为数据中学习风险特征,无需依赖于金融领域专业知识的人工特征工程.实验结果表明,本文设计的方法在多数评价指标上均优于现有的7个对比的基准模型.在传染路径风险评估任务中,比基准方法在精确率和召回率的调和平均数(F1-score)方面平均提升了2%~15%.在新路径风险评估任务中,比最好的基准方法平均提升了3.5%.结果表明了本文设计方法在传染路径风险评估中的有效性,可为监管部门和金融机构对担保网络进行系统性风险评估提供方法理论基础.

关键词

风险评估, 传染路径, 担保网络, 图神经网络, 注意力机制

摘要

近年来随着图形硬件的快速发展,渲染技术和深度学习技术都飞速发展,可微渲染作为二者之间的桥梁受到了广泛关注.随着许多可微渲染方法的提出,逆渲染等借助可微渲染工具的应用也随之蓬勃发展.本文从传统渲染管线开始介绍,逐步引入可微渲染的主要思想、基本原理和方法,对它们进行介绍、分析和比较.并介绍基于路径跟踪的可微渲染,随后列出开源的可微渲染工具供大家参考并进行比较.本文后半部分介绍可微渲染的广泛应用,分为人脸、人体、人手和物体4个方面.最后列举了一些可微渲染可能的发展方向.

关键词

可微渲染, 逆渲染, 三维重建, 人脸重建, 渲染

Vol. 51, No. 6, 2021 封面 目录

摘要

高分辨率的磁共振图像可以提供细粒度的解剖信息,但是获取数据需要较长的扫描时间.本文提出了一种基于自注意力机制生成对抗网络的超分辨率磁共振图像重构方法 (SA-SR-GAN),利用生成对抗网络从低分辨率磁共振图像生成高分辨率磁共振图像,将自注意力机制集成到超分辨率生成对抗网络框架中,用于计算输入特征的权重参数,同时引入了谱归一化处理,使判别器网络训练过程更加稳定.本文使用40组3D磁共振图像(每组图像包含256个切片)训练网络,并用10组图像进行测试.实验结果表明,所提出的超分辨率自注意力生成对抗网络方法生成的超分辨率的磁共振图像的PSNR和SSIM值高于同类比较方法.

关键词

磁共振图像, 超分辨率, 生成对抗网络, 自注意力, 谱归一化

摘要

脊髓电刺激作为一种有效的意识促醒手段已经在临床上得到了较为广泛的应用,但是其内在机制仍不完全明确.本文将正常人静息态脑电作为对照组,利用样本熵对微意识状态患者的脊髓电刺激前后的脑电信号进行计算,并分析了基于互样本熵构造的脑网络在刺激前后的变化.结果表明,脊髓电刺激提高了微意识状态患者额叶和中央区内的脑电信号复杂度;还提高了患者在额叶内、中央区内以及额叶与其他脑区间的高频段(α~γ, 8~45 Hz)的耦合模式复杂度,表明通道间信息交互作用的显著增强;同时,患者高频段脑网络平均聚类系数增加,平均特征路径长度减少,小世界特性显著提升(在α,β,和γ均为p <0.001).相对于健康对照组,这些指标变化的方向趋向于正常人静息态的脑功能.样本熵和互样本熵在脊髓电刺激后与健康对照组在某些脑区内或脑区间上无显著差异(比如,β和γ频段的样本熵值在额叶和中央区(p> 0.05)),但是高频段的脑网络参数仍有显著差异(比如,高频段小世界网络特征p <0.001).因此,我们认为这些变化是脊髓电刺激对大脑产生了一个"短时程效应".我们推测脊髓电刺激对脑功能的重塑有一定的促进作用.本研究对脊髓电刺激的内在机理提供了新的解释,同时也为微意识状态患者的脑功能评估提供了新的思路.

关键词

微意识状态, 脑电, 脊髓电刺激, 互样本熵, 脑网络

摘要

环状RNA (circluar RNA, circRNA)在基因表达、剪切和转录的过程中扮演着重要角色.越来越多的证据表明, circRNA与疾病的产生与发展存在着重要的联系.本文提出了一种基于多数据融合的非负矩阵分解算法(EDNMF)预测circRNA–疾病关联关系.该方法首先对circRNA–疾病关联关系进行预处理,解决了circRNA–疾病关联关系过少对算法产生的负面影响的问题.然后, EDNMF算法将circRNA表达谱和癌症相似性数据转化为约束条件,基于预处理后的circRNA–疾病关联关系采用改进的非负矩阵分解算法得到最终的打分值,从而预测circRNA–疾病关联关系.五折和十折交叉验证结果表明, EDNMF算法相比其他算法能更有效地预测circRNA–疾病关联关系.此外,采用EDNMF算法预测新的circRNA–结肠直肠癌关联关系打分排名前10的结果中,大部分结果已经得到了佐证,表明了该算法可以有效地预测未知的circRNA–疾病关联关系.

关键词

circRNA, circRNA 表达谱, circRNA-疾病关联关系, 非负矩阵分解, 疾病相似性

论文

EL-Picker: 基于集成学习的余震P波初动实时拾取方法

El-Picker: a machine learning-enhanced robust P-phase picker for real-time seismic monitoring

Website Google Scholar
申大忠, 张琦, 徐童, 祝恒书, 赵雯佳, 殷子凯, 周培伦, 房立华, 陈恩红, 熊辉
中国科学: 信息科学, 2021, 51(6): 912-926

摘要

在实时地震监测中,地震P波(primary wave)的初动拾取任务具有至关重要的作用,其有助于地震应急响应的及时实施.虽然此前在该领域已开展了大量的研究,但是如何从地震分布密集并且充满噪声的监测波形中有效地识别出P波仍然是一个具有挑战性的任务.例如对于大地震的余震监测,实践中使用的普遍方法仍依赖于专家辅助标注.本文针对地震实时监测任务,基于集成学习策略,提出一个全新的技术框架——EL-Picker,实现从连续地震波形中自主拾取P波的初动到时.具体而言,EL-Picker包含3个模块,即触发器、分类器和精化器.其中,分类器模块借鉴集成学习策略,实现对多个个体学习器的整合,提升整体模型性能.基于汶川Ms8.0地震的余震数据集进行的大量实验,我们发现EL-Picker不仅较好地实现P波初动拾取效果,并且多诊断出120%被人工遗漏的地震P波.同时,实验结果也启发我们探索如何针对不同的地震站台选取个性化的个体学习器构建分类器模块.此外,我们进一步地讨论了被人工遗漏的地震波形的规律特点,用于指导人工地震标注.这些发现清晰地验证了EL-Picker框架的鲁棒性、时效性、灵活性以及稳定性.

关键词

P波拾取, 机器学习, 集成学习, 汶川余震, 实时地震监测

摘要

联邦机器学习系统由于能够在多方之间训练联合模型而无需各方共享训练数据,因此在学术界和工业界都获得了越来越多的关注和应用.与传统的机器学习框架相比,这类系统被认为具有保护数据隐私的良好潜力.另一方面,训练阶段攻击是一种通过故意扰动训练数据,从而希望在测试时操纵相应的学习系统预测行为的攻击方法.例如, DeepConfuse是最近的一种高效生成对抗训练数据的方法,展示了传统监督学习范式在此类攻击下的脆弱性.在本文中,作者扩展了DeepConfuse方法,将其应用在联邦机器学习框架中.这是首次针对联邦学习系统的训练阶段攻击.实验结果表明,在δ–准确率损失的衡量标准下,相比于传统的机器学习框架,联邦学习系统在DeepConfuse攻击下更加脆弱.

关键词

联邦学习, 学件, 表示学习

评述

非易失主存的系统软件研究进展

Development of system software on non-volatile main memory

Website Google Scholar
舒继武, 陈游旻, 胡庆达, 陆游游
中国科学: 信息科学, 2021, 51(6): 869-899

摘要

互联网和物联网规模的迅速扩张促使全球数据存储总量呈现爆炸式的增长,导致数据系统从计算密集型向数据密集型方向发展.如何构建可靠高效的数据存储系统,成为大数据时代迫切需要解决的问题.相比传统磁盘,非易失主存具有性能高以及字节寻址等优点,这些独特的优势为高效存储系统的构建提供了新的机遇.然而,传统存储系统的构建方式不适用于非易失主存,无法发挥出非易失主存的性能优势,并且容易造成一致性开销高、空间利用率低、编程安全性低等问题.为此,本文分析了基于非易失主存构建存储系统面临的挑战,在系统软件层次分别综述了空间管理机制、新型编程模型、数据结构、文件系统和分布式存储系统等方面的研究进展,并展望了基于非易失主存构建存储系统的未来研究方向.

关键词

非易失主存, 系统软件, 空间管理机制, 编程模型, 数据结构, 文件系统, 分布式系统

Vol. 51, No. 5, 2021 封面 目录

刊讯

人工智能中的约束求解和优化专题简介

Website Google Scholar
蔡少伟, Fred W. GLOVER, 殷明浩, 高健
中国科学: 信息科学, 2021, 51(5): 867-868

关键词

约束求解; 人工智能; 优化算法;

摘要

针对五次间接PH曲线的判别问题,本文结合高斯消元法与几何方法给出Bézier控制多边形满足的充分必要条件.间接PH曲线通过一个二次有理参数变换后,其等距线是有理形式的.间接PH曲线的代数充分必要条件本质是其一阶导数的因式分解满足特定条件,是一种积的形式.考虑到Bézier曲线的表示是Bernstein多项式形式,是一种和的形式.通过这两种形式的相容性引出待求解的非线性方程组并讨论求解问题,最后将所得结果应用在控制多边形上,得到五次间接PH曲线的几何特征.

关键词

Bézier曲线; 等距曲线; 几何特征; 有理参数化; Bézier curves; offsets; geometric characteristic; rational parameterization;

论文

面向光流估计的高效加速器架构设计

Efficient accelerator architecture for optical flow estimation

Website Google Scholar
刘博生, 陈晓明, 韩银和, 常亮
中国科学: 信息科学, 2021, 51(5): 795-807

摘要

光流(optical flow)为同一对象在视频中运动到下一帧的移动量.从视频中估计光流已广泛应用于各类移动智能系统,如运动估计和机器人导航.最近的研究表明,卷积神经网络(convolutional neural network, CNN)能提供可靠的光流估计结果.然而,现有的硬件加速器无法支持面向光流估计的CNN复杂计算.具体而言,这些类型的CNN不仅包括常规的卷积(convolution)和反卷积(deconvolution)运算,还包括双线性插值(bilinear interpolation)和/或关联(correlation)运算.双线性插值和关联操作主要探索两个连续图像帧之间的关联关系.为解决这一问题,本项工作提出面向光流的CNN硬件加速设计方案(称为Swan-AOE),即通过支持卷积、反卷积、双线性插值和关联操作解决这类神经网络的硬件加速计算问题. Swan-AOE包括可配置的硬件计算架构和自适应的调度策略,通过提供灵活的并行调度实现最优化吞吐量计算.此外, Swan-AOE还进行设计空间探索,探索可用片上缓存资源在提高能耗–面积效率的潜在能力.实验结果表明,与基准加速器相比,所提出的设计能有效提升性能、能效和面积效率.

关键词

加速器; 光流估计; 能效; 卷积神经网络; accelerator; optical flow estimation; energy efficiency; convolutional neural networks;

摘要

社交网络蕴含着丰富的多媒体信息,如何实现社交网络跨媒体信息的搜索已成为研究热点.基于深度学习的单一模态语义特征提取和学习在社交网络信息搜索上取得了较好的效果.在跨模态信息搜索时不同模态的数据特征不能直接比较,因此不同模态之间的语义鸿沟是亟待解决的关键问题.针对上述问题,本文提出了一种基于对抗学习和语义相似度的跨媒体搜索方法,实现了文本和图像之间的相互匹配、排序和搜索.该方法使用对抗学习方法框架构建训练特征映射网络和模态判别网络,其中特征映射网络使用多维语义分布向量将不同模态的数据映射到同一语义空间中,使得相同语义下的不同模态数据在该空间距离小,不同语义下相同模态数据距离大.使用语义分布及相似度作为特征映射网训练依据,模态判别网络负责判定空间中不同数据的模态.基于对抗学习交替训练两个网络,使得特征映射网络得到的数据和原数据语义一致,并消除模态特性,最终在同一空间内使用相似度来排序并得到搜索结果.实验结果表明本文提出的方法在文本和图像的相互搜索的map值比同类方法高,并验证了该方法在社交网络安全话题数据上的有效性.

关键词

跨媒体搜索; 对抗学习; 语义相似度; 社交网络; 搜索排序; cross-media retrieval; adversarial learning; semantic similarity; social network; search and rank;

论文

稀疏连接的异步池计算网络

Sparsely connected asynchronous reservoir computing network

Website Google Scholar
薄迎春, 张欣, 刘宝, 王平
中国科学: 信息科学, 2021, 51(5): 764-778

摘要

针对池计算网络的构建问题,提出了一种稀疏连接的异步神经元池构造方法,该方法将多个子神经元池顺序连接,并在子神经元池之间设置滞后环节,以实现各子神经元池对输入信息的异步处理,进而构成串行的记忆.为实现信息高效传输,子神经元池之间采用稀疏的连接方式.实验表明,所提方法能够有效地提高神经元池的记忆容量,易于解决长时依赖问题.此外,该结构能够使神经元池产生丰富的动力学行为,对初始参数也有较好的鲁棒性.

关键词

人工神经网络; 池计算; 记忆; 鲁棒性; 动力学; artificial neural network; reservoir computing; memory; robustness; dynamics;

摘要

除法运算是基本四则运算之一,如何进行快速除法一直是电子计算机、嵌入式系统和其他新型计算系统广受关注的问题.充分发挥三值光学处理器位数众多、运算功能可重构、按位可分配等优势,设计出高效并行MSD (modified signed digit)数除法器对提高大数据除法的运算效率、促进三值光学计算机(ternary optical computer, TOC)在数值计算领域的应用意义重大.本文首次提出MSD数的符号判定算法,并基于SRT算法首次提出利用一个并行无进位SJ-MSD加法器和一个MSD数比较器实现单组MSD整数除法或多组MSD整数并行除法方案——并行MSD整数除法,该算法对于被除数等长的多组与单组MSD整数除法需要的机器周期是相同的.实验表明,并行MSD整数除法方案是可行的,它将有效地提高大数据处理效率并加速TOC进入数值计算等实际应用领域.

关键词

并行MSD整数除法器; SJ-MSD加法器; 比较器; SRT除法; 三值光学计算机; parallel MSD integer divider; SJ-MSD adder; comparator; SRT division; ternary optical computer(TOC);

摘要

多租户公有云是云计算的一种重要组成形式.近年来,多租户公有云数据中心在如火如荼发展的同时,其过低资源使用率所导致的巨大能耗浪费也引起了社会的高度关注.然而,由于多租户公有云的资源通常以"包年包月"的租赁形式预留给租户,云服务提供商无法通过关闭空闲服务器等常用能耗管理方法来降低数据中心能耗.针对这一难题,本文提出了面向多租户数据中心资源回收利用的激励机制来提升多租户数据中心能效.该机制以经济激励的形式来回收利用租户空闲预留型资源,即云服务提供商向租户支付合适的经济补偿,从而回收租户空闲预留型资源,并充分利用其运行其他云计算服务(如电商和搜索服务).基于Lyapunov方法,本文设计并分析了一种面向租户预留资源回收利用的动态定价算法,该算法无需预测系统未来信息便可作出在线定价决策,并且在保障系统稳定性的同时使得云服务提供商长期成本无限接近于理论最低值.通过严格的数学证明以及由真实数据驱动的仿真实验,本文验证了所提出的激励机制在回收利用租户空闲资源方面的有效性.

关键词

多租户数据中心; 能耗管理; 资源回收; 激励机制; 在线算法; multi-tenant datacenter; energy management; resource recycling; incentive mechanism; online algorithm;

评述

视频萃取

Video distillation

Website Google Scholar
李学龙, 赵斌
中国科学: 信息科学, 2021, 51(5): 695-734

摘要

视频数据是人们日常生活中最重要的信息载体之一.视频萃取(video distillation)通过研究视频数据的时空和语义特性,探索简洁高效的数据展示形式和信息感知模态,是计算机视觉和人工智能的重点研究内容.近年来,随着视频获取方式的快速革新和拍摄需求的多样化发展,视频数据的智能化分析任务面临着新的机遇与挑战,涌现出众多的视频萃取方法.本文创新性地从信息论的角度,解释了数据、信息和知识之间的关系,确立了视频萃取的核心是提高单位数据量的信息提供能力这一基本原则,并依据数据信容(information capacity)分析,从理论上对视频萃取中的各项任务进行了统一.进一步地,分类讨论了视频时空表征中的关键问题与解决方案,系统地分析了从内容、目标和语义角度进行视频萃取的方法,结合视频摘要、浓缩和描述任务,梳理出三条发展主线,展现了视频萃取的发展态势.更重要的是,本文对现有方法的优势与缺陷进行了深入的思考与讨论,指出了尚未解决的若干关键科学问题,并对解决方案进行了初步探讨.同时,本文对视频萃取研究所面临的挑战与未来发展趋势进行了系统的分析与展望.

关键词

视频萃取; 视觉表征; 视频摘要; 视频浓缩; 视频描述; 计算机视觉; 人工智能; video distillation; visual representation; video summarization; video synopsis; video captioning; computer vision; artificial intelligence;

Vol. 51, No. 4, 2021 封面 目录

摘要

新一轮科技革命和产业变革正在萌发,以深度学习和大数据为基础,以Alpha Go等为典型应用场景掀起了人工智能的第3次高潮.传统的基于统计线性化动态建模的人工智能,在处理复杂对象时遇到了可解释性、泛化性和可复现性等发展瓶颈,迫切需要建立基于复杂性与多尺度分析的新一代人工智能理论,我们称之为精准智能.针对复杂系统的非线性特征,精准智能构建内嵌领域知识和数学物理机理的系统学习理论,包括复杂数据科学感知、复杂系统精准构建、复杂行为智能分析3个层次.具体而言,通过复杂数据科学感知建立内嵌时空特征与数理规律等具有可解释性的科学数据系统;通过复杂系统精准构建反演具有非线性复杂逻辑关系的多层次、多尺度、可解释的人工智能动态学习模型;通过对系统复杂行为智能分析建立面向系统行为演进和全局动态分析的可解释可调控人工智能新理论和新方法.将上述精准智能理论应用于群体智能,提出了群体熵方法,实现了群体激发和汇聚行为复杂性度量与有效引导调控.

关键词

人工智能; 可解释性; 非线性; 复杂性; 精准智能; artificial intelligence; interpretability; nonlinearity; complexity; refined intelligence;

摘要

生成式对抗网络(generative adversarial networks, GANs)训练的不稳定性问题一直是GANs研究领域最具挑战性的问题之一.目前,仍未从理论上找到影响GANs训练稳定性的根本原因及有效的解决办法.本文通过理论分析发现, GANs训练的不稳定性主要是由于训练最优判别器与最小化生成器之间相互矛盾所致.经逐步分析得出,控制判别器的Lipschitz常数是解决GANs不稳定性问题的关键,进而提出一种有针对性的梯度惩罚技术来解决此问题.最后,本文从损失函数的振荡幅度(收敛性)、梯度总体变化趋势,以及网络整体性能3个方面进行了全面对比实验.结果显示,本文所提出的惩罚技术对处理GANs训练的不稳定性问题具有显著的效果.

关键词

生成式对抗网络; 不稳定性分析; 惩罚技术; 梯度范数; Lipschitz常数; generative adversarial networks; instability analysis; penalty technique; gradient norm; Lipschitz constant;

摘要

增量二分图优化问题(dynamic bipartite drawing problem, DBDP)是一个具有NP难度的组合优化问题,该问题在实际生产生活中有着广泛的应用.本文提出了一种新的动态规划驱动的局部搜索(DP-LS)算法来求解该问题.不同于文献中求解该问题和该类问题的所有启发式算法的邻域搜索方式(即每次邻域操作只对一个或两个节点进行插入或交换动作),本文提出的动态规划驱动的局部搜索算法能从邻域结构中挑选出并执行多个独立的邻域动作,大大提高了邻域搜索的效率. DP-LS算法从一个随机初始解出发,迭代地利用基于动态规划的局部搜索算法来寻找局部最优解,同时结合扰动机制跳出局部极值陷阱实现全局搜索.本文提出的增量评估方法能够快速评估基于插入和交换的邻域动作,可以大大提高算法的搜索效率.本文针对1120个公共算例进行了计算实验并同文献中已有算法(包括通用求解器Gurobi)进行对比,表明了所提出的动态规划驱动的局部搜索算法在解的优度和计算效率两方面的有效性.此外,通过对比实验表明了DP-LS算法中动态规划机制的有效性(提升近十倍的搜索效率).值得注意的是,本文提出的基于动态规划的局部搜索算法不仅能够用于求解DBDP问题,也能作为一种通用的启发式算法来求解其他组合优化问题,尤其是排序类优化问题.

关键词

增量二分图优化问题; 动态规划; 局部搜索; 增量评估机制; dynamic bipartite drawing problem; dynamic programming; local search; incremental evaluation technique;

摘要

测试是提高软件可靠性的重要方法.消息传递并行程序中存在的不确定通信语句,使得进程执行顺序具有不确定性,这增加了测试该类程序的难度.鉴于进程执行顺序对目标路径覆盖难易程度的影响,本文研究消息传递并行程序多路径覆盖调度序列排序方法,以提高多路径覆盖测试数据生成的效率.首先,在每个调度序列下,以每个采样的程序输入执行程序,生成路径覆盖矩阵;然后,针对每条目标路径,分别计算与路径覆盖矩阵中每条路径的相似度,生成多个路径相似度矩阵;接着,基于这些路径相似度矩阵的特征量,评价调度序列的性能,并依此对调度序列排序;最后,基于调度序列排序集,使用随机采样法,生成覆盖所有目标路径的测试数据,并使用缺陷检测平均百分比(average percentage of faults detected, APFD)指标评估调度序列排序集.将所提方法应用于9个基准并行程序中,并与随机方法和传统方法进行比较.实验结果表明,所提方法对路径覆盖率没有影响,但显著减少了被测程序执行次数和运行时间.

关键词

消息传递并行程序; 多路径覆盖; 测试; 调度序列排序; 路径相似度; message-passing parallel program; multi-path coverage; testing; scheduling sequence sorting; path similarity;

摘要

近年来,随着科学技术的快速发展和硬件设备的不断迭代,人工智能在各种领域(如安防监控、医疗辅助、健康诊断、智能推荐、遥感监测、目标定位等)都得到了广泛的应用.随着人们对智能处理任务的要求逐步提高,人工智能算法所需要理解的语义信息层次和输出数据精准度要求也步步攀升.因此,像素级语义理解任务也因其精准度要求远高于图像级理解而越来越受到重视.与图像级理解相比,像素级语义理解具有输出数据量大、逐像素输出精度高的优点,相应地其难度也更大,内部成因更值得关注与研究.为此本文从信息度量的角度出发,结合像素级语义理解任务的特有属性,给出了像素级语义理解任务的定义与优化目标,进一步依据实际任务的特性从初始定义衍生出像素级语义分类和像素级语义回归两类任务;随后分别讨论了在这两类任务中优化目标的退化和演变,并通过详尽的调研总结了常见像素级语义理解任务的发展现状;紧接着探究了当前像素级语义理解的难点和未来发展方向,针对亟待解决的问题给出了深入的分析思考以及可行的解决方案;最后重点反思了后深度学习时代像素级语义理解乃至人工智能领域所面对的机遇与挑战,提出知识的方向指导和数据的优化驱动是未来人工智能发展的重点关注目标.本文意图从像素级语义理解的定义与发展现状出发,延伸出对当前工作的思考以及对整个领域的反思,强调整个领域面临的风险;在介绍像素级语义理解基础认知的同时对相关技术的发展方向和路径进行深入的思考与深度的展望.

关键词

像素级语义理解; 人工智能; 深度学习; 分类; 回归; pixel level semantic understanding; artificial intelligence; deep learning; classification; regression;

Vol. 51, No. 3, 2021 封面 目录

刊讯

弱监督学习专题简介

Website Google Scholar
张敏灵, 李宇峰
中国科学: 信息科学, 2021, 51(3): 520-520

关键词

弱监督学习; 多示例学习; 半监督学习;

摘要

近年来,网络多媒体迅猛发展.相较于传统固定网络多媒体内容服务,兴起的移动化多媒体服务中的用户行为发生了根本变化.传统内容分发架构依靠中心化基础设施、全局流行度趋势,无法有效感知和服务移动多媒体内容.利用边缘网络架构结合数据驱动策略服务动态移动多媒体内容,提升服务质量成为一种新的选择.通过数据驱动与跨域协同的研究方法,本文深入研究移动多媒体内容服务规律、系统架构、策略设计等.本文首先探讨数据驱动的大规模移动多媒体内容分发模式挖掘与网络性能分析,揭示边缘多媒体内容分发与传统内容分发的本质区别;进一步,本文给出一般性的边缘多媒体网络与内容分发的研究方法,包括数据驱动与跨域协同的多媒体边缘网络内容分发研究框架.最后,本文给出几种代表性框架,包括基于社交媒体传播预测进行内容部署的SocialCDN,基于内容提供商智能的CPCDN,基于边缘网络设备进行移动多媒体内容分发的EdgeCDN,以及基于用户众筹资源的CrowdCDN.

关键词

多媒体网络; 大规模内容分发; 数据驱动策略; 边缘计算; 资源分配; multimedia network; large-scale content delivery; data-driven strategies; edge computing; resource allocation;

摘要

视频行为识别近年来逐渐成为计算机视觉领域学者的研究热点,按照识别对象进行划分,视频行为识别任务可分为个体行为识别与群体行为识别.本文聚焦于群体行为识别,识别与分析视频场景中整体人群的行为.已有的群体行为识别方法大多采用多层时序网络模型,学习得到表征时序变化的个体行为特征并对其进行聚合形成群体行为特征.但是,在个体特征聚合过程中,以往方法未能有效考虑个体对群体行为贡献程度的差异性,影响识别性能.为此,本文提出一种针对个体行为特征聚合的注意力池化机制,并依此建立了新型群体行为识别模型,以自底向上的方式同时实现个体行为与群体行为分层识别.首先利用卷积神经网络提取视频中人体图像区块的个体静态特征,并将其作为多层递归神经网络时序模型的输入,从而得到个体动态特征.随后通过注意力池化机制对个体特征完成聚合,得到相应的群体行为特征;最后依托个体、群体行为特征同时完成个体行为与群体行为的识别.未验证所提方法的有效性,本文依托广泛使用的The Volleyball Dataset数据集上开展了一系列实验验证.结果显示,本文所提出的模型取得了较好的分类准确率,分类性能优于当前先进模型.

关键词

群体行为识别; 表示学习; 注意力机制; 深度学习; group activity recognition; representation learning; attention mechanism; deep learning;

论文

基于多视角聚类分析的汉字字体审美偏好挖掘

Esthetic preference mining of Chinese typefaces using multiview cluster analysis

Website Google Scholar
张艳, 谢源, 洪辰, 曲延云, 李睿, 张俊松, 李翠华
中国科学: 信息科学, 2021, 51(3): 383-398

摘要

在神经美学研究中已经证明,中文字体审美偏好的情绪刺激可以通过观察3种偏好(喜欢、不喜欢和中性)之间的事件相关电位(event related potential, ERP)波动获得.本文通过引入一种核化张量奇异值分解的多视角聚类方法分别构建了基于脑电图(electroencephalogram, EEG)和ERP的审美偏好识别模型,通过这些模型首次确认了该结论.本文方法将来自不同频段的数据视为描述中文字体审美偏好的不同视角,通过张量多秩最小化的约束探索所有视角特征的一致性和关联性,并通过之后的聚类获取审美偏好的识别结果.采用多视角无监督聚类方法得到的识别精度达到97.1%.此外,通过输入–扰动关联方法将电极的振幅与不同种类的审美偏好相关联,可视化关键频段组合以及电极之间的关系,分别取出与喜欢、不喜欢、中性最相关的3个电极,包含次相关的6个电极,包含第三相关的9个电极,包含第四相关的12个电极,分别形成4种不同组合的脑电特征.通过比较实验,验证了相对于62个电极信号,上述4种组合方式在字体美学分类上更具有优势,并且最相关的3个电极的组合特征对审美偏好最具判别性.实验结果表明,基于多视角聚类的方法能够解决神经信号与审美偏好的相关分析,并能挖掘出与字体审美偏好最相关的电极.

关键词

中文字体; 审美评价; 计算美学; 事件相关电位; 核化张量奇异值分解; 数据挖掘; Chinese typeface; esthetic evaluation; computational esthetics; event-related potentials; kernelized tensor-SVD; data mining;

论文

基于隐空间约束生成对抗网络的活体检测

Latent regularized generative adversarial network for face spoofing detection

Website Google Scholar
陈成伟, 院旺, 陈攀, 丁守鸿, 谢源, 宋海川, 马利庄
中国科学: 信息科学, 2021, 51(3): 367-382

摘要

近年来,人脸识别技术飞速发展,其主要应用于门禁系统和公共安防系统.然而现有的人脸识别系统容易受到仿冒攻击(也称为呈现攻击),例如尝试使用用户的脸部照片、视频或者伪造的3D人脸去攻击人脸识别系统.这些攻击手段给人脸识别系统带来了极具挑战性的安全问题.因此活体检测技术的研究十分重要,其可以使人脸识别系统免于攻击假脸的安全威胁.目前,大部分活体检测的方法将活体检测任务视作有监督的二分类问题,进而努力充分提取真实人脸和攻击人脸的特征,在单个数据集内部训练和测试可以达到很高的准确率,但是在交叉数据集之间训练和测试往往效果不佳.本文将活体检测任务定义为异常检测任务,并基于此来解决之前活体检测方法存在的泛化能力差的问题.因此本文提出了一种新颖的基于隐空间约束的深度对抗网络,它通过半监督学习的方式进行对抗训练,在此过程中模型不仅仅可以获得正常样本在隐空间中的分布,还可以通过一种惩罚的方式对隐空间中正常样本的特征进行约束,这将带来更加有效和鲁棒的活体检测效果.测试过程中,攻击人脸样本将被视作离群的样本,它们相对于正常样例在隐空间中的表达具有更高的重构差.实验表明提出的模型相较于前沿的半监督异常检测方法具备明显的优势,并且在活体检测跨数据集和单数据集内达到了可比的效果或者目前最好的效果.

关键词

对抗网络; 活体检测; 弱监督学习; 异常检测; 人脸仿冒攻击; adversarial networks; live face detection; semi-supervised learning; anomaly detection; face spoofing attacks;

Vol. 51, No. 2, 2021 封面 目录

论文

基于深度线性判别分析的哈希技术

Deep linear discriminant analysis hashing

Website Google Scholar
胡迪, 聂飞平, 李学龙
中国科学: 信息科学, 2021, 51(2): 279-293

摘要

传统基于分类学习的监督哈希方法并不能完全满足哈希检索技术需求,但是线性判别分析却能够在一定程度上做到这一点.本文提出将线性判别分析作为深度网络的优化目标,以端到端训练的方式学习有效的哈希编码.但是,直接以上述目标训练神经网络就必须解决具有较高计算复杂度的特征值分解问题.在本文中,线性判别分析目标被转化为一个简单的最小均方问题,这种转化可以解决上述问题,同时可以利用成熟的优化方法优化网络.这种基于线性判别分析的深度网络拓展可以弥补传统判别分析在简单线性投影和特征学习上的劣势.本文在3个基准数据集上进行大量对比实验,相对于传统线性判别分析,本文所提方法在检索基准指标上有70%的提升,并超过大多数基于深度模型的哈希方法,这些实验结果证明了本文方法的有效性.

关键词

哈希技术; 线性判别分析; 最近邻检索; 深度网络; 量化技术; hashing technique; linear discriminant analysis; nearest-neighbor search; deep network; quantization technique;

论文

三维标架场可控去旋方法

Controllable curl-correction of 3D frame fields

Website Google Scholar
方贤忠, 金耀, 黄劲, 鲍虎军
中国科学: 信息科学, 2021, 51(2): 263-278

摘要

六面体网格因其良好的数值性能成为有限元分析等领域中重要的一种离散化方法,而基于标架场导引的重网格化是实现可控六面体网格剖分的重要技术.现有的标架场生成技术由于所获得的标架场往往存在拓扑矛盾,难以运用于纯六面体网格的生成,但较易用于六面体主导混合网格的生成.然而,这种六面体主导网格的质量容易受到标架场旋度的影响.针对这一问题,本文提出了一种三维标架场保向且长度可控去旋方法.该方法通过分析三维向量场的旋度,构造针对四面体网格的离散旋度能量,并将其推广至三维标架场的旋度能量.为保持原标架场方向并控制其长度,引入了表达三维标架场3个子向量场长度伸缩量的标量场,并将新标架场表示为标量场和原标架场的合成,最后通过极小化合成场的旋度得到优化后的标架场.实验结果表明,通过约束标量场的变化范围,能在保持其方向不变的情况下,有效地控制去旋程度;将该标架场运用于已有重网格化方法,可得到方向和密度可控的六面体主导的混合网格.此外,该方法只需求解一个带界约束的二次凸规划问题,鲁棒性强且易于计算.

关键词

三维标架场; 去旋; 长度可控; 六面体主导网格; 3D frame field; curl correction; length-controllable; hexahedral dominant mesh;

摘要

衡量航母作战性能的重要指标是舰载机出动架次率,而影响舰载机出动架次率的关键因素是舰载机保障作业调度效率.舰载机保障作业调度是指在有限时间、空间和资源约束的前提下合理安排舰载机所需保障作业顺序并高效完成舰载机的作业保障.现有基于最优化方法 (动态规划、线性规划等)和启发式方法 (如遗传算法、粒子群等)的求解策略仅适用于保障作业可预知情况下的作业调度,很难满足高动态作战场景下的实时保障作业调度需求.基于此,本文提出了一种新的基于DQN (deep Q-network)的舰载机保障作业实时调度方法,将舰载机保障作业调度问题建模成部分可观测马尔科夫决策过程(partially observable Markov decision processes)问题,利用全局与长期收益对保障作业调度过程进行优化,并通过离线学习和在线调配的学习决策框架进行解决.经过仿真实验验证,该方法能显著提高舰载机保障作业调度效率并满足实时决策环境的需要.

关键词

舰载机; 保障作业; 实时调度; 强化学习; 仿真验证; carrier-borne aircraft; support operations; real-time scheduling; reinforcement learning; simulations;

摘要

本文面向多种硬件平台提出了一套Web3D实时动态光影的协同式渲染系统,该系统把Web前端的硬件性能作为整个云渲染系统中光影渲染任务分配的关键因素.对于Web前端性能较强的硬件设备,系统分配复杂度较高的光影渲染任务给前端,相应的云后端的渲染负担则有所降低;反之,系统则分配复杂度较低的光影渲染任务给前端,相应的云后端承担大部分的渲染任务.在上述机制的引导下,该系统的前后端部署了4类关键的实时光影渲染算法,最终通过对算法运行帧率、算法所在设备的运行效率以及光影渲染结果等多种数据的分析,验证了部署的合理性.

关键词

云渲染; Web3D; 实时绘制; 动态光影; 全局光照; cloud rendering; Web3D; real-time rendering; dynamic lighting and shadow; global illumination;

摘要

拼图游戏是一类复杂问题的典型代表.这类问题的复杂性体现在其无法通过自上而下、集中控制的方式进行有效求解.通常情况下,拼图游戏由一个玩家独立完成,或由几个玩家围坐在一起协同完成.本文提出一种基于互联网人类群体智能的拼图问题求解方法.该方法使用一种被称为"探索–融合–反馈"的回路用于支持人类玩家群体在互联网环境中进行并行、协同的拼图问题求解.其中,探索活动由玩家实施,融合与反馈活动由拼图环境自动实施.在探索活动中,每个玩家独立进行拼图问题的求解,不与其他玩家发生直接的交互.在任何时刻,一个玩家探索活动的结果是一个关于当前拼图问题的片段解,以及一组被该玩家判断为错误的图块邻接关系.在融合活动中,拼图环境实时地将所有玩家的当前探索结果融合在一起,形成一个不断演化的群体观点图.在反馈活动中,对于每一个玩家,拼图环境根据该玩家的当前探索结果和当前的群体观点图,向该玩家推荐特定的信息,以加速其拼图进程.我们实现了一个支持上述方法的多人在线拼图环境,并在2~10人规模的玩家群体中进行了初步的实验.实验结果表明:(1)在这一多人拼图环境中,拼图求解时间大致正比于玩家数量的倒数,且以玩家群体中的最强个体为基准点,群体拼图效率能够实现31.36%~64.57%的提升;(2)在该环境中,最快完成拼图的玩家获得的反馈信息平均具有86.34%的准确率,且随着群体规模的增加,反馈信息在最快玩家拼图结果中的平均占比逐渐从20%增加到45%左右;(3)相比于面对面协同的群体拼图求解方式,该环境展示出更好的群体规模可扩展性,且拼图结果总是具有100%的正确率,而拼图问题自动求解算法平均只具有52%的正确率.我们希望本文工作能够为探索群体智能在互联网环境下的更广泛应用提供一些有用的信息或观点.

关键词

人类群体智能; 互联网; 复杂问题求解; 拼图问题; 信息融合与反馈; collective human intelligence; Internet; complex problem solving; pictorial jigsaw puzzle; information integration and feedback;

评述

内存计算研究进展

Development of processing-in-memory

Website Google Scholar
毛海宇, 舒继武, 李飞, 刘喆
中国科学: 信息科学, 2021, 51(2): 173-206

摘要

随着应用数据处理需求的激增,在传统冯·诺依曼(von Neumann)体系结构中,处理器到主存之间的总线数据传输逐渐成为瓶颈.不仅如此,近年来兴起的数据密集型应用,如神经网络和图计算等,呈现出较严重的数据局部性,缓存命中率低.在这些新兴数据密集型应用的处理过程中,中央处理器到主存间的数据传输量大,导致系统的性能不佳且能耗变高.针对传统冯·诺依曼体系结构的局限性,内存计算通过赋予主存端一定的计算能力,以缓解因数据量大以及数据局部性差带来的总线拥堵和传输能耗高的问题.内存计算有两大形式,一种是以高带宽的连接方式将计算资源集成到主存单元中(近数据计算),另一种是直接利用存储单元做计算(存内计算).这两种形式有各自的优缺点和适用场景.本文首先介绍并分析了内存计算的提出和兴起原因,然后从硬件和微体系结构方面介绍内存计算技术,接着分析和总结了内存计算所面临的挑战,最后介绍了内存计算给目前流行的应用带来的机遇.

关键词

内存计算; 近数据计算; 存内计算; 神经网络; 图计算; processing-in-memory; near-data computing; computing-in-memory; neural network; graph computing;

Vol. 51, No. 1, 2021 封面 目录

摘要

安全多方计算是国际密码学界研究的热点,百万富翁问题是安全多方计算最基础最重要的问题,是构造其他安全多方计算协议的基本模块.这个问题已经有许多解决方案,但除了基于混淆电路的协议之外,目前基于公钥加密算法的解决方案几乎都是半诚实模型下的解决方案,抗恶意敌手的解决方案极少,仅有的个别解决方案效率很低,这制约着恶意模型下许多安全多方计算问题的解决.抗恶意敌手的解决方案更符合安全多方计算的实际应用场景,研究抗恶意敌手的百万富翁问题解决方案,具有重要的理论与现实意义.本文首先设计了一个半诚实模型下百万富翁问题的解决方案,进一步分析了恶意敌手可能的恶意行为,并用零知识证明和分割选择阻止或发现这些恶意行为,将半诚实模型下安全的计算协议改造成恶意模型下安全的计算协议,并用理想–实际范例证明了协议的安全性,分析了恶意敌手攻击成功的概率和方案的效率.理论分析表明与现有方案相比,我们提出的方案效率至少提高6倍.

关键词

安全多方计算; 百万富翁问题; 恶意模型; 分割–选择; 零知识证明; 理想–实际范例; secure multiparty computation; millionaires' problem; malicious model; cut-and-choose; zero-knowledge proof; ideal-real paradigm;

摘要

机器学习方法对网络流量分类的前提是假设流量具有独立同分布性,而实际情况下流量特征不断发生变化,导致该方法在处理海量、不具备独立同分布的流量数据时开销较大,计算复杂度较高,精度较低.针对上述问题,本文提出一种新的分类模型.该模型将PCA算法与改进的深度卷积神经网络分类模型(improved deep LeNet-5 convolutional neural networks, LCNN)相结合进行流量分类.前者进行降维分析,发现影响检测精度的关键特征,后者采用自主特征学习方式提升分类精度.实验表明,本文方法的内存开销较之前方法降低了3.2%,检测精度提升了5%~8%.

关键词

网络流量分类; 深度卷积神经网络; PCA; 多分类器; 特征选择; Tensorflow; network traffic classification; deep convolutional neural network; PCA; multi-classifier; feature selection; Tensorflow;

论文

基于地质知识蒸馏学习的油气储集层识别方法

Method of oil and gas reservoir detection based on geological knowledge distillation learning

Website Google Scholar
李徵, 刘淇, 王喆锋, 郑毅, 林霞, 怀宝兴, 米兰, 陈恩红
中国科学: 信息科学, 2021, 51(1): 40-55

摘要

油气储集层识别是石油能源企业在勘测和开发业务中核心的任务之一.长期以来,油气行业一直依靠专家人工分析海量测井数据以对地下油气储集层进行定性分析,虽然专家解释结论有着很高的精准度,但是时间与经济成本都十分高昂.近些年来,随着以深度学习为代表的人工智能技术的迅速发展,智能油气储集层识别技术成为学术界和工业界共同关注的问题.然而,真实工业环境存在严重的传感数据不一致问题,给传统的监督学习模型带来巨大的挑战.本文针对传感器不一致情境中油气储集层识别任务展开研究,提出多尺度地质知识蒸馏网络的方法.首先,该方法提出一种多尺度特征自注意力融合机制来学习地质信息的多尺度动态表征.其次,该方法设计一种地质知识蒸馏学习模型,从非一致传感数据中学习额外的地质知识,进一步提升模型准确度.最后,在真实数据集上进行大量实验,结果充分证明本文提出的模型在油气储集层识别任务上的有效性和鲁棒性.

关键词

油气储集层识别; 地质知识; 蒸馏学习; 传感数据; 深度神经网络; oil and gas reservoirs detection; geological knowledge; distillation learning; sensor data; deep neural network;

摘要

本文研究K-近邻分类器的鲁棒性验证问题.形式化鲁棒性验证的目标是计算分类器在给定样本点上的最小对抗扰动的精确值或者最小对抗扰动的非平凡下界.我们将计算K-近邻分类器的最小对抗扰动形式化为一组二次规划问题.二次规划问题的数目随近邻参数K的增大呈指数级增长,精确求解该组二次规划问题往往不可行.约束放松法通过放松优化的约束项,可以在多项式时间内求解最小对抗扰动的下界.然而,本文通过理论分析和实验发现,当近邻参数K取值较大时,约束放松法求得的下界往往过于宽松,甚至会出现K越大下界越小的反直觉结果.为解决这一问题,本文提出使用随机平滑法对K-近邻分类器进行鲁棒性验证.随机平滑法利用了K-近邻分类器对高斯(Gauss)白噪声鲁棒的特点,获得了较为理想的鲁棒性验证效果.基准数据集上的实验结果表明,相比于最新的鲁棒神经网络,"随机平滑的" K-近邻分类器展现出了更好的验证鲁棒性.

关键词

监督学习; 对抗机器学习; 对抗鲁棒性; 鲁棒性验证; K-近邻分类器; supervised learning; adversarial machine learning; adversarial robustness; robustness verification; K-NN classifier;

摘要

近几年,深度模型在诸多任务中取得了巨大成功,但是深度模型需要大量的存储和计算资源实现精确决策,研究者为了将深度模型应用到资源受限的终端设备中,设计了模型压缩的优化策略来降低模型占存和计算量.本文基于剪枝压缩框架,从卷积核重要度评价的角度提出了两种模型剪枝算法.(1)由于每个卷积核都可以学习到其独有特征信息,因此本文提出了一种归因评价机制用于评价卷积核所学特征与因果特征的相关度,将模型中与因果特征相关度较低的卷积核进行裁剪,以实现模型压缩的目的,同时也能够保留原模型的归因特征,称此算法为归因剪枝.(2)第2种剪枝算法基于迭代优化剪枝框架,采用卷积通道和梯度中正相关特征评价相应卷积核重要度,以便于提高剪枝冗余卷积核的精准度,称为Taylor-guided剪枝算法.本文在VGGNet和ResNet两种网络架构上进行实验验证,结果表明:归因剪枝算法可以极大地保留原模型的归因特征;并且两种剪枝算法能够取得比当前主流剪枝算法更优异的压缩效果.

关键词

深度学习; 网络剪枝; 归因; 压缩; Taylor展开; deep learning; network pruning; attribution; compression; Taylor expansion;

摘要

在很多真实应用中,数据以流的形式不断被收集得到.由于数据收集环境往往发生动态变化,流数据的分布也会随时间不断变化.传统的机器学习技术依赖于数据独立同分布假设,因而在这类分布变化的流数据学习问题上难以奏效.本文提出一种基于决策树模型重用的算法进行分布变化的流数据学习.该算法是一种在线集成学习方法:算法将维护一个模型库,并通过决策树模型重用机制更新模型库.其核心思想是希望从历史数据中挖掘与当前学习相关的知识,从而抵御分布变化造成的影响.通过在合成数据集和真实数据集上进行实验,我们验证了本文提出方法的有效性.

关键词

机器学习; 分布变化; 流数据; 模型重用; 集成学习; 动态环境; machine learning; distribution change; data stream; model reuse; ensemble methods; dynamic environments;

Vol. 50, No. 12, 2020 封面 目录

论文

面向互联网的SDN流量多粒度处理机制

Traffic multi-granularity processing mechanism for Internet-oriented SDN

Website Google Scholar
卢向敏, 王兴伟, 易波, 李婕, 黄敏
中国科学: 信息科学, 2020, 50(12): 1903-1918

摘要

软件定义网络(software defined networking, SDN)作为一种新型的网络架构,将网络的控制平面与数据转发平面分离,实现了可编程化控制,为互联网提供了改善网络全局性能的新思路.虽然SDN具有全局视角优势,但在处理互联网海量数据时也存在性能瓶颈:频繁的层间通信会使控制器计算效率下降,海量的流表项数据使得交换机存储压力过大.为了进一步提升SDN的性能使其适应互联网的海量流量处理,本文提出了面向互联网的SDN流量多粒度处理机制,将SDN架构应用到互联网骨干网的流量处理中,分别从路由和调度两个方面设计并实现了流量多粒度处理机制.仿真结果表明:本文设计的流量多粒度处理机制能减少层间通信次数,减少下发流表项,维持负载均衡,提高了路由选取的正确性和有效性,提升了SDN性能,进而提升了处理互联网海量数据的能力.

关键词

软件定义网络; 互联网; 多粒度路由; 流量调度; 性能优化; software defined networking; Internet; multi-granularity routing; traffic scheduling; performance optimization;

摘要

2020年年初,新型冠状病毒感染的肺炎(COVID-19)爆发,中国采取了全面严格的防控举措全力抗击疫情.地方疫情指挥部门及时通报疫情感染数据,有助公众了解疫情的发展,及时做好防护措施.各地患者病例详情数据主要以文本形式记录,信息描述复杂,且各省市汇报的格式各异,处理难度较大.我们面向全国湖北省外近二分之一匿名的患者病例详情数据,提出了应用自然语言处理技术,辅助病例数据结构化的方法.该方法可以在标记样本较少的情况下,借助预训练模型,准确有效地提取出病例文本中的关键信息.通过对较大规模患者结构化病例数据的挖掘,本文详细分析了新型冠状肺炎总体发病性别和年龄分布特点、主要感染原因、潜伏期特点及疫情趋势等特征.由于潜伏期等时间延迟的存在,确诊人数往往不能反映一个地区的真实感染情况,结合出行大数据,本文提出了一个合理推断武汉市等城市实际感染人数的方法.该方法有助于人们提前估计地区疫情发展情况,及早采取防护措施.也可以辅助地方相关部门科学决策,尽早调度医务人员和分配医疗资源.

关键词

新型冠状病毒; 结构化病例; 自然语言处理; 预训练模型; COVID-19传播特征; 出行大数据; coronavirus; structured medical cases; natural language processing; pretrained models; COVID-19 transmission characteristics; big data of traveling;

摘要

在很多在线推荐系统场景中,用户和系统的交互通常都会按照时间间隔划分成一系列的会话.本文研究了如何在基于会话的推荐系统中对用户兴趣进行建模.现有的工作或者假设会话之间相互独立,忽略了历史会话中包含的长期用户兴趣信息;或者将用户在一个会话中的短期兴趣视为静态不变.这两者都无法充分刻画实际场景中的用户兴趣和行为.我们提出了循环记忆网络RMN,一种刻画了用户长期和短期兴趣的基于会话的推荐系统. RMN基于循环神经网络模型,其核心部分是一个储存了用户长期偏好的兴趣记忆模块.另外,我们在RMN中设计了一个会话内的记忆读取单元和一个会话间的记忆写入单元,这两个单元分别用于刻画短期(即一个会话内)的用户兴趣波动和长期(即跨越多个会话)的用户兴趣转移.我们在真实的电影推荐和职位推荐数据集上进行了实验,实验结果表明RMN相比于现有方法而言取得了显著的性能提升.

关键词

推荐系统; 会话; 长短期用户兴趣; 循环神经网络; 记忆网络; recommender systems; session; long-short term user preferences; recurrent neural networks; memory networks;

摘要

细胞神经网络(cellular neural network, CNN)具有简单的局部互联结构和高速并行处理能力,是构造人工视网膜的基础模型,可被应用于机器视觉中图像处理时的图像增强等方面.然而,现有的此类图像增强方法尚存在一些不足,例如,在处理实际复杂图像时,采用固定模板难以取得理想效果;而且,未能模拟人类视觉系统的全局和局部自适应调节特性,缺乏仿生考虑.因此,本文融合自适应三高斯(tri-Gaussian)理论和纳米信息器件忆阻器,提出了一种用于图像增强的新型仿生自适应忆阻细胞神经网络.其中,基于忆阻器的可编程性、非易失性、突触可塑性等优点,构建忆阻细胞神经网络架构.基于神经元感受野三高斯模型,利用高斯核函数和细胞神经网络的图像处理特征,提出对应的仿生自适应图像增强模板设计算法.最后,分别以灰度和彩色图像为例进行了图像增强实验和对比分析,结果表明,提出的仿生自适应忆阻细胞神经网络能够显著提高图像的全局亮度、局部对比度和清晰度.本研究可为细胞神经网络提供自适应模板设计及实现方案,提升细胞神经网络的仿生特性和硬件实现的可行性,并为图像增强等智能图像处理提供新思路.

关键词

细胞神经网络; 图像增强; 自适应三高斯模型; 仿生图像处理; 忆阻器; cellular neural networks(CNN); image enhancement; adaptive tri-Gaussian model; biomimetic image processing; memristors;

摘要

如何提升分布式存储系统中磁盘修复的速度,一直是磁盘修复问题中的难点.优化的途径有两种:一种是通过对解码算法的优化,减少修盘数据的传输量.另外一种方法是通过对修盘过程中数据流的调度,最大化地利用节点的计算能力、传输能力,进而加速修盘进程.本文从数据流的调度出发,根据数据流图和拓扑结构,计算出了节点的近似最优的修盘数据比例,并依照此比例,设计了分布式存储系统下的近似最优修盘调度算法(NOPT).对于主流的两种Reed-Solomon (RS)编码方式,本文做了等价性证明,并给出了编码转换矩阵.通过大量实验仿真可以看出,在预知系统拓扑的前提下,可以显著地减少通过交换机的流量,进而缩短修盘的时间.

关键词

Reed-Solomon码; 磁盘修复技术; 分布式存储系统; Reed-Solomon code; disk repair algorithm; distributed storage systems;

摘要

形式概念分析是以形式背景及其概念格为基础的一种数据分析方法,其中的形式概念明确反映了数据信息中对象与属性间的关系,是哲学中"概念"这一名词的形式化描述.文章提出在形式概念分析框架下进行概念约简的思想,研究保持形式背景中二元关系不变的概念约简的相关理论;针对概念约简理论中作用不同的3种概念类型,分别从算子角度以及布尔矩阵角度分析了对象(属性)概念的特征,并给出了求解概念约简的方法.

关键词

形式背景; 形式概念分析; 二元关系; 约简; 特征; formal context; formal concept analysis; binary relations; reduction; characteristic;

Vol. 50, No. 11, 2020 封面 目录

评述

从计算机体系结构发展历程看数据流计算思想

The impact of data flow computing thinking on the development of computer architecture

Website Google Scholar
窦勇, 王嘉伦, 苏华友, 徐辰, 宫晓利, 阳王东, 翁楚良, 李战怀, 李肯立, 于戈, 周傲英
中国科学: 信息科学, 2020, 50(11): 1697-1713

摘要

在计算机体系结构发展历程中,冯·诺依曼(von Neumann)计算机结构一直是计算机系统的主流架构.谈及非冯计算机体系结构时,数据流计算机无疑是被提及最多的.本文从计算机体系结构发展历程的角度,分析数据流计算思想在计算机体系结构创新发展过程中发挥的重要作用.本文首先回顾数据流计算思想、分析早期数据流计算机的局限性;之后分析在现代中央处理器(central processing unit, CPU)技术中所借鉴的数据流计算思想,乱序执行和多线程技术;进一步介绍流计算思想、流处理器技术和图形处理器(graphics processing unit, GPU)中的数据流计算思想;然后针对大数据智能化时代计算机系统的发展变化分析数据流计算思想的运用.最后总结数据流计算思想运用规律,展望未来发展趋势.

关键词

数据流; 大数据; 异构计算; GPU; 智能计算; data flow; big data; hybrid computing; GPU; intelligent computing;

摘要

洛瓦兹局部引理是组合数学和概率论中的重要工具,其最主要的用途之一是证明当约束之间"弱相关"时,满足复杂约束的组合对象存在.自从1975年Erdos和Lovasz提出洛瓦兹局部引理以来,局部引理在组合数学、理论计算机和物理学等领域已经有了很多应用.近年来,为了扩展局部引理的应用范围,人们提出了很多新版的局部引理,尤其是在构造版本局部引理上取得了重大的突破.本文将综述局部引理近年来最新的研究进展,包括几种最主要的局部引理变种以及它们在计算机科学和物理学中的应用.特别的,我们将给出抽象版本、Lopsided版本、变量版本和量子版本局部引理紧的条件,并讨论抽象版本紧的条件同统计物理、量子版本紧的条件同量子物理之间的联系.同时,我们还将以布尔可满足性问题和量子可满足性问题为例,说明局部引理在证明问题有解、找到问题的解以及对问题的解进行计数和采样等方面的应用.

关键词

洛瓦兹局部引理; 变量版本局部引理; 量子版本局部引理; 构造版本局部引理; Shearer界; Lovász Local Lemma; variable LLL; quantum LLL; constructive LLL; Shearer's bound;

摘要

围绕如何构建能够在高动态战场环境下持续保障多样化任务完成的指挥控制系统,依据可成长软件理论、方法,提出了一套指挥控制系统的自主适变解决方案;首先建立了具备自主适变能力的指挥控制系统总体架构模型,并构建了面向深度软件定义的核心任务保障框架;在此基础上,给出了基于"环境认知环–决策执行环"的"双环"自主适变机制,以实现面向任务保障的主动感知、适变控制和重构演化;最后基于所构建的技术验证原型系统进行了运行等级转进、资源受损下的业务持续运行等典型场景下的仿真试验验证.

关键词

指挥控制系统; 可成长软件; 自主适变; 核心任务保障; command and control systems; growing software systems; autonomous adaptability; core-mission assurance;

可成长软件专题 | 论文

面向大规模集群的柔性配置更新推送方法

Flexible configuration update delivery for large clusters

Website Google Scholar
唐震, 王伟, 黄宇, 李艳林, 纪树平, 宋傲, 魏峻, 黄涛
中国科学: 信息科学, 2020, 50(11): 1645-1664

摘要

配置管理是支撑云服务提供商管理大规模容器集群的重要基础设施.这一规模的集群通常包含百万量级的容器实例,如何根据不同业务场景的需求,及时可靠地将配置更新推送至对其感兴趣的容器实例,是亟待解决的关键问题.然而,现有方法仍存在不足之处.保障顺序一致性的共识算法限制了集群的扩展能力,难以适用于大规模集群.反熵算法存在长尾现象,时延难以保障,不适用于推送关键的配置更新.为了应对上述挑战,本文提出了一种面向大规模集群的柔性配置更新推送方法.这一方法基于发布/订阅机制,引入基于完全N叉树拓扑的可定义的多层次推送,并使用订阅者的部分计算资源协助推送,以提升推送性能;引入容错机制以应对节点失效和网络分区,保障网络分区时多分区读写可用.方法的拓扑参数和策略可根据业务场景对性能、可靠性等维度的不同需求而调整.实验结果表明,与现有的方法相比,我们的方法可以有效降低更新推送的时延,并可有效应对节点失效和网络分区场景.

关键词

更新推送; 配置管理; 完全N叉树; update delivery; configuration management; complete N-ary tree;

可成长软件专题 | 论文

深度学习模型终端环境自适应方法研究

Context-aware adaptation of deep learning models for IoT devices

Website Google Scholar
郭斌, 仵允港, 王虹力, 王豪, 刘思聪, 刘佳琪, 於志文, 周兴社
中国科学: 信息科学, 2020, 50(11): 1629-1644

摘要

随着人工智能和物联网的快速发展与融合,智能物联网AIoT正成长为一个极具前景的新兴前沿领域,其中深度学习模型的终端运行是其主要特征之一.针对智能物联网应用场景动态多样,以及物联网终端(智能手机、可穿戴及其他嵌入式设备等)计算和存储资源受限等问题,深度学习模型环境自适应正成为一种新的模型演化方式.其旨在确保适当性能的条件下,能自适应地根据环境变化动态调整模型,从而降低资源消耗、提高运算效率.具体来说,它需要主动感知环境、任务性能需求和平台资源约束等动态需求,进而通过终端模型的自适应压缩、云边端模型分割、领域自适应等方法,实现深度学习模型对终端环境的动态自适应和持续演化.本文围绕深度学习模型自适应问题,从其概念、系统架构、研究挑战与关键技术等不同方面进行阐述和讨论,并介绍我们在这方面的研究实践.

关键词

智能物联; 环境自适应; 模型演化; 深度模型压缩; 云边端模型分割; 领域自适应; AIoT; context-aware adaptation; model evolution; deep learning model compression; edge-based model partition; domain adaptation;

可成长软件专题 | 论文

意图敏感的日志自动增强

Intention-aware log automation

Website Google Scholar
贾周阳, 李姗姗, 刘晓东, 王戟, 廖湘科
中国科学: 信息科学, 2020, 50(11): 1612-1628

摘要

高质量的日志代码是软件故障诊断的重要依据.由于缺乏统一规范、开发人员不够重视等原因,现有软件中的日志质量参差不齐.目前,已有工作致力于日志的自动化增强,主要分为基于易错模式的方法和基于代码特征的方法,这些方法通过总结软件易错代码模式或学习已有日志代码的代码特征,进而在相应的代码段中自动添加日志语句.但开发人员添加日志代码的意图往往难以用固定的模式或特征来描述,导致日志增强的准确性不高.因此,本文探索了意图敏感的日志增强方法,提出了一种日志意图描述模型(log-intention description model, LIDM),在此基础上设计和实现了自动化日志增强工具SmartLog. SmartLog利用LIDM提取日志代码意图,挖掘日志增强规则,进而实现意图敏感的日志自动增强.本文在6款成熟且被广泛使用的开源软件上对SmartLog的有效性展开了评估.评估结果显示, SmartLog的准确性相比两个已有最好的日志增强工具分别提升43%和16%.此外,本文收集了软件演化过程中86个开发人员增加日志的实例,并使用SmartLog和两个已有工具分析每次日志演化的旧软件版本,发现3个工具可自动在新软件版本添加的日志分别是49, 10, 22个,软件演化效率相比已有工作显著增强.

关键词

日志增强; 故障诊断; 日志演化; 软件意图; 日志自动化; log enhancement; failure diagnosis; log evolution; software intention; log automation;

摘要

在云计算和大数据的技术背景下,"人–机–物"三元融合的应用模式正不断加速社会的信息化进程,并对软件系统的自适应和持续演化能力提出了新的需求.本文探索了面临软硬件环境及外部资源不断变迁挑战下的可成长网构软件理论方法和实现技术,从软件可成长性问题的由来,至可成长性概念的内涵和可成长软件的范型机理,在开放环境感知与自适应、无缝演化和过程演进,以及演化质量评估方法和保障机制3个方面系统分析了可成长软件的技术挑战并介绍了当前的技术进展,以支撑软件系统在不断成长视角下的长期生存.

关键词

可成长软件; 范型机理; 自主适应; 持续演化; growing software; paradigm; self-adaptation; continuous evolution;

可成长软件专题 | 编者按

可成长软件专题编者按

Website Google Scholar
王戟, 马晓星
中国科学: 信息科学, 2020, 50(11): 1593-1594

关键词

可成长性; 指挥控制系统;

Vol. 50, No. 10, 2020 封面 目录

论文

带有隐式反馈的SVD推荐模型高效求解算法

Efficient solution of the SVD recommendation model with implicit feedback

Website Google Scholar
蔡剑平, 雷蕴奇, 陈明明, 王宁, 张双越
中国科学: 信息科学, 2020, 50(10): 1544-1558

摘要

作为推荐系统的重要组成部分,协同过滤已成为了当今主流的推荐方法之一.其中基于潜在因子的协同过滤常采用SVD推荐模型分析用户喜好.近年来,随着SVD推荐模型研究的深入, SVD++,TrustSVD等一类带有隐式反馈的SVD推荐模型被相继提出.此类模型能更有效地从有限的数据源中挖掘有用信息并取得了较好的效果,因此受到了人们广泛关注.然而,现有文献大多关注于模型设计,缺乏专门针对带有隐式反馈的SVD推荐模型的高效求解算法.为此,本文首先研究了一般性的SVD推荐模型梯度求解框架,然后以SVD++推荐模型为突破口,基于块梯度下降方法设计了高效求解算法BCDSVD++并解决了容量矩阵求逆、稀疏数据优化处理等两个关键问题.实验表明,本文所设计的BCDSVD++算法具有比传统的并行梯度下降法更高效的求解效率及收敛能力.

关键词

SVD推荐模型; 隐式反馈; SVD++; 块坐标下降法; 协同过滤; SVD recommendation model; implicit feedback; SVD++; block coordinate descent method; collaborative filtering;

摘要

否定选择算法(negative selection algorithm, NSA)是人工免疫系统的核心基础算法.孔洞是引起NSA检测率低的重要因素.传统NSA未考虑孔洞的分布,采取在特征空间内通过完全随机的方式盲目生成检测器以修复孔洞,导致孔洞修复效果不佳,并且淘汰无效的检测器也异常耗时.孔洞问题在生物免疫系统中也同样存在.生物免疫系统利用MHC分子针对孔洞产生的特殊形态,对免疫细胞的发育过程进行限定,从而训练出覆盖孔洞的免疫细胞,进而解决孔洞问题.受此启发,本文提出一种基于免疫MHC的否定选择算法——孔洞修复方法 MHC-NSA.首先以训练样本生成的维诺图(Voronoi)对形态空间进行划分,利用维诺图的最邻近特性,在维诺图中两类点处快速生成两类检测器,以较小训练代价达到对非自体空间较好的覆盖;其次模拟MHC针对孔洞所具有的特殊形态,对所产生的孔洞位置进行定位,并限定该位置生成孔洞修复检测器,从而提升孔洞修复效果.理论分析表明,MHC-NSA所生成的孔洞修复检测器可将孔洞最高占比降低62.8%,且MHC-NSA的时间复杂度由传统NSA算法的指数阶降低到多项式阶.在UCI数据集Balance Scale上的实验表明, MHC-NSA的检测器训练时间较典型NSA算法代表RNSA, V-Detector和BIORV-NSA在分别降低53.73%, 96.43%和92.66%的同时,检测率分别提升69.57%, 44%和17.54%.

关键词

人工免疫系统; MHC; 否定选择算法; 孔洞; AIS; MHC; NSA; Holes;

摘要

本文关注敏感数据的隐私保护问题,开展满足差分隐私的分布式Logistic回归模型研究.通过对算法输出结果加扰动,实现分布式差分隐私.进一步,为了防止计算机信息交互过程中可能产生的隐私泄露,针对算法迭代过程加扰动的方式提出了基于Alternating Direction Method of Multipliers(ADMM)算法的分布式Logistic变量扰动算法,并给出算法的理论界估计.实验表明,所提算法可有效地处理分布式存储数据并保护其隐私.

关键词

差分隐私; 分布式算法; Logistic回归; ADMM算法; differential privacy; distributed algorithm; logistic regression; ADMM algorithm;

摘要

双目标最小生成树问题是一个NP-难问题,在光缆通信、智能控制等领域有其重要的应用价值.警示传播(warning propagation, WP)算法是一种基于因子图的消息传递算法,可用于求解组合优化问题.借助于Boltzmann机模型使一个无向图转换为因子图,将求解无向图上的双目标最小生成树问题映射为求解因子图上的对应问题,进而设计一种求解双目标最小生成树问题的警示传播算法.选取由随机数种子产生的若干随机数构造邻接矩阵,生成对应的无向图实例,数值实验结果表明,该算法优于同类算法.

关键词

双目标优化; 组合优化; 警示传播算法; 最小生成树; 因子图; double-objective optimization; combinatorial optimization; warning propagation algorithm; minimum spanning tree; factor graph;

Vol. 50, No. 9, 2020 封面 目录

摘要

过去20余年,在国家科技计划持续支持下,中国的高性能计算事业得到长足发展,目前,正在向EFlops级(百亿亿次级,简称E级)高性能计算机的目标冲刺.本文简要回顾了我国高性能计算发展的历史,针对当前E级计算所遇到的困难,从体系结构、处理器、互连网络、并行操作系统、并行编程、算法和可靠性等7个方面,探讨了需要重点研究和解决的技术问题.

关键词

E级计算机; 异构体系结构; 众核处理器; 互连网; 并行编程; exascale computer; heterogeneous architecture; many-core processor; interconnect; parallel programming;

摘要

人工智能(artificial intelligence, AI)自1956年诞生以来,在60多年的发展历史中,一直存在两个相互竞争的范式,即符号主义与连接主义(或称亚符号主义).二者虽然同时起步,但符号主义到20世纪80年代之前一直主导着AI的发展,而连接主义从20世纪90年代才逐步发展起来,到21世纪初进入高潮,大有替代符号主义之势.今天看来,这两种范式只是从不同的侧面模拟人类的心智(或大脑),具有各自的片面性,依靠单个范式不可能触及人类真正的智能.需要建立新的可解释和鲁棒的AI理论与方法,发展安全、可信、可靠和可扩展的AI技术.为实现这个目标,需要将这两种范式结合起来,这是发展AI的必经之路.本文将阐述这一思想,为叙述方便,我们称符号主义为第一代AI,称连接主义为第二代AI,将要发展的AI称为第三代AI.

关键词

人工智能; 符号主义; 连接主义; 双空间模型; 单空间模型; 三空间模型; artificial intelligence; symbolism; connectionism; dual-space model; single-space model; triple-space model;

关键词

量子信息技术;

Vol. 50, No. 8, 2020 封面 目录

人物风采

冯登国院士

Website Google Scholar
中国科学: 信息科学, 2020, 50(8): 1273-1274

摘要

公平性学习是机器学习领域的研究热点,预防歧视的目的在于执行预测任务之前消除不公平训练集对于分类器的影响.为了保证分类公平性和准确性,本文通过发现和消除原始数据集中的歧视样本寻找生成公平数据集的方法,即提出了一种基于分类间隔的加权方法用于处理二分类任务中的歧视现象,并在demographic parity和equalized odds公平性判定准则上实现分类公平.为了不影响分类准确性,本文基于最大间隔原理将样本投影之后选出目标集,对于目标集中的每个样本,通过加权距离度量方法判定该样本是否具有歧视性,并进行修正.通过在3个真实数据集上与已有方法进行实验对比,本文的方法能够获得更好的分类公平性和准确性,并且不局限于特定的公平性判定准则和分类器.

关键词

公平性学习; 分类间隔; 目标集; 加权距离度量; 歧视性; fairness learning; classification margin; target set; weighted distance metric; discriminatory;

论文

基于样本稳定性的聚类方法

Clustering method based on sample's stability

Website Google Scholar
李飞江, 钱宇华, 王婕婷, 梁吉业, 王文剑
中国科学: 信息科学, 2020, 50(8): 1239-1254

摘要

数据类型和分布的复杂化导致样本间关系的不确定性增强,给有效挖掘数据的潜在类簇结构带来挑战.为降低样本关系不确定性对数据聚类带来的影响,本文将聚类集成中样本稳定性概念扩展至聚类分析中.本文从理论上分析样本稳定的合理性,并提出基于信息熵的样本稳定性度量方法.此外,本文提出一个基于样本稳定性的聚类方法,该方法先将数据分为稳定样本集和不稳定样本集,然后挖掘稳定样本的团簇结构,并将不稳定样本划分至该团簇结构中.最后,本文通过二维人造数据和图像分割场景可视化显示样本稳定性的合理性,并在基准数据集上验证本文所提聚类算法的有效性.

关键词

机器学习; 无监督学习; 聚类分析; 样本稳定性; 稳定性理论; machine learning; unsupervised learning; clustering analysis; sample's stability; stability theory;

摘要

在多任务学习问题中,随机效应(random effects)可能同时存在于所有子任务中,而每个子任务又存在对应的稀疏效应(sparse effects).这在文本分析尤其在对电影评论的情感分析中,尤为常见.在本文中,我们提出一种用于数据中同时存在共享随机效应和特定稀疏效应的混合多任务学习模型,并命名为MSS (multi-task learning with shared random effects and specific sparse effects)模型.在模型的建立过程中,我们利用Bayes框架,针对不同效应的特点设定不同的先验分布和超参数.在模型的求解过程中,我们使用变分推断克服Bayes推断中的计算难题,使MSS模型在大规模数据分析中具备广泛的适应性.通过全面的模拟数据实验和真实数据实验的分析结果,我们展示了MSS模型在模型预测和变量选择方面同时具备随机效应模型(random effects models)和稀疏回归模型(sparse regression models)的优势,相比已有方法大幅提高泛化性能. MSS模型通过对多任务学习模型中不同效应的区分,能够更加有效的识别模型中的共享随机效应和特异稀疏效应,进而增强模型在模型预测和变量选择方面的性能.

关键词

多任务学习; 随机效应; 稀疏性; 变量选择; Bayes推断; multi-task learning; random effects; sparsity; variable selection; Bayesian inference;

论文

基于网络嵌入方法的耦合网络节点表示学习

Coupling network vertex representation learning based on network embedding method

Website Google Scholar
韩忠明, 刘聃, 郑晨烨, 刘雯, 段大高, 董健
中国科学: 信息科学, 2020, 50(8): 1197-1216

摘要

网络节点表示学习是网络数据分析挖掘中的一个基础问题,通过学习网络节点表示向量,可以更加精准地对网络节点进行表征.近年来,随着深度学习的发展,嵌入方法在网络节点表示学习方面得到了广泛应用.同时,网络数据在规模、模态等特征方面也有了很大的变化,研究重点从单网络分析挖掘逐渐演变至耦合网络分析挖掘.本文首先分析了嵌入方法在单网络节点表示学习中的研究现状,对比了现有方法的优劣.然后借鉴单网络中嵌入方法的思想,针对耦合网络提出了耦合网络嵌入模型CWCNE.针对耦合网络的特性,改进了嵌入方法中的游走算法,提出了一种网络间带约束的随机游走策略;同时改进了模型的训练方法,使用网络间迭代训练的方式来学习模型参数.最后使用了社交耦合网络、学术耦合网络、影视耦合网络、诗词耦合网络、著作耦合网络等5组数据集验证了CWCNE的有效性.并在社团划分、实体识别、标签分类等任务上取得了良好的结果.

关键词

网络嵌入; 节点向量; 耦合网络; 表示学习; 社团划分; 主体识别; 标签分类; network embedding; vertex vector; coupling network; representation learning; community detection; entity recognition; label classification;

摘要

基于内存计算模型的分布式数据处理系统,如Flink和Spark,经常遭受严重的内存压力,尤其在平台内存资源紧张,且被多个用户或组织共享情况下,内存资源竞争进一步加剧.用户应用被分配的内存空间不足,会在运行期间产生严重的垃圾回收(garbage collect, GC)开销,而分配过量的内存会导致平台资源的浪费.因此平台中如何为用户应用配置合适的内存成为关键问题.通过研究分析发现,平台上的多个应用会多次共同处理某个特定的数据集,且应用对数据的处理逻辑具有相似性,如图计算和机器学习应用;大数据应用框架的算子API和用户自定义方法 (UDF)与数据处理逻辑有着密切的关系,继而影响运行时内存的使用.基于该发现,本文提出了一种预估新提交应用的合理内存阈值的方法.该方法利用程序分析与历史应用处理数据特征分析,基于kTree判断与历史应用的数据路径的相似性来预估新应用的合理内存阈值,并在Spark系统上实现该方法.通过一系列实验评估预估的准确性和性能收益,实验结果表明本方法预估大数据应用的结果与真实合理内存阈值的误差比例低至4%,预估过程所产生的开销与应用运行时间相比可以忽略不计,平台上数据处理应用整体执行时间减少至56%.

关键词

内存管理; 生命周期; 代码诊断; 数据处理系统; 分布式系统; memory management; lifetime; program diagnostics; data-processing system; distributed system;

评述

安卓恶意软件检测方法综述

Android malware detection: a survey

Website Google Scholar
范铭, 刘烃, 刘均, 罗夏朴, 于乐, 管晓宏
中国科学: 信息科学, 2020, 50(8): 1148-1177

摘要

在过去的十几年间, Android系统由于其开源性、丰富的硬件选择性以及拥有百万级别应用市场等优点,已经迅速成为了目前最流行的移动操作系统.与此同时, Android系统的开源性也使其成为了恶意软件的主要攻击目标.恶意软件的快速增长给移动智能手机用户带来了巨大的危害,包括资费消耗、隐私窃取以及远程控制等.因此,深入研究移动应用的安全问题对智能手机生态圈的健全发展具有重要意义.本文首先介绍了恶意软件检测所面临的问题与挑战,然后综述了近些年的恶意软件检测所使用的数据集信息以及相关方法,将现有方法分为了基于特征码、基于机器学习以及基于行为3大类,并针对各方法所使用的技术进行了归纳总结,全面比较和分析了不同技术的优缺点.最后,结合我们自身在恶意软件检测方面的研究基础对未来的研究方向和面临的挑战进行了探索与讨论.

关键词

安卓; 恶意软件检测; 家族识别; 机器学习; Android; malware detection; familial identification; machine learning;

摘要

可信计算以硬件安全机制为基础,建立可信赖计算环境,从体系结构上全面增强系统和网络信任,是当前学术界和产业界的关注热点.随着信息技术的深入发展,新应用场景的不断涌现,网络空间的安全威胁日益严峻,因此可信计算在重要信息系统的安全防护领域将发挥越来越重要的作用.本文从创新发展角度,围绕作者20年来在可信计算领域的研究成果,综述了可信计算理论的发展历程,提炼总结出涵盖两大方法基础、三大信任核心和四大关键技术的可信计算技术体系,阐述了移动可信计算、抗量子可信计算、可信物联网、可信云、可信区块链等方面的重要研究问题以及可信计算在这些领域的融合创新成果.在移动可信计算方面,软硬件结合的可信执行环境体系架构设计和实现是研究重点,其次,移动操作系统内核运行时安全隔离防护,以及基于可信执行环境(trusted execution environment, TEE)的移动应用安全防护也是两个重要研究问题.在可信物联网方面,由于嵌入式环境本身的特性以及资源的受限,轻量级的信任根构建、高效安全的软件证明、实用的安全代码更新机制、集群设备证明是该领域有待进一步研究的重要问题.在抗量子可信计算、可信云、可信区块链等新型场景中,可信计算技术也在不断地拓展其应用边界,发挥更加重要的作用.最后本文展望和讨论了可信计算未来的发展趋势.

关键词

可信计算; 可信执行环境; 移动可信计算; 抗量子可信计算; 可信物联网; 可信云; 可信区块链; trusted computing; trusted execution environment; mobile trusted computing; quantum-resistant trusted computing; trusted Internet of Things; trusted cloud; trusted blockchain;

Vol. 50, No. 7, 2020 封面 目录

刊讯

脑影像与成瘾专题简介

Website Google Scholar
张毅, 袁凯, Gene-Jack WANG, 田捷
中国科学: 信息科学, 2020, 50(7): 1123-1124

关键词

尼古丁依赖; 物质依赖; 磁共振波谱技术; 吸烟者; 中枢机制;

论文

全天候自然场景下的人脸佩戴口罩识别技术

Mask-wearing recognition in the wild

Website Google Scholar
张修宝, 林子原, 田万鑫, 王艳, 沈海峰, 叶杰平
中国科学: 信息科学, 2020, 50(7): 1110-1120

摘要

日常生活中,面对经呼吸道传播的传染性疾病或厂矿生产过程中产生的扬尘沙土,人们佩戴口罩进行防护可保护身体健康和生命安全.人脸佩戴口罩的自动化识别可以有效监督人们佩戴口罩,是抑制疾病快速传播和保护身体健康的重要技术手段.对于生活和生产中的口罩佩戴识别的需求,本文提出了基于深度学习的人脸检测和口罩佩戴识别相结合的方法.该方法在人脸检测中利用特征融合金字塔,结合空间和通道注意力学习,以及分割分支进行神经网络弱监督学习.另外针对检测后的人脸子图像,采用图像分类的方法实现快速识别,并加入注意力学习机制,增强模型对口罩区域特征的学习.利用近20万的公开和企业自有数据,并采用数据增强等方法,在全天候自然场景下取得了99.50%的识别准确率.该技术已广泛应用于滴滴出行实际业务中,日均处理百万数量级的请求.该服务已对外开放,关键算法已开源,从而使其发挥更大的应用价值和社会价值.

关键词

口罩佩戴识别; 人脸检测; 人脸属性识别; 特征金字塔; 注意力学习; mask-wearing recognition; face detection; face attribute recognition; feature pyramid; attention;

摘要

景点推荐系统可以帮助游客过滤大量的无关信息,还能辅助商家发掘潜在的顾客.然而,现有的基于传统方法的推荐系统,如基于内容的推荐或协同过滤系统,虽推荐过程相对透明直观,但由于数据稀疏性的存在,推荐结果往往不够准确;基于深度学习的推荐方法,虽在一定程度上提高了推荐结果的精度,但由于缺乏可解释性和透明度,难以满足部分用户理解推荐依据的愿望,也阻碍了此类方法的推广应用.为了解决当前方法所存在的局限,本文引入基于知识图谱的景点推荐框架,将推荐过程与知识图谱嵌入相结合,推断用户兴趣在知识图谱上的传播路径,以此作为推荐依据.此外,本文通过对真实旅游数据的多角度时空分析,探究旅游活动的时空规律,并将其应用于景点推荐框架中,提出一种面向旅游的基于知识图谱的可解释推荐方法——Geo-RippleNet,并通过构建基于开放网络资源的旅游知识图谱,对Geo-RippleNet进行了全面的实验验证.结果表明,本文提出的基于知识图谱的景点推荐方法,不仅可以最大限度地吸收知识图谱丰富的语义信息,从而实现可观的性能提升,还能充分利用图谱的关系知识,推理兴趣传播路径,以增强推荐结果的可解释性.此外,将旅游活动的时空规律融入到上述推荐框架中,能够还原用户出游和决策的时空过程,进一步提高方法的性能表现.

关键词

旅游知识图谱; 景点推荐; 可解释性; 推荐系统; 旅游管理; tourism knowledge graph; attraction recommendation system; interpretability; recommendation system; tourism management;

摘要

随着网络信息的剧增,信息流服务备受用户关注.在信息流服务中,如何衡量文本之间的相关度进而从多来源的信息渠道中过滤掉冗余信息提升推荐满意度成为至关重要的环节.当前主流的文本相关度计算方法均是将文本表示为向量,进而通过衡量向量之间的相似度来度量文本间的相关度.然而,信息流中的文本多为新闻文本,这些文本的核心是其描述的事件,基于此需要从事件的角度挖掘文本的核心特征进而利用其计算文本间的相关度.当前针对事件的研究大多数着眼于句子级别.事实上,在计算文本相关度时,需要从篇章级别把握文章的内容.故此,篇章级的事件分析更有影响力.为此,本文在句子级事件抽取的基础上,提出了一种篇章级的事件表示方法,其利用句子级事件的抽取结果构建篇章事件连通图,并选取图中重要的节点作为篇章级事件的代表,之后利用篇章级的事件表示结果来度量文本之间的相关度.实验显示,本文提出的文本相关度计算方法要远好于传统的文本相关度计算方法.

关键词

篇章事件连通图; 篇章级事件相关度; 文本排序; 关键子句筛选; 子句连通图; passage event connection graph; passage-level event correlation; textrank; selection of key sentence; sentence-level connection graph;

摘要

地理知识是人类对地理现象或事物空间分布、演变过程和相互作用规律的认知结果.当前大数据环境下的地理信息服务,普遍存在"数据海量、信息爆炸、知识难求"现象.地理知识图谱是一种利用语义网络对地理概念、实体及其相互关系进行形式化描述的知识系统,在地理知识理解、地学问题求解、时空预测决策等方面具有巨大的应用潜力.地理知识除了具有通用知识的内涵和特点之外,还具有特定的时空特征和地学机理特点.因此,地理知识图谱构建和应用既具有一定的通用性,同时具有一定的专业特殊性.本文结合地理知识的时空特征和知识图谱的表达形式,提出了一种顾及时空特征的地理知识图谱构建方法.首先,系统梳理了地理知识图谱构建的基本思路和技术流程,并简要阐述了地理知识获取、地理知识抽象与表达、地理知识组织与管理3个关键环节的主要研究内容及其进展.其次,从地理学回答的基本问题出发,对地理知识的内容特征进行概括和抽象,构建了涵盖"地理概念–地理实体–地理关系" 3个层次的地理知识表达模型,用于描述不同粒度地理知识语义单元的基本组成及其逻辑关系.最后,借鉴知识图谱采用的语义网络知识表示方法,提出了基于"过程–关系"的地理知识表示方法.该方法以时间和空间特征为基本条件,以地理实体的状态划分为基础,实现了地理实体演化过程以及复杂地理关系的形式化描述.本文的研究成果有效解决了融合时空间维度的地理知识结构化表达和形式表示问题,为地理知识获取、融合、推理与应用奠定了基础.同时,在地质、环境、气象等地学领域具有一定通用性,对地学知识服务的推进具有重要参考价值.

关键词

地理实体; 时空特征; 地理知识表达模型; 地理知识形式化; 地理知识图谱; geographical entity; spatio-temporal feature; geographical knowledge representation model; geographical knowledge formalization; geographical knowledge graph;

摘要

一个准确丰富的人物关系图谱不仅能够为大众提供人物实体的清晰介绍和人物之间的相互关联,而且能够为智能服务系统提供有效的知识支持.目前大多知识来源均以百科类表格数据为起点,在此基础上构建知识图谱.本文主要描述如何充分利用百科类文本数据构建高质量的人物关系图谱.为解决表格数据中存在属性缺失和错误的问题,我们采用模式匹配和深度学习模型相结合的策略从文本数据中自动学习属性值,进行属性补全和纠错,有效提高了知识图谱的覆盖率和正确率.

关键词

知识图谱; 人物关系图谱; 属性补全与纠错; 信息抽取; knowledge graph; inter-personal relation knowledge graph; attribute identification; information extraction;

摘要

随着大数据对全球生产、流通、分配、消费等国计民生领域产生重要影响,事理作为认知智能重要概念,不仅帮助人们发现大数据所蕴含的国计民生的线索与发展规律,而且帮助人们更好认知人机物三元世界未来发展趋势.考虑到人机物事理动态演化是工业大数据有别于其他行业大数据处理的本质区别,本文从人机物事理动态演化特性智能认知着手,结合传统知识图谱在互联网领域取得的成功经验,提出了面向大数据领域的事理认知图谱构建与推断分析.首先论述了事理认知图谱对推动认知智能研究发展的贡献,剖析了它与知识图谱异同之处,深度理解人类社会发展变化规律的重要价值.其次阐述了事理抽取与泛化、多模态联合网络化合成表示、进化认知和推断分析等关键技术研究最新进展以及面临的挑战.最后,结合我们课题组在事理认知图谱的研究进展情况,归纳总结了事理认知图谱在预防网络电话诈骗和安全生产管控等领域最新应用效果.本文结尾总结和展望事理认知图谱的未来研究方向和发展前景.

关键词

工业大数据; 知识图谱; 事理认知; 人机行为演化分析; industrial big data; knowledge graph; event logic cognitive; analysis of human-machine behavior evolution;

摘要

以研究科学创新与演化规律为目的的科学学近年来迎来了进一步的发展,科技大数据领域知识图谱在其中发挥了重大的作用.本文将从科技大数据知识图谱构建及应用研究角度,对科学学研究过程中发挥重大推动作用的科技领域知识图谱技术进行系统、深入的综述,阐述科技大数据知识图谱构建过程中涉及的科技实体抽取、科技实体消歧、科技关系抽取、科技关系推断等问题,对科技实体推荐、科技社区发现、科技实体评价、学科交叉以及学科演化等科技大数据知识图谱分析挖掘方法进行系统梳理,并给出科技大数据知识图谱未来的研究及应用方向.

关键词

科技大数据; 科技领域知识图谱; 科学学; 科技数据挖掘; 图神经网络; big data of sci-tech; knowledge graph of sci-tech domain; science of science; sci-tech data mining; graph neural network;

领域大数据知识图谱专题 | 评述

基于知识图谱的推荐系统研究综述

A survey on knowledge graph-based recommender systems

Website Google Scholar
秦川, 祝恒书, 庄福振, 郭庆宇, 张琦, 张乐, 王超, 陈恩红, 熊辉
中国科学: 信息科学, 2020, 50(7): 937-956

摘要

推荐系统旨在为用户推荐个性化的在线商品或信息,其广泛应用于众多Web场景之中,来处理海量信息数据所导致的信息过载问题,以此提升用户体验.鉴于推荐系统强大的实用性,自20世纪90年代中期以来,研究者针对其方法与应用两方面,进行了大量广泛的研究.近年来,很多工作发现知识图谱中所蕴含的丰富信息可以有效地解决推荐系统中存在的一系列关键问题,例如数据稀疏、冷启动、推荐多样性等.因此,本文针对基于知识图谱的推荐系统这一领域进行了全面的综述.具体地,首先简单介绍推荐系统与知识图谱中的一些基本概念.随后,详细介绍现有方法如何挖掘知识图谱不同种类的信息并应用于推荐系统.此外,总结了相关的一系列推荐应用场景.最后,提出了对基于知识图谱的推荐系统前景的看法,并展望了该领域未来的研究方向.

关键词

知识图谱; 推荐系统; 协同过滤; 异质信息网络; 图嵌入; knowledge graph; recommender system; collaborative filtering; heterogeneous information network; graph embedding;

Vol. 50, No. 6, 2020 封面 目录

摘要

片段视频语义识别旨在识别视频中短小片段的语义概念,是视频分析的一项重要任务.由于片段视频的数量巨大且缺乏可参考的网络标签,片段视频的标记十分困难,通常只能对部分片段视频进行标记.如何利用有限的语义标签提高片段视频语义识别的准确率是一项关键挑战.因此本文提出了一种基于长短时预测一致性的视频语义识别算法.该算法通过引入完整视频语义与片段视频语义一致性的约束,对片段视频语义识别结果进行筛选,以此提高片段视频语义识别的准确率.本文提出的算法在大规模视频数据集YouTube-8M的片段视频语义识别任务上达到了82.62%的平均均值准确率(mean average precision, MAP)识别精度,在第三届YouTube-8M比赛中排名第二.

关键词

大规模视频语义识别; 片段视频语义识别; 语义一致性; 特征聚合; 预测可靠性; large-scale video semantic recognition; segment-level semantic recognition; semantic consistency; feature aggregation; reliable prediction;

摘要

近年来,视频数据资源的日益丰富催生了一系列对于视频片段精细检索的需求.在这样的背景下,对于跨模态视频片段检索的研究逐渐兴起,其旨在根据输入的查询文本,输出一段视频中符合文本描述的片段.现有的研究工作主要关注于查询文本与视频片段的全局或局部的特征表达,而忽略了查询文本与视频片段中所蕴含的语义关系在跨模态检索中的匹配.例如,给定查询文本"一个人在打篮球"时,现有检索系统将根据整个查询文本和的视频的特征,或者关注于文本与视频中所表现的实体(如"人","篮球")来计算合适的视频片段,而缺乏对于"人打篮球"这类语义关系的考虑.因此,它们将难以辨别语义关系上的不同,从而限制了检索质量的提升.为了解决这个问题,本文提出跨模态关系对齐的图卷积框架CrossGraphAlign,通过分别构建文本关系图(textural relationship graph)与视觉关系图(visual relationship graph)来建模查询文本与视频片段中的语义关系,再通过跨模态对齐的图卷积网络来评估文本关系与视觉关系的相似度,从而帮助构建更加精准的视频片段检索系统.在公开的跨模态视频片段检索数据集TACoS和ActivityNet Captions上的实验结果表明,本文提出的方法可以有效地利用语义关系来提升跨模态视频片段检索的召回率.

关键词

关系对齐; 语言关系; 视觉关系; 图卷积网络; 跨模态视频片段检索; relationship alignment; textual relationship; visual relationship; graph convolutional network; cross-modal video moment retrieval;

摘要

随着万维网的发展,知识图谱数据大量增长,并在面向智能应用的研究中受到广泛关注.知识图谱用RDF (resource description framework)三元组描述实体相关的事实.在知识图谱中,关于一个实体的描述可能包含大量三元组,在一些需要直接呈现实体信息的应用中,为了避免用户信息过载,并适应有限的呈现空间,就需要进行实体摘要.实体摘要任务是从实体描述的众多三元组中选出最有代表性的子集作为摘要,以呈现给用户阅读.本文提出一种新的实体摘要方法 ESSTER以生成具备高可读性和低冗余性的实体摘要.该方法结合三元组的结构与文本特征,基于结构特性度量知识图谱中三元组的重要性,基于N元语法和文本语料度量三元组的可读性,基于逻辑推理、数值比较和文本相似判断三元组间的冗余关系.综合这3种技术要素,将实体摘要问题建模为组合优化问题进行求解.本文在两个由人工标注的公开数据集上与6种现有方法进行了对比实验,结果表明本文提出的方法效果达到了当前最佳水平.

关键词

知识图谱; 实体摘要; 冗余性; 可读性; 组合优化; knowledge graph; entity summarization; redundancy; readability; combinatorial optimization;

摘要

识别海量变量间潜在的复杂关联关系,判断不同形式关联关系的强弱,是大数据关联关系挖掘的重要任务之一.然而,数据分布的不确定性、关联关系的多样性,使得基于分布假设的关联关系度量和基于数据驱动的非参数度量方法的适用性、准确性难以保证.因此,设计一种对关联关系形式无偏的有效关联度量方法变得至关重要.本文从大数据背景下潜在关联关系应被公平排序的需求出发,回顾了目前关联度量的公理化条件,给出了大数据关联关系度量可能需满足的性质;讨论了两类基于邻域视角的度量方法存在的不足;提出了本文基于k-NN粒的关联度量方法,称为最大邻域系数.人造数据集和真实数据集实验从不同角度验证了本文所提方法的有效性和优越性.最后指出了实验中发现的有趣现象和有待解决的理论问题,以引起对该领域更深入的思考和研究.

关键词

大数据; 复杂关联关系挖掘; 关联度量; 数据驱动; 粒计算; k-NN粒; big data; complex associations mining; association measure; data-driven; granular computing; k-NN granule;

摘要

在基于深度网络的自然语言处理任务中,嵌入表示层用词向量刻画词的语义信息,可以有效地提升模型性能.词向量可以和当前任务一起端到端地进行学习,但是从模型参数数量的角度来看,词向量的训练很容易在小语料库上过拟合.为了解决这个问题,通常会使用在大语料库上预训练得到的词向量.首先,本文总结了几种常见的复用预训练词向量的方法.其次,由于当前任务的变化,会有一些新词出现,这些新词的词向量不能通过预训练的词向量获得,因此本文提出了一种保持语义关系的词向量复用算法(SrpWer). SrpWer首先对当前数据集中词语之间的关系进行建模,然后结合预训练的词向量生成新词对应的词向量.实验结果验证了SrpWer的有效性.

关键词

自然语言处理; 词向量; 模型复用; 新词; 深度学习; natural language processing; word embeddings; model reuse; new words; deep learning;

摘要

集成特征选择算法将多种特征选择方法结果结合在一起,旨在得到更加有效的特征子集.然而这些算法通常假设每种特征选择方法是平等的,没有考虑不同特征选择方法性能的差异性,导致少数方法选择出的有效特征被忽略.为解决这一问题,本文提出一种可以有效地结合不同特征选择方法优势,并利用专家的知识逐步改善所选特征的交互式特征选择方法.该方法包括一个基于众包学习的集成特征选择算法和一个基于该算法开发的可视分析系统.基于众包学习的集成特征选择算法利用众包学习模型对不同特征选择方法的性能进行建模,计算每种方法的可靠性,并在此基础上将这些方法的结果有机融合.可视分析系统提供了丰富的排序方式,帮助专家理解单个特征选择方法的特征选择结果和特征在分类任务中所起的作用,从而让专家交互迭代地改善现有特征子集.在4个真实世界数据集上的数值实验表明,相比于现有的集成特征选择算法,本文提出的算法能够带来0.63%~2.85%分类准确率的提升.此外,在文本和图像数据集上进行的两个案例分析表明,本文提出的可视分析系统能够进一步带来0.28%~5.24%的分类准确率提升.

关键词

集成特征选择; 众包学习; 可视分析; 交互式可视化; 排序可视化; ensemble feature selection; learning-from-crowds; visual analysis; interactive visualization; ranking visualization;

大数据分析专题 | 论文

元自步学习

Meta self-paced learning

Website Google Scholar
束俊, 孟德宇, 徐宗本
中国科学: 信息科学, 2020, 50(6): 781-793

摘要

自步学习是近年来机器学习领域提出的一种启发于人和动物"由易到难"学习过程的学习机制.尽管自步学习已取得可喜的理论与应用进展,但是当前的自步学习算法仍存在超参数选择的瓶颈问题.针对该问题当前主要采用一些启发式的手工设计方法或者交叉验证方法,然而此类方法效率很低,缺乏理论性指导,难以推广应用到广泛的实践问题中.针对这一挑战性问题,本文提出一种基于元学习机理的自步学习算法,该方法能使自步学习中涉及的超参数以数据驱动的方式自动习得,从而大大减弱了自步学习的这一核心问题.特别地,我们针对3种典型的自步学习实现格式,将所提元学习策略实质性嵌入,通过回归和分类实验验证了所提算法的准确性和泛化性,特别验证了相比于传统超参设置方法的显著优越性.

关键词

自步学习; 元学习; 样本加权; 噪声标记下学习; 超参数选择; self-paced learning; meta learning; sample re-weighting; learning with noisy labels; hyper-parameter tuning;

大数据分析专题 | 编者按

大数据分析专题编者按

Website Google Scholar
周志华, 张敏灵
中国科学: 信息科学, 2020, 50(6): 779-780

关键词

特征选择算法; 特征选择方法; 冗余性; 文本关系; 数据挖掘;

Vol. 50, No. 5, 2020 封面 目录

摘要

针对三维点云形状修复补全中难以保持形状精细结构信息的问题,借助于生成对抗网络框架,本文提出了一种自动修复补全三维点云形状的神经网络结构.该网络由生成器和判别器构成.神经网络的生成器采用编码器–解码器结构,以缺失的三维点云形状作为输入,首先通过输入变换和特征变换对齐输入点云数据的采样点位置与特征信息;然后借助权共享多层感知器对各采样点提取局部形状特征并利用最大池化层与多层感知器编码提取出采样点的特征码字;其次将采样点特征码字加上网格坐标数据,解码器使用2个连续的三层感知器折叠操作将网格数据转变成点云形状的缺失补全数据;最后将缺失补全数据与点云输入数据合并,得到完整的三维点云形状.神经网络的判别器则接收真实的完整点云形状数据和生成器生成的完整点云形状数据,并利用与生成器相同的编码器结构判别出点云形状数据的真假并反馈以不断优化生成器,最终使生成器生成足以"以假乱真"的点云形状数据样本.实验表明,针对形状缺失的稠密点云和稀疏点云数据,本文方法在修复补全形状缺失部分的同时能有效保持输入点云形状的精细结构信息.

关键词

生成对抗网络; 编码器–解码器结构; 点云数据; 形状补全; 折叠操作; generative adversarial network(GAN); encoder-decoder structure; point cloud; shape completion; folding operation;

论文

基于模型分解的小样本学习

Few-shot learning via model composition

Website Google Scholar
叶翰嘉, 詹德川
中国科学: 信息科学, 2020, 50(5): 662-674

摘要

机器学习依赖大量样本的统计信息进行模型的训练,从而能对未知样本进行精准的预测.搜集样本及标记需要耗费大量的资源,因而如何基于少量样本(few-shot learning)进行模型的训练至关重要.有效的模型先验(prior)能够降低模型训练对样本的需求.本文基于元学习(meta learning)框架,从相关的、类别不同的数据中学习模型先验,并将这种先验应用于新类别的少样本任务.与此同时,本文提出"模型组合先验"(MCP, model composition prior)方法,通过目标函数的最优条件对模型结构进行分解,并分别估计模型的各个组成部分,得到有效的分类器.这种分解方式具有较高的可解释性,能够指导在不同小样本任务中"共享"与"独立"的成分,从而指导元学习的具体实现.在人造数据中,本文方法能够恢复出小样本任务之间的关联性;在图像数据上, MCP方法能取得比当前主流方法更优异的效果.

关键词

小样本学习; 元学习; 模型先验; 模型分解; few-shot learning; meta-learning; model prior; model composition;

论文

面向多源关系数据的融合

Multi-source relational data fusion

Website Google Scholar
丁玥, 王涓, 卢卫, 荣垂田, 杜小勇
中国科学: 信息科学, 2020, 50(5): 649-661

摘要

针对"信息孤岛"中的关系数据融合问题,本文提出并实现了多源关系数据融合的基本框架(multi-source relational data fusion, MSF).框架包含3个主要模块:模式匹配、实体对齐、实体融合.模式匹配面向多源关系数据的属性对齐问题,结合属性值的多维特征,提出基于匈牙利(Hungarian)算法的属性间对齐发现机制,实现了多源关系数据的快速模式匹配.实体对齐连接多源关系中的元组对,通过引入多样性取样策略和实体特征抽取方法,提升了实体对齐的效果.最后将对齐实体进行融合,为数据分析提供统一的数据视图.为了验证MSF的效果和效率,实现了数据融合系统DataPuzzle,并在该系统上,结合真实公开的多领域数据,对提出的方法进行了验证.结果表明,所提出的方法可以高效地实现数据融合,具有较高的查全率、查准率.

关键词

多源异构数据; 关系数据; 信息孤岛; 模式匹配; 实体对齐; 数据融合; multi-source heterogeneous data; relational data; information isolated island; schema matching; entity alignment; data fusion;

论文

RLO: 一个基于强化学习的连接优化方法

RLO: a reinforcement learning-based method for join optimization

Website Google Scholar
张心怡, 张智鹏, 张铁赢, 崔斌, 范举
中国科学: 信息科学, 2020, 50(5): 637-648

摘要

连接优化是数据库领域最重要的研究问题之一.传统的连接优化方法一般应用基础启发式规则,他们通常搜索代价很高,并且很难发现最优的执行计划.主要原因有两个:(1)这些基于规则的优化方法只能探索解空间的一个子集,(2)他们没有利用历史信息,不能够很好地衡量执行计划的代价,经常重复选择相同的糟糕计划.为了解决以上两个问题,我们提出RLO (reinforcement learning optimization),一个基于强化学习的连接优化方法.我们将连接优化问题建模成马尔可夫(Markov)决策过程,并且使用深度Q-学习来估计每一种可能的执行计划的执行代价.为了进一步增强RLO的有效性,我们提出了基于树形结构的嵌入方法和集束搜索策略来尽量避免错过最好的执行计划.我们在Apache Calcite和Postgres上实现了RLO.实验表明:(1)在Apache Calcite上,与一系列剪枝的启发式算法相比, RLO搜索计划的效率为它们的10~56倍,并且生成的计划能更快地执行(80%的加速);(2)与原生的Postgres相比, RLO搜索计划的效率是其14倍,并且在端到端的执行中达到12.9%的加速.

关键词

连接优化; 强化学习; 嵌入方法; 集束搜索; join optimization; reinforcement learning; embedding method; beam search;

论文

Apache IoTDB的分布式框架设计

The design of Apache IoTDB distributed framework

Website Google Scholar
李天安, 黄向东, 王建民, 毛东方, 徐毅, 袁骏
中国科学: 信息科学, 2020, 50(5): 621-636

摘要

Apache IoTDB是一个新型的开源时序数据库管理系统.分布式数据管理系统不仅需要解决数据分区与多副本带来的节点间元数据同步问题,还要支持高效查询请求处理.本文针对节点间元数据同步问题提出了双层粒度元数据管理策略,在此基础上基于一致性哈希分区方法和Raft协议设计了同时支持强一致性查询和最终一致性查询的分布式框架.基于单机版Apache IoTDB进行了系统实现与实验测试,测试结果表明:双层粒度元数据管理策略与单层粒度管理策略相比,其元数据内存资源占用更少且写入性能提升5%~10%,并且分布式Apache IoTDB的读写性能随着集群规模的扩大而线性增长.

关键词

物联网数据库; 时间序列; 分布式框架; Raft协议; 元数据; 强一致性; 最终一致性; IoT database; timeseries; distributed framework; Raft protocol; metadata; strong consistency; eventual consistency;

Vol. 50, No. 4, 2020 封面 目录

快报

稳健人脸感知方法在人体测温系统中的应用

Website Google Scholar
钱建军, 程曦, 闫梦凯, 高以成, 杨健
中国科学: 信息科学, 2020, 50(4): 617-618

论文

DNS权威服务器FPGA加速技术研究

Research on FPGA acceleration technology of DNS authoritative server

Website Google Scholar
李成龙, 李韬, 韩玉浩, 冯振乾, 王宝生
中国科学: 信息科学, 2020, 50(4): 576-587

摘要

现有DNS权威服务器处理DNS请求及响应报文依赖软件网络协议栈, CPU资源占用率高、开销大,处理性能受限.本文基于SmartNIC架构对DNS权威服务器的功能进行卸载加速,提出并设计了高性能DNS权威查询响应流水线PHDR Pipe (perfect Hash DNS response pipeline),基于完美哈希(perfect Hash)实现对区文件的预先处理,避免哈希冲突导致的多次访存,降低流水线最坏情况下处理延迟,从而有效提升系统吞吐率并降低响应延迟.基于开源的FAST平台的实验结果表明,与通用的BIND9系统相比响应延迟降低了约10倍,吞吐量接近10 Gb链路线速,同时资源开销小且具有良好的可扩展性.

关键词

DNS; 权威服务器; 完美哈希; FPGA; 加速; DNS; authoritative server; perfect Hash; FPGA; accelerate;

摘要

随着谷歌知识图谱、DBpedia、微软Concept Graph、YAGO等众多知识图谱的不断出现,根据RDF来构建的知识表达体系越来越为人们所熟知.利用RDF三元组表达形式成为人们对现实世界中知识的基本描述方式,由于其结构简单、逻辑清晰,所以易于理解和实现,但也因为如此,当其面对现实中无比繁杂的知识和很多常识时,往往也无法做到对知识的认识面面俱到,知识图谱的构建过程注定会使其中包含的知识不具有完整性,即知识库无法包含全部的已知知识.此时知识库补全技术在应对此种情形时就显得尤为重要,任何现有的知识图谱都需要通过补全来不断完善知识本身,甚至可以推理出新的知识.本文从知识图谱构建过程出发,将知识图谱补全问题分为概念补全和实例补全两个层次:(1)概念补全层次主要针对实体类型补全问题,按照基于描述逻辑的逻辑推理机制、基于传统机器学习的类型推理机制和基于表示学习的类型推理机制等3个发展阶段展开描述;(2)实例补全层次又可以分为RDF三元组补全和新实例发现两个方面,本文主要针对RDF三元组补全问题沿着统计关系学习、基于随机游走的概率学习和知识表示学习等发展阶段来阐述实体补全或关系补全的方法.通过对以上大规模知识图谱补全技术研究历程、发展现状和最新进展的回顾与探讨,最后提出了未来该技术需要应对的挑战和相关方向的发展前景.

关键词

知识图谱; 知识库补全; 概念补全; 实例补全; knowledge graph; knowledge base completion; concept completion; instance completion;

评述

人机对抗智能技术

Intelligent technologies of human-computer gaming

Website Google Scholar
黄凯奇, 兴军亮, 张俊格, 倪晚成, 徐博
中国科学: 信息科学, 2020, 50(4): 540-550

摘要

人机对抗作为人工智能研究的前沿方向,已成为国内外智能领域研究的热点,并为探寻机器智能内在生长机制和关键技术验证提供有效试验环境和途径.本文针对巨复杂、高动态、不确定的强对抗环境对智能认知和决策带来的巨大挑战,分析了人机对抗智能技术研究现状,梳理了其内涵和机理,提出了以博弈学习为核心的人机对抗智能理论研究框架;并在此基础上论述了其关键模型:对抗空间表示与建模、态势评估与推理、策略生成与优化、行动协同与控制;为复杂认知与决策问题的可建模、可计算、可解释求解奠定了基础.最后,本文总结了当前应用现状并对未来发展方向进行了展望.

关键词

人工智能; 人机对抗; 机器学习; 智能博弈; 认知决策; artificial intelligence; human-computer gaming; machine learning; autonomous intelligent gaming; command and decision making;

Vol. 50, No. 3, 2020 封面 目录

刊讯

区块链应用中的安全隐私专题简介

Website Google Scholar
仲盛, 黄欣沂
中国科学: 信息科学, 2020, 50(3): 461-462

关键词

区块链; 安全隐私; 比特币;

摘要

步态特征识别是生物特征识别的一种,在大量实际场景中有广泛的应用.目前,基于深度学习的方法在步态识别任务中表现出较好的准确率.但是,在对机器学习的研究中,人们不仅希望得到精确的预测,还希望算法对识别结果进行解释,以便人们理解实际问题中的关键.深度神经网络的黑盒属性使得解释其识别依据非常困难.在已有的步态识别文献中,关注可解释性的研究尚处于空白状态.另外,深度神经网络需要大量数据来学习模型参数,在问题规模较小时难以有效地在未见数据上泛化.本文探索了一种兼具准确性和可解释性的步态识别方法.将步态特征表示为多维时间序列,使用一种基于Shapelet的时间序列分类方法进行步态识别. Shapelet是时间序列中最具有辨别性的子序列,基于Shapelet的时间序列分类方法能够提供较好的可解释性,同时可以提供较高的准确率.我们在CASIA-B数据集上进行了实验,和几种较新的深度学习方法进行了比较.实验表明,本文提出的方法在较小规模的数据集上能够提供与深度神经网络接近的准确率.与此同时,还能详细具体地解释模型的决策依据,即哪些特征在视频哪几帧的表现对某个个体而言最具辨别性.

关键词

步态识别; 时间序列; Shapelet; 随机森林; 可解释性; gait recognition; time series; Shapelet; random forest; interpretability;

Vol. 50, No. 2, 2020 封面 目录

刊讯

计算机视觉中的深度学习专题(2020)简介

Website Google Scholar
白翔, 庞彦伟, 章国锋
中国科学: 信息科学, 2020, 50(2): 303-304

关键词

深度学习; 显著性检测; 场景文本;

摘要

传统的区块链结构,由于其固有的响应速度慢,不能适应大规模实时响应的应用场景,本文针对这一问题,提出了一种DAG (directed acyclic graph)区块链理论架构,将传统区块链的链式处理过程转变为并行的处理过程,使得快速响应成为可能.在此基础上,面向DAG区块链环境中非独立任务调度问题,提出了基于确定性退火技术的混合分割遗传任务调度算法.实验结果显示,该算法能够适应DAG区块链节点的异质性、动态性和广域性,其调度的性能也比传统的调度算法有所改善,在优化任务完成时间的同时,兼顾了负载均衡问题,有效地提高了响应速度,是解决DAG区块链环境中非独立任务调度问题的可行方法.

关键词

有向图; 遗传算法; 并行; 任务调度; 优化; 负载均衡; directed graph; genetic algorithms; parallel; task-scheduling; optimization; load balancing;

摘要

医学图像融合的目的是将多幅多模态医学图像的信息整合到一幅图像上,此图像有助于临床诊断,帮助医生精确观察细微病变,缩短病人的治疗周期.本文提出了一种新的解剖图像和功能图像的融合算法,选取了局部拉普拉斯滤波(local Laplacianfiltering, LLF)作为融合过程的分解工具,该工具在增强细节的同时保护边缘,保证解剖图像的细节信息不被功能图像的颜色信息遮盖.首先,利用LLF将原图像分解为近似图和一系列细节图.其次,对于近似图,结合区域能量和边缘能量提出一个改进的局部能量取大的融合规则;对于细节图,采用参数自适应的简化脉冲耦合神经网络(parameteradaptive simplified pulse coupled-neural network, PA-SPCNN)模型进行细节图融合,选取改进的拉普拉斯和(novel sum-modified-Laplacian, NSML)与彩色显著特征信息(color saliency feature, CSF)分别作为解剖图像和功能图像所对应的PA-SPCNN模型的外部刺激输入.最后,使用逆LLF变换获得融合图像.仿真实验表明本文所提算法在主观评价和客观评估方面与已有算法相比具有一定优势.

关键词

图像处理; 图像融合; 医学图像处理; 局部拉普拉斯滤波; 脉冲耦合神经网络; 拉普拉斯和; 彩色显著特征; 边缘能量; image processing; image fusion; medical image processing; local Laplacian filtering; pulse-coupledneural-network; novel sum-modified-Laplacian; color saliency feature; edge energy;

论文

基于层次化混合特征图的链路预测方法

Research on a link-prediction method based on a hierarchical hybrid-feature graph

Website Google Scholar
李冬, 申德荣, 寇月, 林梦儿, 聂铁铮, 于戈
中国科学: 信息科学, 2020, 50(2): 221-238

摘要

现实世界中的实体连同关联关系构成了一种网络关系结构即异构信息网络.利用链路预测技术可以预测出异构信息网络中存在但未被观察到,或者未来可能会出现的链路,更好地帮助用户理解网络的结构生成和演化规律.然而,目前链路预测技术缺乏对多种特征的有效融合而影响预测准确性,且难以适应异构信息网络的异构性和动态性.本文提出了一种层次化混合特征图模型(hierarchical hybrid feature graph, HHFG),充分考虑了异构信息网络的拓扑特征、语义特征和时序特征.提出了一种基于HHFG的链路预测算法,基于混合特征在HHFG上做随机游走,并采用梯度下降法学习特征权重,转移系数等参数,有效地保证了链路预测的准确性.通过实验验证了本文所提出的关键技术的可行性和有效性.

关键词

链路预测; 层次化混合特征图; 异构信息网络; 随机游走; 参数学习; link-prediction; hierarchical hybrid-feature graph; heterogeneous information networks; random walk; parameters learning;

摘要

随着物联网、云计算和大数据等技术的发展,人类正迈入第四次工业革命时代.工业互联网作为建立在生产对象之间、对象与外部环境之间、对象与人之间高度协同、共享智能的全球性网络,是实现这场革命的核心.然而目前对工业互联网的研究大多局限在物联网、云计算和大数据等各自辖域,其云端协同尚处于"感、联、知、控"的初级阶段,尤其缺乏云端融合、共享智能的体系结构及关键技术,无法应对其中感知对象更加复杂、联网实体更加多元、数据处理更加快速、反馈控制更加智能等需求.为此,本文首先重点调研和归纳了该研究领域所涉及的几个重要方向的研究现状和面临挑战;在此基础上,提出一个云端融合的工业互联网新型体系结构及相关关键技术的解决方案;之后,针对智能制造领域的具体应用场景,将所提相关技术进行应用;最后,总结全文并展望了云端融合的工业互联网未来发展趋势.

关键词

工业互联网; 云端融合; 体系结构; 云计算; 大数据; industrial Internet; synergy of cloud and client; architecture; cloud computing; big data;

Vol. 50, No. 1, 2020 封面 目录

摘要

判别相关滤波跟踪算法通过对中心目标块(唯一准确正样本)循环移位获取训练集,依赖潜在样本周期延拓假设,使得模型训练和检测可以通过快速傅里叶变换高效完成,然而整个学习过程没有对真正的背景信息进行建模.背景感知相关滤波(BACF)跟踪算法利用一个二进制掩码矩阵通过密集采样的方法获取真正的正、负样本对目标外观进行建模,然而BACF算法在学习相关滤波器时并没有考虑滤波器的时间一致性和空间一致性信息,当目标出现外观突变时,学习到的相关滤波器将会偏向背景而发生漂移.为了解决学习到的相关滤波器适应连续帧之间的外观突变问题,本文在基准BACF算法框架下引入时间一致性约束项和空间一致性约束项,提出了学习时空一致性相关滤波(TSCF)跟踪算法.时间一致性约束项在时间序列意义上起到平滑多通道相关滤波的作用;空间一致性约束项在空间分布意义上平滑多通道相关滤波,使得学习到的相关滤波能量分布更加均匀.本文的TSCF模型有闭式解,采用共轭梯度下降法迭代逼近模型的最优解,且优化过程利用循环矩阵性质转化到傅里叶域快速求解,有效降低计算大型矩阵的代价.本文的TSCF算法跟踪结果在TB100公开数据库上显示,距离精度较基准BACF算法提升了5.5%,成功率曲线图线下面积(AUC)提升了4.3%,纯手工特征跟踪性能在TB100数据库上100个视频的跟踪距离精度达到0.879, AUC为0.664,结果展示本文的TSCF算法在遇到诸如短时间遮挡和面内旋转或面外旋转等挑战性问题时具有一定的鲁棒性和有效性.

关键词

视觉跟踪; 相关滤波; 时空一致性; 正则化; 共轭梯度下降; visual tracking; correlation filter; temporal-spatial consistency; regularization; conjugate gradient descent;

摘要

砂岩薄片鉴定是矿物学和采矿工程中的一个重要步骤,其基础是将砂岩薄片图像包含的矿物颗粒分割到独立区域.不同于一般图像分割问题,砂岩薄片图像中包含大量矿物颗粒,且相邻颗粒之间边界模糊,通用的图像分割方法难以适用.本文利用多角度砂岩薄片图像,使用卷积神经网络和模糊聚类技术,提出一种3阶段颗粒分割方法.第1阶段,将输入的多角度砂岩图像预分割成超像素集合.第2阶段,根据砂岩矿物特点构建卷积神经网络RockNet,先使用带标签的砂岩矿物颗粒图像库训练RockNet,然后将之用于提取超像素语义特征.第3阶段,提出区域合并方法 FCoG,该方法融合多特征用于聚类和合并超像素,并生成最终的矿物颗粒.对采集自多个地区和不同地质年代的砂岩薄片图像数据集进行实验,结果表明本文方法的有效性,其性能明显优于其他分割方法.

关键词

砂岩薄片图像; 图像分割; 神经网络; 模糊聚类; 特征提取; sandstone thin section images; image segmentation; neural networks; fuzzy clustering; feature extraction;

评述

大数据安全技术研究进展

Research progress on big data security technology

Website Google Scholar
陈性元, 高元照, 唐慧林, 杜学绘
中国科学: 信息科学, 2020, 50(1): 25-66

摘要

大数据是经济发展的新动能,社会发展的新引擎,塑造国家竞争力的战略制高点,对人民生活具有重大影响.然而随着社会对数据价值认知的提升和大数据平台建设的蓬勃发展,大数据安全问题日益成为阻碍大数据应用推广的瓶颈.同时,由于大数据技术、框架仍在不断演变当中,研究人员对大数据安全内涵的核心认知和关键特征理解还存在差异,尚未形成相对统一的大数据安全框架.当前亟需对大数据安全技术发展现状进行梳理,为大数据安全重点问题的研究和突破提供参考.本文结合典型大数据系统技术框架,围绕大数据安全需求,构建了大数据安全技术框架.在此框架下,从大数据安全共享与可信服务、大数据平台安全和大数据安全监管3个方面系统梳理了大数据安全关键技术的研究现状,囊括了大数据业务流程和大数据系统技术框架所涉及的主要安全机制.最后总结了大数据安全技术有待解决的核心问题和发展趋势.

关键词

大数据安全; 安全技术框架; 数据安全共享; 平台安全; 安全监管; big data security; security technology framework; data secure sharing; platform security; security supervision;

摘要

能耗问题已经成为阻碍数据中心进一步发展的主要障碍之一.为了解决这个问题,近年来,学术界和工业界涌现了大量的数据中心能效优化研究.本文针对数据中心节能问题,首次从跨层能效优化的角度对国内外的研究现状进行分类和介绍,包括基于IT负载调度的制冷系统能效优化、基于IT负载调度的供电系统能效优化,以及IT系统与制冷系统跨层统一能效优化3个方面,并展望了数据中心跨层能效优化研究的发展趋势.

关键词

能耗; 数据中心; 能效算法; 资源管理; 绿色计算; energy consumption; data center; energy efficient algorithms; resource management; green computing;

Vol. 49, No. 12, 2019 封面 目录

刊讯

计算机视觉中的深度学习专题简介

Website Google Scholar
庞彦伟, 白翔, 章国锋
中国科学: 信息科学, 2019, 49(12): 1659-1659

关键词

深度学习; 智能驾驶; 点云数据; 三维物体;

摘要

建筑物三维重建在城市规划、灾害监测、智慧城市等领域有重要应用,是计算机视觉、摄影测量、遥感等领域研究的重要课题.由于SAR成像机理的特殊性和复杂性,基于SAR图像的建筑物三维重建难度很大,现有方法的适用性和自动化程度都亟待提升.本文构建了基于深度学习与雷达成像机理结合的SAR图像建筑物检测及三维重建整体框架,并提出了基于耦合等效复数卷积神经网络的SAR图像建筑侧立面检测方法,基于RaySAR的建模仿真及点云生成方法,以及基于3D生成网络的SAR建筑物三维重建方法,利用TerraSAR-X与GF-3高分辨率SAR图像进行实验,得到了较好的三维重建结果.本文方法为SAR图像目标三维重建提供了新的技术途径,是SAR目标三维重建的有益尝试.

关键词

SAR; 深度学习; 语义分割; 点云生成; 建筑物检测; 三维重建; SAR; deep learning; semantic segmentation; point cloud generation; building detection; 3D reconstruction;

摘要

群智感知系统通过对高维感知数据的发布和分析为人们带来巨大数据价值的同时,也给参与者的隐私带来了极大的隐患.目前,各种基于差分隐私的隐私保护方法被提出,但大部分方法不能同时解决高维感知数据间复杂的属性关联问题和来自不可信服务器的隐私威胁问题.基于此,本文提出了基于Bayes网络的高维感知数据本地隐私保护发布机制.该机制实现了用户端的本地数据保护,杜绝了其他方直接访问用户原始数据的可能,根本上保护了用户的数据隐私.感知服务器端在接收到用户本地隐私保护的数据后,基于Bayes网络方法对高维数据的维度相关性进行识别,将高维数据属性集划分为多个相对独立的低维属性集,进而依次合成新的数据集,可以有效地保留原始感知数据的属性维度相关性,保证合成数据集与原始数据集具有尽可能相似的统计特性.通过大量仿真实验验证了该方法的有效性,实验结果表明该方法在有效的本地隐私保护下的合成数据具有较高的数据效用性.

关键词

群智感知系统; 感知数据; 高维数据; 本地差分隐私; Bayes网络; crowd sensing system; crowdsourced data; high-dimensional data; local differential privacy; Bayesian network;

摘要

聚类是数据挖掘和机器学习中的基本任务之一.传统聚类方法由于其设计中对簇结构假设的限制,导致算法在不符合其假设的数据集上,尤其是大型高维数据集上的聚类效果较差.本文引入了最大平均熵率的概念,设计了一种基于图的关联聚类算法.该算法将关联聚类问题分解为多个独立的单类优化问题,并利用邻域消除了关联聚类对大数据的限制.算法实现通过启发式邻域搜索和类生成简化了对最优邻域和关联聚类的求解过程,并且设计了适应分布式计算平台的图迭代方法.与其他聚类算法相比,该算法在提高计算效率的同时,对簇结构假设相对灵活,可适用于多种分布数据.在聚类实验中,算法的f1-measure和purity指数均好于其他6种聚类算法,而且对于高维大数据集,算法的运行时间远远低于其他聚类算法.

关键词

聚类; 相关聚类; 熵率; 图聚类; 大数据; clustering; correlation clustering; entropy-rate; graph-based clustering; big data;

Vol. 49, No. 11, 2019 封面 目录

评述

虚拟现实技术专利导航分析综述

Virtual reality patent navigation analysis: a review

Website Google Scholar
周静, 贾宏君, 乔开文, 马跃, 张铭, 刘杰, 张柏秋, 张浩, 王欣, 谢祥, 王峻岭, 郭英, 张凌宇
中国科学: 信息科学, 2019, 49(11): 1451-1471

摘要

专利导航是利用专利信息资源,引导和支撑技术与产业良性发展的基础性研究与推广工作.本文综述了由国家专利导航项目(高校)研究和推广中心完成的《虚拟现实相关技术专利导航分析报告》的部分成果,该报告对我国以及全球主要国家和地区在虚拟现实技术领域的专利申请进行了分析,从专利视角绘制了关键技术研发路线,导航相应的知识产权布局策略,对如何推动我国在新一轮技术竞争中降低对外部技术的依存度、培育创新主体的创新竞争力,以及确保国家技术安全提出了建议和措施.

关键词

虚拟现实; 专利导航; 核心技术研发路线; 专利布局; 竞争力; virtual reality; patent navigation; core technology R&D route; patent layout; competitiveness;

摘要

信息物理融合系统(cyber-physical system, CPS)是"人–机–物"三元融合模式背景下新型软件基础设施的重要一环.为了处理不断涌现的新环境、新模式和新平台, CPS软件必须具备一定质量保障水平的可成长和可持续演化能力.然而CPS软件在与环境交互过程中所必然面对的环境非确定性给CPS软件的质量保障带来了新的挑战.本文深入分析了环境非确定性中的感知非确定性和规约非确定性分别给软件测试研究带来的挑战.为了应对这些挑战,提出了一个迭代式的研究框架,用于有效测试受环境非确定性影响的CPS软件.基于该研究框架,介绍了现有CPS软件测试技术研究进展,并重点介绍了3种考虑环境非确定性的软件测试技术,分别解决CPS软件测试中的测试输入生成、测试预言生成和环境适应性评估问题.本文基于一个自适应自控小车的CPS软件实例,初步验证了所介绍方法测试CPS软件的有效性.

关键词

信息物理融合系统; 软件测试; 环境非确定性; 测试输入生成; 测试预言生成; 环境适应性评估; cyber-physical systems; software testing; environmental uncertainty; test input generation; test oracle generation; environmental suitability evaluation;

软件技术前沿专题 | 论文

高可信众包群体构建方法

An approach for developing a highly trustworthy crowd-sourced workforce

Website Google Scholar
冯洋, 王祎, 房春荣, 郭楠楠, 陈振宇
中国科学: 信息科学, 2019, 49(11): 1412-1427

摘要

构建高可信众包群体是众包活动的一个重要挑战.目前,众包机制研究主要集中在激励众包个体,而忽略了能够反映微服务质量的高诚信众包群体的构建.本文根据通过融合委托–代理模型和信号博弈理论提出了一种新颖的高可信众包群体构建机制.该机制实现了众包工人和发包方的信息交换,并通过随机质量审查来为诚信/失信工人提供动态的经济激励/惩罚.本文通过大规模的仿真实验来对该机制进行验证.实验结果表明该机制具有良好的有效性和高效性,能够通过极小的代价让能力强但失信的工人在任务提交前改正行为做出诚信决策.

关键词

可信众包; 众包机制; 信号博弈理论; 委托代理模型; trustful crowd-sourcing; crowd-sourced mechanisms; signaling game theory; principal-agent model;

软件技术前沿专题 | 论文

软件数字社会学

Software digital sociology

Website Google Scholar
周明辉, 张宇霞, 谭鑫
中国科学: 信息科学, 2019, 49(11): 1399-1411

摘要

随着互联网不断发展,软件开发(尤其是全球开源开发)面临诸多问题和挑战,如分布在全球的开发者个体差异明显,群体协作的困难度增加,并且广泛的社会参与形成复杂生态等.这些问题使得软件开发呈现出很强的社会学特征.因此,本文提出软件数字社会学来刻画和应对以上问题的挑战,涉及个体学习、群体协作和可持续生态.本文对核心研究方法——软件开发活动数据的挖掘和分析进行了讨论,并初步探讨了已经形成态势的开源供应链的重要问题.软件数字社会学可以启发研究者们更好地理解软件开发面临的关键挑战并探索更好的解决方案.

关键词

软件数字社会学; 软件活动数据; 个体学习; 群体协作; 开源生态; 软件供应链; 数据质量; software digital sociology; software-activity data; individual learning; group collaboration; opensource ecosystem; software supply chain; data quality;

软件技术前沿专题 | 评述

软件崩溃研究进展

Progress on software crash research

Website Google Scholar
顾咏丰, 马萍, 贾向阳, 江贺, 玄跻峰
中国科学: 信息科学, 2019, 49(11): 1383-1398

摘要

软件崩溃指程序的意外中断,是软件故障的一种严重表现形式.软件崩溃危害巨大:一方面,崩溃发生的反复性会带来较差的用户体验并影响公司的声誉;另一方面,崩溃发生的突然性会给用户造成巨大的甚至无法挽回的损失.随着现代软件的规模和复杂性不断增大,如何有效地防止和应对软件崩溃成为了热门研究问题.本文从软件崩溃的分析、重现、定位修复这3个方面出发,简要地回顾和总结了近年来软件崩溃的研究进展.

关键词

软件崩溃; 崩溃分析; 崩溃重现; 崩溃定位; 崩溃修复; 程序调试; 程序异常处理; software crashes; crash analysis; crash reproduction; crash localization; crash repair; program debugging; program exception handling;

Vol. 49, No. 10, 2019 封面 目录

摘要

平均准确度AP是计算机视觉领域物体检测算法的重要性能评价指标,长期用于相关学术研究成果的定量比较.我们在实践中发现AP指标存在缺陷不能准确反映物体检测算法的数量准确性.我们具体分析了AP存在缺陷的两种表现,首先是AP定义和计算方法允许虚警出现时召回率不变,出现一个召回率对应多个准确度的情况, AP值计算仅和该召回率对应的最大准确度有关,使得准确度降低的虚警检测被AP忽略或者称为被AP隐藏.其次,我们发现在高召回率区域, AP对于准确度的增量和对于召回率的增量偏好不同,且偏向于召回率增加,这意味着检测算法增加虚警对增加AP值更有益. AP值评价指标的缺陷有很大的危害,首先导致该领域研究存在人为反复调整阈值从而获得高AP值的可能,其次能够增强物体检测数量准确性的研究方法被长期抑制,阻碍了该领域的创新发展,最后导致追求高AP值的学术研究与追求数量准确性的实际应用严重分离,很多学术成果在实际运用中无法达到应用的要求.基于上述分析,我们呼吁对AP指标进行批判式的改进,以弥合学术研究和实际需求的鸿沟,促进技术创新和产业运用良性互动.

关键词

物体检测; 平均准确度; 数量准确性; 评价指标; 深度学习; object detection; average precision; quantity accuracy; evaluation metric; deep learning;

论文

面向时延需求的主动队列管理方法

Active queue management algorithm for time delay demand

Website Google Scholar
赵玉宇, 程光, 李昊冬, 张慰慈
中国科学: 信息科学, 2019, 49(10): 1321-1332

摘要

网络智能终端的普及和发展对网络总体的拥塞控制和以时延、抖动为主的服务质量提出了更高的要求和挑战.现有的网络中间设备,主要依靠队列管理控制时延,解决拥塞.针对现有主动队列管理算法易导致的高时延和网络资源分配不公下的大量丢包问题,本文提出了面向时延需求的主动队列管理(time demand-active queue management, TD-AQM)方法.该方法将队列管理的基础从端系统和中间设备得到的网络测量反馈回归到写入数据报文IP层option字段的时延需求,即报文在路由器最长存在的时间上.为了避免洪峰效应, TD-AQM利用限制向下查找范围和遏制格子虚占用命中率方法,将数据包按照时延需求插入队列.实验结果表明, TD-AQM能够有效地维持队列的稳定性,保证数据报文按照时延需求出队并相较现有队列管理算法提高了吞吐率等各项性能.

关键词

主动队列管理; 时延需求; 洪峰效应; 队列稳定性; 低时延; active queue management; time delay demand; peak effect; queue stability; low delay;

评述

零样本图像分类综述: 十年进展

A decadal survey of zero-shot image classification

Website Google Scholar
冀中, 汪浩然, 于云龙, 庞彦伟
中国科学: 信息科学, 2019, 49(10): 1299-1320

摘要

零样本图像分类指训练集和测试集在数据的类别上没有交集的情况下进行图像分类.该技术是解决类别标签缺失问题的一种有效手段,因此受到了日益广泛的关注.自提出此问题至今,零样本图像分类的研究已经大致有十年时间.本文系统地对过去十年中零样本图像分类技术的研究进展进行了综述,主要包括以下4个方面.首先介绍零样本图像分类技术的研究意义及其应用价值,然后重点总结和归纳零样本图像分类的发展过程和研究现状,接下来介绍常用的数据集和评价准则,以及与零样本学习相关的技术的区别和联系,最后分析有待深入研究的热点与难点问题,并对未来的发展趋势进行了展望.

关键词

零样本图像分类; 属性; 词向量; 跨模态映射; 领域适应学习; zero-shot image classification; attributes; word vectors; cross-modal embedding; domain adaptation learning;

软件自动化前沿进展专题 | 论文

一种静态的编译器重复缺陷报告识别方法

Static duplicate bug-report identification for compilers

Website Google Scholar
陈俊洁, 胡文翔, 郝丹, 熊英飞, 张洪宇, 张路
中国科学: 信息科学, 2019, 49(10): 1283-1298

摘要

编译器缺陷报告在编译器质量保证中具有重要作用,而重复缺陷报告往往带来不必要的人力、时间等资源浪费.为了识别编译器重复缺陷报告,本文提出了一种静态的重复缺陷报告识别方法IdenDup.该方法可以有效解决两个场景下的重复缺陷报告问题,即模糊测试(fuzz testing)所产生的缺陷报告和缺陷管理系统中不同来源的缺陷报告.具体来说, IdenDup利用缺陷报告中静态文本和程序特征来识别重复缺陷报告,其中程序特征包括程序词法、语法,以及本文首次提出的数据流特征.特别地,程序数据流特征指的是程序中变量使用路径(变量使用方式及使用方式的顺序)特征.之后,我们使用C语言的两个主流编译器GCC和LLVM作为实验对象,对IdenDup的效果进行了实验探究.实验结果表明, IdenDup可以有效地识别上述两个场景下的重复缺陷报告,并且超过已有方法.

关键词

编译器调试; 编译器缺陷报告; 重复缺陷报告; 数据流分析; 静态方法; compiler debugging; compiler bug report; duplicate bug report; dataflow analysis; static approach;

软件自动化前沿进展专题 | 进展

编译优化序列选择研究进展

Selection of compiler-optimization sequences

Website Google Scholar
高国军, 任志磊, 张静宣, 李晓晨, 江贺
中国科学: 信息科学, 2019, 49(10): 1267-1282

摘要

在过去的几十年里,编译器开发者针对各种复杂情况下的编译优化需求,设计实现了大量的编译优化选项.在实际开发中,由编译器提供的标准编译优化序列难以适应复杂场景下待编译程序的编译要求.一方面,待编译程序有不同的语义和编译目标,直接采用标准编译优化序列难以获得理想的优化效果,若采用不适当的优化序列甚至可能对程序性能等带来负面影响.另一方面,随着硬件体系结构的不断发展,编译环境日益复杂,编译优化序列亦应进行相应调整.因此,如何在错综复杂的优化选项中为待编译程序选择最佳的编译优化序列成为一个具有挑战性的科学问题.针对上述问题,研究人员展开了大量的研究,并取得了诸多成果.本文旨在归纳编译优化序列选择领域的研究文献,通过文献搜索,筛选获得符合条件的55篇论文,从多个视角(算法、研究类型、目标编译器、基准测试集等)揭示该领域的研究现状.通过文献分析可以发现,当前该领域的主流算法包括两类,即以遗传算法为代表的启发式搜索算法和以支持向量机为代表的机器学习算法.超过80%的文献的研究类型属于提出解决方案或者实证研究.在已有的研究中,实验验证时使用频次最多的编译器和基准测试集分别是GCC和miBench.本文有助于理解编译优化序列选择领域当前基本进展和发展趋势,同时为开展该领域研究工作提供了可能的方向.

关键词

编译器; 编译优化序列; 启发式搜索; 机器学习; compiler; compiler-optimization sequence; heuristic search; machine learning;

摘要

软件自动化是提高软件生产率的根本途径.由于Android应用快速迭代的开发模式,其对于自动化协助应用开发,尤其是自动化测试,有很高的需求.在自动化测试中,测试输入自动生成是最为关键和资源消耗最大的步骤之一,极大地影响自动化测试的有效性.由于Android应用独有的特性,自动为其生成测试输入存在独特的挑战.为了应对这一挑战,已有许多Android应用测试输入自动生成技术被提出.本文提出Android应用测试输入自动生成技术的描述框架,包括测试输入自动生成技术的3个维度(分别为搜索空间的表示、候选输入的生成、候选输入的评估),并讨论了测试输入自动生成技术在这3个维度采用策略的两个评价指标(即充分性与高效性).借助这一全新描述框架,本文对已有技术进行分析和总结,讨论现有技术的长处和不足,并对未来可能的研究方向给予展望.

关键词

Android; 自动测试; 输入生成; 技术描述; 智能手机; Android; automated testing; input generation; description of technology; smartphones;

软件自动化前沿进展专题 | 编者按

软件自动化前沿进展专题编者按

Website Google Scholar
梅宏, 张路
中国科学: 信息科学, 2019, 49(10): 1233-1233

关键词

错误修复; 生成技术;

Vol. 49, No. 9, 2019 封面 目录

摘要

复杂疾病的致病机理一直是人类健康领域面临的重大难题之一,通过传统的方法进行新药开发,需要大量的时间与金钱,已经满足不了人们的需求.近几年来寻找已知药物新的治疗效果,即药物重定位,已经成为治疗更多疾病的一个有效途径.目前组织特异性的研究已经取得一些成果,但是传统的药物重定位方法很少考虑疾病的组织特异性.本文提出基于组织特异性和直接邻居相似度方法预测药物的新适应症,同时深入探讨考虑疾病的组织特异性对药物重定位研究的影响.首先研究组织特异性的发展及其特点,并提出基于组织特异性数据,应用直接邻居的相似度进行药物重定位研究.从数据库DrugBank中提取11405条已知药物–靶标关系,并从人类孟德尔遗传数据库中获得5种癌症(乳腺癌、结肠癌、肝癌、肺癌、卵巢癌)及其致病基因数据,利用5种癌症对应的组织特异性相互作用网络作为背景网络,基于直接邻居距离度量方法构建25个组织特异性药物–疾病二部网络,实验结果通过CTD (comparative toxicogenomics database)标准数据库进行验证.结果表明,基于组织特异性和直接邻居相似度度量标准会提高药物重定位研究的准确性,为新药的体内和体外实验提供可靠候选集,这也为药物重定位的研究提供了新的思路.

关键词

药物重定位; 组织特异性; 药物靶标; 致病基因; 直接邻居度量; drug repositioning; tissue specificity; drug targets; disease genes; direct neighborhood measurement;

论文

基于0-1矩阵分解的蛋白质功能预测

Protein function prediction based on zero-one matrix factorization

Website Google Scholar
赵颖闻, 王峻, 郭茂祖, 张自力, 余国先
中国科学: 信息科学, 2019, 49(9): 1159-1174

摘要

准确地标注蛋白质功能是功能基因组学的核心任务之一.蛋白质功能标注信息存在大量缺失且功能标签空间巨大.近期一些标签压缩方法被提出并应用于蛋白质功能预测,但是这些方法获取的压缩标签可解释性差,且面临着多标记学习中的阈值划分难题.为解决这些问题,本文提出一种基于0-1矩阵分解的蛋白质功能预测方法 (zero-one matrix factorization, ZOMF). ZOMF首先将蛋白质–功能标签关联矩阵分解成两个低秩0-1矩阵,挖掘蛋白质和功能标签间的内在关联.其次它利用蛋白质互作网和基因本体结构信息分别针对上述两个低秩矩阵定义了平滑正则项,约束指导低秩矩阵的优化.最后它利用优化获取的低秩矩阵重构关联矩阵,进而实现蛋白质功能预测.通过在酵母菌、拟南芥、老鼠和人类数据集上的实验表明, ZOMF比已有的相关算法能够更准确地预测蛋白质功能,它无需对重构的关联矩阵进行阈值划分,压缩的0-1标签可解释性更直观.

关键词

蛋白质功能预测; 矩阵分解; 蛋白质互作网; 基因本体; 阈值划分; protein function prediction; matrix factorization; protein-protein interaction network; gene ontology; thresholding segmentation;

摘要

随着大数据技术的快速发展,大规模访问存储器的需求随之剧增,导致访问动态随机访问存储器DRAM的高耗能问题越来越突出.大容量、低能耗的非易失性内存NVM技术逐渐成熟,有望被广泛应用于异构内存计算机系统.基于访问内存页的历史记录,本文针对异构内存系统提出了一种双向哈希链表的异构内存页迁移机制(THMigrator),将频繁访问的内存页从PCM或STT-RAM迁移到DRAM,并用能效分析模型(EEAM)评估了异构内存系统的能效.实验结果表明, THMigrator迁移机制比采用多级队列迁移机制MQMigrator的系统计算性能提升了9.3%,系统平均能效比提升了17%;THMigrator比采用随机迁移机制CoinMigrator的系统平均能效比提升了26%.

关键词

页迁移; 双向哈希链表; 异构系统; 非易失性内存; 迁移方法; page migration; two-way Hash chain list; heterogeneous systems; non-volatile memory; migration algorithm;

摘要

云计算应用服务具备优良的弹性与扩展性,但其开发则具备较高的难度和复杂性,要求开发者熟练掌握并运用各项云计算技术,搭建并维护网络化信息系统.在国民经济各行各业对云计算应用服务日益旺盛的需求驱动下,近年来出现了众多支持或辅助云计算应用服务完整或部分生命周期的开发环境.本文实践调研了多个主流云计算应用服务开发环境,根据自动化程度的高低将它们分为3个类别:用户自主搭建开发环境、社区自发维护标准构件及托管开发环境,其中第3类进一步分为4代:编辑型、应用级、函数级与集成型.通过典型案例的深入挖掘,梳理出云计算应用服务开发环境的4个主要发展趋势:虚拟化、轻量化、智能化与可视化,并基于我们研发的Cloud Studio开发环境探索其可能的具体形态与展现形式,特别是开发理念从微观层面的代码逻辑转变到宏观层面的数据流图,期望能够有效降低开发门槛,加速开发效率,促进"中国云"核心竞争力的形成.

关键词

云计算; 开发环境; 软件工程; 数据流图; 应用开发; cloud computing; development environment; software engineering; data flow diagram; application development;

评述

面向情绪识别的脑电特征研究综述

A review of EEG features for emotion recognition

Website Google Scholar
张冠华, 余旻婧, 陈果, 韩义恒, 张丹, 赵国朕, 刘永进
中国科学: 信息科学, 2019, 49(9): 1097-1118

摘要

情绪是人对外界事物产生的心理和生理反应.准确地识别情绪在人机交互研究中占据着重要位置,其成果可应用在医学、教育、心理、军事等方向.由于脑电信号具有客观,不易伪装等特点,其在情绪识别领域的应用广受关注.从脑电信号中提取与情绪关联大、区分能力强的特征,有助于后续的分类器更有效地识别不同情绪状态.本文调研了目前常用于情绪识别研究领域的脑电信号特征,从时域、频域、时频域和空间域4个方面介绍其定义、计算方法,以及与情绪的联系,在SEED, DREAMER和CAS-THU 3个公开的脑电–情绪数据集上,使用SLDA算法评估和比较了各类脑电特征区分不同效价的能力.本文也对目前存在的问题和未来的研究方向进行了讨论和展望,可以为研究人员系统性地了解面向情绪识别的脑电特征研究现状以及开展后续研究提供思路.

关键词

情绪识别; 脑电信号; 特征提取; 特征选择; 情绪效价; emotion recognition; electroencephalograms; feature extraction; feature selection; valence;

评述

非消歧偏标记学习

Disambiguation-free partial label learning

Website Google Scholar
张敏灵, 吴璇
中国科学: 信息科学, 2019, 49(9): 1083-1096

摘要

偏标记学习是一类重要的弱监督机器学习框架.在该框架下,每个对象在输入空间由单个示例进行刻画,在输出空间与一组候选标记相对应,其中仅有一个标记为其真实标记.利用有歧义性的样本进行建模,直观的策略是对候选标记集合进行消歧,然而该策略会受到伪标记的影响,因此有必要考虑从非消歧的角度解决偏标记学习问题.本文将围绕基于消歧、非消歧策略的偏标记学习算法对该领域进行综述.首先,给出偏标记学习的定义以及其与其他相关学习框架的关系.然后对现有几种代表性基于消歧策略的偏标记学习算法进行介绍.接下来重点介绍我们提出的两种基于非消歧策略的偏标记学习算法.最后对本文进行总结并简要讨论进一步的研究方向.

关键词

机器学习; 弱监督学习; 偏标记学习; 候选标记; 非消歧策略; machine learning; weakly-supervised learning; partial label learning; candidate label; disambiguation-free strategy;

Vol. 49, No. 8, 2019 封面 目录

论文

基于动态注意力GRU的特定目标情感分类

Aspect-based sentiment analysis based on dynamic attention GRU

Website Google Scholar
李丽双, 周安桥, 刘阳, 钱爽, 耿浩彭
中国科学: 信息科学, 2019, 49(8): 1019-1030

摘要

特定目标情感分类是一个极具挑战的任务,其目的是确定上下文语境中某些实体所表达的情感.由于目标实体的情感依赖于实体本身以及对上下文的理解,在分类时应该同时考虑句子和目标实体,并且需要将目标实体与上下文语义进行充分的整合.因此,本文提出:(1)句子、目标实体联合编码方法;(2)基于动态注意力DAGRU (dynamic attention gated recurrent unit)的特定目标情感分析方法.联合编码是指同时对句子和目标实体进行语义编码,能为目标实体增加上下文语义;动态注意力机制能动态地改变模型对上下文单词的注意力以及目标实体的表示,从而更有效地获取上下文情感特征,使模型更准确地识别不同目标实体的情感类别.本文模型在SemEval2014的两个数据集Laptop, Restaurant上进行实验,实验结果表明,基于动态注意力DAGRU的模型相比基于标准注意力的模型结果有显著提高.

关键词

注意力机制; GRU; 情感分析; 深度学习; 自然语言处理; attention mechanism; GRU; sentiment analysis; deep learning; natural language processing;

摘要

作为一种意合型语言,汉语由字组词的特性明显,字面义词的词义大体可由其构词结构和语素概念来表达,但对非字面义词的处理存在偏差,这也是语言深度理解中的一个棘手问题.本文从语言认知的角度出发,提出了适用于汉语词的非字面义的知识表示方式:发掘《现代汉语词典》中的3524个非字面义二字词,判定它们作为隐喻或转喻现象的非字面义类型,标注其在《同义词词林》中的源域、目标域,并选取面向计算的适合的字面义词承担者.该工作首次在词汇级别上,系统地揭示了汉语隐喻和转喻现象的数量、类型及语义域映射分布状况,并且在算法框架不变的情况下,显著改善了词义相似度计算效果.这些思路、做法及语言资源建设,有望推动人文领域和计算应用等相关工作的深入开展.

关键词

汉语概念词典; 语素; 语素概念; 语义构词; 字面义; 非字面义; 隐喻; 转喻; Chinese object-oriented lexicon; morpheme; morphemic concept; semantic word formation; literal meanings; non-literal meanings; metaphor; metonymy;

摘要

强连通分量(strongly connected component, SCC)算法可以将一个有向图缩略为有向无环图(directed acyclic graph, DAG),广泛应用于可达性查询等有向图分析应用.尽管现有工作已经提出多种面向静态有向图的强连通分量算法,但是它们需要高额的运行时开销来反复对整个图进行全量计算,以响应现实世界中普遍存在的动态有向图结构的频繁变化.其实,在通常情况下,动态有向图每次改变量极小(少于5%).其允许我们以增量的方式对动态有向图进行强连通分量计算,以缩短响应时间.因此,为解决此问题,本文提出了一种高效的面向动态有向图的增量强连通分量算法Incremental Strongly Connected Components Algorithm,简称Inc-SCC,通过对不必要的计算进行裁剪以减少算法的数据访问量和计算量,并利用SCC的不相交性进行并行处理以提升SCC计算效率.其次,提出了一种启发式优化方法进一步加快算法收敛速度.实验结果显示,本方法可以用于实时响应有向图持续性动态变化,并且当整个有向图的边变化比例为5%时,本方法相对于现有算法的加速比可达2.8到12倍,当整个有向图的边变化比例为0.5%时,本方法相对于现有算法的加速比可达2.9到12倍.

关键词

强连通分量; 动态有向图; 增量计算; 收敛; 有向无环图; strongly connected components; evolving directed graph; incremental computation; convergence; directed acyclic graph;

Vol. 49, No. 6, 2019 封面 目录

摘要

生物发光断层成像(bioluminescence tomography, BLT)是一种高灵敏非侵入式光学分子成像模态,但近红外光在生物组织中传输的复杂性及表面测量信息的有限性,对BLT光源重建算法提出了较高要求.本文提出了一种基于通用迭代收缩阈值(general iterative shrinkage and threshold,GIST)的BLT重建算法,采用非凸平滑剪切绝对偏差(smoothly clipped absolute deviation, SCAD)惩罚项,并通过迭代求解对非凸惩罚项有解析解的邻近算子问题来获得优化结果.此外,重建中也结合了多光谱测量和收缩可行域策略以降低逆问题的不适定性.为评估该算法的光源定位及多光源辨识能力,本文设计了多组仿真和物理仿体实验,并将GIST与几个典型稀疏重建算法进行了对比.实验结果表明GIST算法在不同光源深度和间隔距离的实验中在中心定位误差方面有较大优势.

关键词

多光谱生物发光断层成像; 通用迭代收缩阈值算法; 稀疏重建; 逆问题; 平滑剪切绝对偏差; multispectral bioluminescence tomography; general iterative shrinkage and threshold algorithm; sparse reconstruction; inverse problem; smoothly clipped absolute deviation;

论文

系数多状态关联的图像NSST-HMT模型

Image NSST-HMT model with associated multi-state coefficients

Website Google Scholar
王相海, 赵晓阳, 朱毅欢, 宋若曦, 宋传鸣
中国科学: 信息科学, 2019, 49(6): 708-725

摘要

近年来,非下采样Shearlet变换(non-subsampled shearlet transform, NSST)因其具有各向异性,多方向捕捉性的同时,还兼具平移不变性,从而在图像恢复过程中发挥着重要的稳定作用.本文首先对图像NSST子带内系数关系、子带间系数的"父子关系"和"兄弟关系" 3方面进行分析,获得子带内系数具有稀疏性、子带间"父子关系"和"兄弟关系"系数均具有聚集性和传递性的结论.在此基础上提出一种基于系数多状态关联的隐Markov树模型(multi-state non-subsampled shearlet transform hidden Markov tree, M-NSST-HMT),该模型通过将NSST子带间系数的"父子关系"和"兄弟关系"作为共同指导子带间系数传递的状态来估计重构系数,并利用两种状态关联的互信息来对重构系数进行整合.最后将所提出的模型应用于图像去噪并取得良好的去噪效果,结果表明所提出的模型较传统HMT模型能够更好地揭示图像NSST变换后子带内和子带间系数的关系,并提高系数的预测准确性.

关键词

非下采样剪切波变换; 混合Gauss模型; 隐Markov树模型; 系数多状态关联; 图像去噪; 支持向量机; non-subsampled shearlet transform; Gaussian mixture model; hidden Markov tree model; multi-state coefficients association; image denoising; support vector machine;

论文

七次PH曲线G2[C1] Hermite插值方法

G2[C1] Hermite interpolation using septic PH curves

Website Google Scholar
李毓君, 方林聪, 汪国昭
中国科学: 信息科学, 2019, 49(6): 698-707

摘要

本文讨论七次PH (Pythagorean hodograph)曲线的G~2[C~1] Hermite插值问题. PH曲线是具有有理形式的等距线的一类多项式参数曲线,其弧长可精确计算,因此在CAD (computer aided design)中有着广泛的应用.本文采用平面参数曲线的复数表示形式,根据导矢曲线因式分解得到的多项式因子次数不同,将七次PH曲线分为3类.第1类七次PH曲线都是正则曲线,且其G~2[C~1]Hermite插值方法已经被研究.本文研究另外两类七次PH曲线的构造方法,并指出对于给定的初始条件,存在不超过6条的偶数条第2类七次PH曲线;而第3类七次PH曲线的存在性不仅对初始条件有约束,而且可以通过用户指定一个具有几何意义的实参进行交互构造.本文最后通过实例构造了这两类曲线对六分之一圆弧曲线的逼近.

关键词

Bézier曲线; 等距曲线; 七次; 几何连续; Hermite插值; Bézier curve; offset curve; septic; continuous; Hermite interpolation;

摘要

部分最大可满足性问题(partial maximum satisfiability problem, PMS)是最大可满足性问题(maximum satisfiability problem, MaxSAT)的泛化问题,在很多领域中得到广泛应用.目前,在工业诊断实例方面PMS求解仍有待改进,在对基于随机搜索的PMS算法深入研究基础上,本文首次提出一种结合结构特征的随机搜索方法 (structure characteristics partial MaxSAT, SCPMS).首先,依据单元传播规则结合问题结构特征逐步将PMS问题中硬单元子句分成两部分,从而构造出因缺乏部分硬单元子句使得问题可满足的子问题;提出结合结构特征的随机搜索指导策略,对新的子问题再次利用单元传播找出原问题中的硬单元子句中硬阻塞变量,再结合子句特征翻转相应软阻塞变量,从而提高随机搜索的求解效率.实验结果表明,提出的SCPMS与最新的两个算法DeciDist和DistUp相比,在基于模型诊断问题(model-based diagnosis, MBD)的工业实例上, SCPMS求得的不满足软子句数有较大程度的减少.

关键词

PMS; 单元传播; 最大可满足性问题; 随机搜索; 基于模型的诊断; PMS; unit propagation; SAT; stochastic search; model-based diagnosis;

摘要

扩散磁共振成像是目前唯一非侵入式重建纤维解剖结构的成像技术.体素微结构纤维方向估计的精确性是影响该技术成像结果的关键.自扩散张量成像技术提出以来,很多高角度分辨率扩散成像方法用于估计纤维的方向.本文首先从估计模型角度,利用Q空间成像和模型依赖两大类数学模型总结现有主要的成像方法并延伸到目前广泛采用的球面去卷积模型,且讨论了其局限性和优越性.其次从优化方法角度,针对大规模逆问题优化方法的L_2正则化约束、L_1系数稀疏约束、L_1和L_2纤维分布空间稀疏约束以及纤维空间连续性约束优化模型的发展脉络介绍了球面去卷积优化方法的进展.最后,利用大量的模拟数据和实际数据对多种典型算法进行了纤维方向估计分辨率、准确率等对比实验.根据实验结果,对不同方法的优点和缺点进行了定量分析,并对今后的算法估计的研究方向进行了展望.

关键词

纤维方向分布; 去卷积; 扩散磁共振; 纤维跟踪成像; 高角度分辨率成像; ber orientation distribution; deconvolution; diffusion MR; tractography; high angular resolution diffusion imaging;

Vol. 49, No. 4, 2019 封面 目录

摘要

数字图像内容的恶意篡改可能导致严重后果.随着图像分辨率的提高及其在网络上流通数量的快速增长,图像往往要经过双重压缩:压缩(JPEG/JPEG2000)发布→解码→应用领域的处理(常规信号处理/安全性攻击/内容的恶意篡改)→再次压缩(JPEG2000/JPEG)发布,才能进入末端检测.如何在双重压缩环境下有效判定图像内容是否遭篡改及定位篡改位置是个亟待解决的问题.本文提出了一种基于旋转向量的新颖的水印表示方法及其调制算法,并在此基础上建立了半脆弱水印方案用于图像内容认证.理论分析了水印的稳定性,使该水印方案具有理论基础;详细阐述了以特征抽取与重构、水印嵌入与提取、篡改检测与定位为主要内容的认证方案;分析了水印的鲁棒性、安全性和相关检测性能.理论分析与实验表明:该方案水印透明性好,针对不同的攻击鲁棒性好且分布稳定;在双重压缩环境下能有效区分恶意篡改与保持内容的处理并定位篡改区域;安全性好,能抵制水印攻击、拼贴攻击和伪造攻击.与相关方案相比,本文方案综合性能优越,适用于双重压缩环境下的内容认证,扩大了基于水印的内容认证的应用范围.

关键词

图像水印; 半脆弱水印; 恶意篡改; 内容认证; 双重压缩; image watermark; semi-fragile watermark; malicious tampering; content authentication; double compression;

摘要

多姿态人脸图像正面化可以缓解头部姿态变化对人脸分析任务的影响.以往直接从多姿态人脸图像合成正面人脸图像的方法存在细节特征缺失的问题.针对这一问题,本文提出一种基于编解码网络的多姿态人脸图像正面化方法——多任务卷积编解码网络(MCEDN).该方法引入正面基础特征网络合成正面人脸基础特征,并在此基础上融合编码网络提取的多姿态人脸局部特征进行细节补偿,最终合成更加清晰的正面人脸图像.利用多任务学习机制建立端到端模型,统一局部特征提取、正面基础特征解析、正面图像合成3个模块,通过共享参数提升整个模型的效果.与已有方法对比, MCEDN在多个数据集上都可以合成结构稳定、细节清晰的正面人脸图像.我们直接使用合成的正面人脸图像进行人脸识别和表情识别,识别准确率达到先进水平,这表明MCEDN可以有效保留人脸细节特征,支持人脸分析任务.

关键词

人脸正面化; 卷积神经网络; 编解码网络; 多任务学习; 人脸识别; 表情识别; face frontalization; convolutional neural network; encoder-decoder network; multitask learning; face recognition; facial expression recognition;

论文

基于多视角卷积神经网络的三维模型分类方法

3D shape classification based on convolutional neural networks fusing multi-view information

Website Google Scholar
王鹏宇, 水盼盼, 余锋根, 甘渊, 刘琨, 张岩, 孙正兴
中国科学: 信息科学, 2019, 49(4): 436-449

摘要

近些年来,卷积神经网络框架在二维图像的语义分割、分类、检索等领域取得了非常好的效果.但是由于三维模型结构的复杂性与不规律性,卷积神经网络的卷积和池化操作却无法直接应用在三维模型上.为了发挥深度学习框架在二维图像分析领域积累的技术优势,本文采用基于多视角投影的方法来完成三维模型分类的任务.然而现有的基于多视角投影的三维模型分类方法大多采用固定视角,所采集到的多视角下模型投影渲染图中存在大量的信息冗余,对结果造成一定的干扰.本文提出了一种新型的多视角卷积神经网络框架,在网络训练过程中自动判别每个视角的贡献度,舍弃冗余视角的信息,从而提取出最能表征模型类别的特征,提高了网络的鲁棒性.此外,本文将基于视点熵的最佳视角选择方法引入三维模型分类领域,相比于固定视角方法,本文方法能更多地保留模型的细节信息,同时不需要模型的朝向对齐.通过在ModelNet10和ModelNet40数据集上的实验,验证了将基于视点熵的视角选择方法应用于三维模型分类,以及本文提出的基于视角判别的多视角信息融合方法的合理性和优越性.实验结果表明,本文方法的分类准确性也优于现有的基于固定多视角投影的三维模型分类方法.

关键词

三维模型; 视角选择; 视点熵; 卷积神经网络; 深度学习; 3D model; viewpoint selection; viewpoint entropy; convolutional neural network; deep learning;

摘要

高难度精细触觉交互任务依赖于注意资源的高强度激活,研究触觉通道和注意力状态的关系不仅有利于理解人类感知与认知的交互机制,对于触觉模态脑机交互系统的设计也具有重要应用价值.本文构建了融合多点接触力反馈和沉浸式视觉反馈的虚拟现实交互环境,以高精度力位协同控制任务为对象提出了注意力状态的客观监测方法.将力、位置两个模态的容许误差作为任务难度的调控变量,测量了用户在每个模态内的操作绩效.结合用户主观评估数据,证实了该任务可以有效激活注意力资源,并能够作为注意力"示波器",实现高时间分辨率的注意力水平和注意力焦点的客观监测.本文实验结果表明,基于触觉通道的力位协同控制任务能够实现注意力状态的客观测量,为后续构建基于神经生理信号的注意力机制研究提供了行为学基准.

关键词

虚拟现实; 触觉交互; 力位协同控制; 注意力状态; virtual reality; haptic interaction; collaborative force-position control; attentional states;

论文

轻量级Web3D地铁火灾逃生在线规划关键技术

Key technology of lightweight Web3D online planning of metro fire escape

Website Google Scholar
艾子豪, 胡永豪, 闫丰亭, 张惠娟, 王冬青, 青胜蓝, 朱合华, 贾金原
中国科学: 信息科学, 2019, 49(4): 405-421

摘要

基于移动互联网浏览器实现地铁站逃生模拟训练是一种高效率的火灾逃生训练方式.然而,由于地铁站规模庞大且火灾情景复杂,在线逃生路径规划仿真平台模型因数据规模大,其在基于有限网络带宽传输以及渲染能力较弱的浏览器上运行时,速度将非常缓慢甚至无法运行.为解决此问题,本文针对轻量级Web3D地铁火灾逃生路径在线规划平台实时在线关键技术进行了研究.首先,针对大规模地铁站BIM静态场景数据,通过语义和体素化成分检验的轻量化方法对其进行了轻量化处理.同时,针对大规模虚拟化身的在线渲染,基于数据拆分并灵活组合思想,通过对虚拟化身的几何体信息和虚拟化身的动画数据进行数据管理,实现了大规模虚拟化身在线渲染的轻量化处理,进而实现了轻量级人群可视化;其次,针对动态烟气数据,提出了基于烟气冗余消除和归一化的轻量化处理方法,并基于精灵纹理粒子系统构建了轻量级烟气场景,实现了轻量级烟气可视化;最后,基于上述一系列轻量化处理的Web3D地铁场景中的逃生路径规划问题研究,本文提出了基于虚拟足迹聚类的蚁群优化算法eAACO (evacuation based on adaptive ant colony optimization),该算法通过VR设备获取真实人群逃生路径,实现对路径数据筛选和聚类以形成骨干路径,并与蚁群算法(ACO,ant colony optimization)相结合,设计了逃生路径规划的最优方案.实验表明,上述关键技术的实现较好解决了大规模地铁站火灾逃生路径规划Web3D模拟平台的实时在线处理问题.

关键词

Web3D; 地铁站BIM; 轻量级烟气可视化; 轻量级人群可视化; 虚拟足迹聚类; 火灾逃生路径规划; 蚁群优化算法; Web3D; metro BIM; lightweight smoking visualization; lightweight crowding visualization; virtual traces clustering; online planning of fire evacuation path; ant colony optimization;

Vol. 49, No. 3, 2019 封面 目录

摘要

人机交互与人工智能是智能信息时代备受关注的两大重要研究领域.通过人机交互与人工智能发展历程可以发现,二者的关系从过去的此起彼伏逐渐变成了当下的相互促进,基于二者深度融合的典型应用也在教育、医疗等关键领域不断涌现.人机交互为人工智能提供了应用需求和研究思路,而人工智能也驱动了人机交互技术的发展和变革.放眼未来,人机交互与人工智能将保持当下这种相互促进、互相驱动的关系,更加深入地融合并协同发展.

关键词

人机交互; 人工智能; 智能用户界面; 人机共生; human-computer interaction; arti?cial intelligence; intelligent user interface; human-computer symbiosis;

摘要

深度学习是人工智能近年来的新进展,其对计算的新需求驱动新的计算架构.本文首先通过分析人工智能的阶段和任务指出深度学习的需求实质,然后从3个方面讨论深度学习领域专用架构,分别是计算结构的评价标准、数字计算的数制基础和深度学习计算架构的研究方向.本文首次提出使用K-L距离(Kullback-Leibler divergence)来评价深度学习结构的复杂度和准确度.本文认为以Posit数制为基础,不仅可以重新构造深度学习的计算架构,而且可以重新构造科学计算的计算架构,形成计算芯片设计的后发优势.最后全文总结认为深度学习驱动的领域专用架构将是计算架构创新的重要组成部分.

关键词

深度学习; 熵; 互熵; 数制; 计算架构; deep-learning; entropy; cross-entropy; numerical system; computing architecture;

面向智能应用的定制计算加速器技术专题 | 论文

低功耗神经网络计算芯片技术研究

Research on low-power neural network computing accelerator

Website Google Scholar
严佳乐, 张颖, 涂锋斌, 杨建勋, 郑时轩, 欧阳鹏, 刘雷波, 谢源, 魏少军, 尹首一
中国科学: 信息科学, 2019, 49(3): 314-333

摘要

当前人工智能引发了全球的热潮,它涵盖了图像识别、视频检索、语音识别、自动驾驶等各类智能应用.在人工智能算法中,神经网络算法扮演着举足轻重的作用,也成为了当前的研究热点.但是神经网络算法本身具有灵活性高、计算复杂、数据量大的特点,这也对计算平台提出了高性能、低功耗、高灵活性及高存储等方面的需求.针对神经网络专用芯片,本文提出了可重构硬件架构来满足神经网络的灵活性需求,以可重构架构为基础的Thinker系列可以执行多类神经网络运算.在该架构基础上,本文探究了相应的数据访存优化方案来降低功耗.在存储系统优化方面,基于eDRAM的神经网络加速方案和计算存储一体化ReRAM方案可以满足神经网络计算在存储性能及低功耗方面的需求,它们配合可重构硬件架构可以实现全新的神经网络加速框架.在高效计算方面,本文针对低比特神经网络的标准卷积计算提出基于积分和基于滤波器拆分特征重建的优化方案,以此满足高性能需求.

关键词

人工智能; 神经网络算法; 神经网络专用芯片; 可重构架构; 低功耗; artificial intelligence; neural network algorithms; neural network accelerator; reconfigurable hardware architecture; low power;

面向智能应用的定制计算加速器技术专题 | 评述

面向图计算的内存系统优化技术综述

Memory system optimization for graph processing: a survey

Website Google Scholar
王靖, 张路, 王鹏宇, 徐嘉鸿, 李超, 朱浩瑾, 钱学海, 过敏意
中国科学: 信息科学, 2019, 49(3): 295-313

摘要

图(graph)是一种以顶点和边构成的包含多种信息的复杂数据结构.图计算(graph processing)要求我们将现实条件中的关系属性抽象为图数据结构并进行复杂计算.由于CPU性能提升遇到瓶颈,人们尝试了多种协处理器或专用加速器,致力于提高运行速度并节省能耗.由于图计算具有数据依赖性强、访存–计算比高的特点,提高图计算访存效率是改善系统性能的关键.尤其是随着图数据规模的扩大,高效的内存管理优化对异构图计算性能的提高显得尤为重要.本文将介绍异构架构图计算中内存系统的管理及优化方法,归纳目前能够提高访存效率的图数据格式;分析图计算专用加速器GPU, FPGA, ASIC, PIM等的架构特点与内存方面的优化工作;概括国内相关研究进展;同时总结图计算在内存方面的机遇与挑战.

关键词

图计算; 专用加速器; 内存管理; 内存系统架构; 访存优化; graph processing; accelerator; memory management; memory system architecture; memory access optimization;

摘要

近年来,卷积神经网络作为深度学习中的常用算法,被广泛地应用在计算机视觉的任务中.FPGA凭借它的高并行计算、低功耗和可重复配置的特点在实现卷积神经网络的多种加速器中显示了优异的特性.近几年,使用FPGA加速卷积神经网络的方法已经被人们广泛地探索,但是大部分设计的性能都受限于片上乘法器数量.快速算法在卷积操作中能够有效降低运算中乘法的数量,进而达到平衡资源的效果.本文首先介绍4种实现卷积神经网络的算法:传统的空间卷积算法、矩阵乘法、Winograd算法和FFT算法.同时介绍国内外对于不同算法在硬件上的实现,以及相应的优化手段,并且总结使用FPGA加速CNN的发展历程.

关键词

卷积神经网络; FPGA; 卷积算法; 快速算法; Winograd; FFT; CNN; FPGA; convolution algorithm; fast algorithm; Winograd; FFT;

摘要

随着深度学习在众多领域发挥着越来越重要的作用,如何设计高性能、低功耗、低延迟的深度学习硬件加速器成为体系结构领域的研究热点.本文基于深度学习算法模型的结构和优化方法,分析了深度学习硬件实现中面临的困难和挑战,并对比当前主流的深度学习硬件加速平台的优势和不足,提出了基于飞腾–迈创通用向量DSP的深度学习硬件加速方案,对其向量广播、矩阵转换等加速技术进行了阐述.并围绕目前通用向量DSP硬件加速的不足,对兼顾通用向量计算和专用深度学习计算的可重构计算阵列等优化技术进行了深入的探讨与研究.

关键词

深度学习; 体系结构; 硬件设计; 加速器; 数字信号处理器(DSP); deep learning; architecture; hardware design; accelerator; digital signal processor;

面向智能应用的定制计算加速器技术专题 | 评述

面向智能计算的国产众核处理器架构研究

Research on homegrown manycore architecture for intelligent computing

Website Google Scholar
李宏亮, 郑方, 郝子宇, 高红光, 过锋, 唐勇, 吕晖, 刘鑫, 陈芳园
中国科学: 信息科学, 2019, 49(3): 247-255

摘要

当前人工智能对算力的需求以超摩尔定律的速度增长,算法并行性高、数据重用性强,为处理器体系结构设计带来了更大的设计空间.众核处理器以其强大的片上计算能力、灵活的片上体系结构、高效的片上通信、柔性优化的存储等特性,为人工智能提供了更广阔的发展空间.本文在介绍众核处理器发展历史的基础上梳理了主要技术路线,重点论述人工智能应用对国产众核处理器体系结构和关键特性的需求.

关键词

众核处理器; 智能计算; 体系结构; 通信机制; 存储体系; manycore processor; intelligent computing; computer architecture; communication mechanism; memory system;

关键词

人工智能技术; 智能应用; 深度学习技术; 众核处理器; 加速器; 卷积神经网络;

Vol. 49, No. 2, 2019 封面 目录

摘要

拉班舞谱是一种用于记录人体动作的符号记录体系,它是保护、继承和传播民族民间舞蹈及其他动作艺术的有力工具.目前,拉班舞谱的获取主要依靠专业人员手工记录,效率较低.本文基于三维人体运动捕捉数据,通过识别与拉班符号相对应的元素动作,提出了一种自动生成拉班舞谱的方法.方法的主要部分包括运动分割和元素动作分析.在运动分割中,利用速度阈值方法将人体运动捕捉数据分割成与舞谱符号对应的元素动作片段.然后,将动作片段与拉班舞谱的节奏相匹配,从而确保生成的舞谱符号更加规范和准确.在元素动作分析中,拉班舞谱将动作区分为支撑动作和非支撑动作,考虑到两类动作性质不同,因此本文采用两种方法分别对支撑与非支撑动作进行有针对性的分析.实验表明,本文的方法实现了将运动捕捉数据表示的舞蹈动作转换为数字化的拉班舞谱,并且自动生成的效率远高于手工记录.所以该方法可以快速记录濒临失传的民族舞蹈,为保护和传承动作类非物质文化遗产做贡献.

关键词

运动捕捉; 拉班舞谱; 运动分割; 元素动作分析; motion capture; Labanotation; motion segmentation; unit movement analysis;

摘要

与基于三维模型和照片生成浮雕的技术相比,黑白线描图中没有物体的三维信息,因此用黑白线描图辅助生成浮雕面临新的研究挑战.本文面向非物质文化遗产唐卡,提出一个用黑白线描图生成唐卡浮雕的方法.本文主要贡献是用物体区域的灰度控制图以及边界种子作为约束求解Poisson方程得到物体浮雕表面高度.具体将浮雕模型分为低频、中频和高频3个分量.低频分量指线描图中人物躯干以及四肢在衣服覆盖下形成的隆起趋势,中频分量指线描图中人物的四肢局部隆起,这两部分的高度用距离变换约束的Poisson扩散获得.高频分量指物体的细节,例如人的眉毛、背景中的云、山、花瓣,以及饰品等,它们的高度通过边界约束的Poisson扩散生成.最后将浮雕低频分量、中频分量和高频分量的高度图叠加并将其转换成面片模型获得完整浮雕模型.文中给出的图例验证了我们方法的有效性.

关键词

非物质文化遗产; 唐卡; 线描图; Poisson扩散; 浮雕; intangible cultural heritage; Thangka; line drawing; Poisson equation; relief;

摘要

图像不仅可以传达丰富的语义信息进而直接表达人的情感,也可以在情感层面影响他人,艺术作品更是如此.人们对于不同的视觉刺激有着不同的情绪反应,所以理解图片所包含的情感是非常重要的.本文通过微调现有的卷积神经网络模型,以少数民族绘画图像数据为研究对象,分析了艺术绘画的色相、亮度、饱和度,以及对比度对神经网络模型情感分类的影响,并在公共数据集Twitter image dataset上取得了超过目前先进水平3.4%的精度提升.最后,本文提出了一种相关任务的预训练策略,对少数民族绘画的情感分类任务有明显的提升,并通过可视化结构对实验结果进行了分析.

关键词

少数民族绘画; 图像情感; 卷积神经网络; 微调; 可视化; ethnic painting; image emotion; convolutional neural network; ?ne-tuning; visualization;

摘要

民族文化图案的分割是数字化分析民族文化的关键步骤之一.现有的图像分割方法虽然能够较好地分割自然图像,但分割民族文化图案时依然存在着难以保持主要结构和依赖大量手动交互等问题.本文提出一种基于多层次块匹配的民族图案分割协同优化方法.首先,充分利用民族文化图案的重复性特点,通过全局块匹配自动检测多个相似目标图案;接着,通过局部块匹配估计图案之间的相对朝向,再利用带约束的块匹配建立准确的稠密对应;最后,构建分割图元之间的协同优化模型,获得保持结构特征的分割结果.本文方法能够将相似图案自动分割为相互关联的细节图元,不仅交互少、精度高,还能改善矢量化等民族文化图案数字化分析的质量,大量的实验证明了其有效性.

关键词

民族图案; 图像分割; 协同优化; 块匹配; 矢量化; ethnic pattern; image segmentation; co-optimization; patch match; vectorization;

摘要

民族文化图案是中华民族宝贵财富,对民族文化图案进行语义标注与分析,是挖掘其文化价值,进行再创作与应用的基础.本文以此为研究对象,在多分类字典学习的基础上,提出了一种多标签字典学习标注算法SCMIDL.算法结合字典不相关性与系数相似性,有效提高了多标签标注性能,实现了民族文化图案的自动标注.在收集并构建的三类民族文化图案数据集进行多标签语义标注实验,实验结果验证了算法的有效性.

关键词

民族文化图案; 字典学习; 多标签; 图像标注; 相关性; national cultural pattern; dictionary learning; multi label; image annotation; correlation;

摘要

本文针对蜡染冰纹和蜡染布料染色两个关键工作进行模拟.使用FIT(?ood identity transform)算法,使模拟具有一定实时性;提出复合交点距离模拟交点加粗效果;使用形态修正、扰动等方法改善冰纹形态及视觉效果.不考虑布料结构,基于乘性模型,尝试多色染色模拟.选择平织纹棉布料,建立布料模型,建立扩散微分方程,对蜡染图案及冰纹进行单色染色模拟.在染色中使用椭圆模型并引入Perlin噪声,有效模拟了晕染现象.实验表明,本文方法能够模拟手工蜡染作品的基本特征.

关键词

蜡染; 距离变换; Fick第二定律; 扩散微分方程; Perlin噪声; batik; distance transform; Fick's second law; diffusion differential equation; Perlin noise;

摘要

数字书法将传统书法的创作工具、视觉艺术效果、书写技巧和创作等用数字化的方式再现.本文首先在回顾数字书法研究历史和研究特点的基础上,给出数字书法的主要研究内容和研究方向,包括:书法工具的数字化建模、书法图像的分析与处理、书法字形的合成与美化等;然后阐述数字书法每一类问题的具体研究目标、研究现状和研究趋势;最后,探讨数字书法进一步发展需要予以关注的重要问题和研究方向.

关键词

数字书法; 虚拟毛笔; 碑帖图像; 字形合成; 审美评价; 计算美学; 人工智能; digital calligraphy; virtual brush; tablet image; typeface synthesis; aesthetic evaluation; computational aesthetics; arti?cial intelligence;

摘要

近年来,随着数字技术的迅速发展,数字化成为目前非物质文化遗产保护与传播的主要方式之一.非物质文化遗产数字化在整个数字技术环境中包含一系列活动,涉及记录、保存、展示、传播等数字化实践工作以及相关学术研究和政策制定.本文对非物质文化遗产数字化的发展现状做了较为细致的梳理,从非物质文化遗产及其数字化的概念界定入手,介绍了非物质文化遗产数字化中采集、记录、保存、保护、展示、传播等研究主题,非物质文化遗产数字化的具体技术手段,数字博物馆与数据库等当前非物质文化遗产数字化的运行形态,讨论了在现有研究中存在的问题与不足,并根据最新的研究方向对这一研究领域目前的研究需求以及发展趋势进行了归纳与展望.

关键词

非物质文化遗产; 文化遗产数字化; 数字技术; intangible cultural heritage; digitalization of cultural heritage; digital technology;

非物质文化遗产数字化专刊 | 编者按

非物质文化遗产数字化专刊编者按

Website Google Scholar
周昆, 彭群生
中国科学: 信息科学, 2019, 49(2): 119-120

关键词

保护和传承; 非物质文化遗产;

Vol. 49, No. 1, 2019 封面 目录

摘要

为了提高指纹模板的安全性、不可逆性等性能,本文设计了一种基于局部细节点三维映射的指纹模板生成方法.首先对指纹图像进行预处理,提取指纹的细节点特征,并采用参数自适应的环形区域对细节点进行筛选,然后将细节点投影到直线上,并对投影后的向量集合进行量化、映射和取模运算生成固定长度的二进制比特串,最后结合用户PIN码生成指纹模板.在指纹数据库FVC2002-DB1和-DB2上的实验结果表明,该方法生成的指纹模板在认证性、可撤销性和不可逆性等主要性能上相比几种典型方法更具优势.

关键词

局部细节点; 三维映射; 参数自适应; 比特串; 指纹模板; local minutiae; three-dimensional mapping; parameter adaptive; bit-string; fingerprint template;

摘要

为了更有效地挖掘用户、上下文和广告之间的三维交互关系,张量分解模型开始被用于解决实时竞价广告响应预测问题.然而实时竞价广告响应预测面临严峻的数据稀疏和冷启动问题,尤其是广告转化率预测,单纯地依靠某类或某些信息很难有效地解决这些问题,只有同时综合利用各种各样的异质、异构信息才能有效地应对这些问题.本文面向张量分解模型,提出了基于异构信息融合的综合解决方案来解决数据稀疏问题.该方案针对不同信息的性能、类型、结构、存在方式和作用特点等,提出了不同的融合策略和不同的实现方法,提升了基于张量分解模型的广告响应预测方法的可靠性和准确性,有效地缓解了需求方平台进行广告响应预测时面临的严峻数据稀疏问题.在选定数据集上基于异构信息融合的模型预测性能与基准方法相比取得了显著的提升.

关键词

实时竞价广告; 广告响应预测; 张量分解; 异构信息融合; 数据稀疏; 冷启动; 预测方法; real-time bidding; response prediction; tensor decomposition; integration of heterogeneous information; data sparsity; cold start problem; prediction method;