计算机 软件 评述 Website Google Scholar SCOPUS引次: 0

国防科技大学建校70周年专题

群智范式: 软件开发范式的新变革

Crowd intelligence paradigm: a new paradigm shift in software development

王怀民, 余跃, 王涛, 丁博
中国科学: 信息科学, 2023, 53(8): 1490-1502
摘要 软件开发作为人类当代独特的智力活动,经历了从作坊式的个体创作到工业化群体大生产,再由工业化群体大生产回归大规模群体创作的历史转变,产生了工程范式与开源范式两次变革.工程范式聚焦线性的确定性问题的软件开发,几乎放弃对不确定性问题的关注.开源范式全面拥抱不确定性,但对结果不做确定性承诺.本文面向软件定义一切的新时代,系统总结两次软件开发范式变革的核心规律,结合我们长期的研究与实践,提出软件开发群智范式,采用“群体智能”为本源的科学观、“宏观演化、微观求精”的核心理念,以及“两个联接、一个转化”的方法论,重新认识软件开发活动,为人机物三元共融的群智软件开发提供指导.
关键词 软件开发; 范式变革; 工程范式; 开源范式; 群智范式; software development; paradigm shifting; engineering paradigm; open source paradigm; crowd intelligence paradigm;

计算机 软件 快报 Website Google Scholar SCOPUS引次: 0

AdvSce:面向自动驾驶系统的安全关键场景生成工具

AdvSce: safety critical scenario generation for testing autonomous driving systems

李昌文, 晏荣杰, 张健
中国科学: 信息科学, 2023, 53(4): 815-820
摘要 AdvSce是一个面向自动驾驶系统的安全关键场景生成工具,能够在给定初始场景的基础上,以添加额外交通参与者的方式,生成挑战自动驾驶系统控制车辆(主车)安全性的扰动场景,用于自动驾驶系统的仿真测试.不同于既往研究中,首先确定场景参数空间,再使用黑盒优化算法生成安全关键场景的工具或方法, AdvSce可以基于对主车行为的分析,在场景生成过程中动态地构造能够挑战主车安全性的场景参数空间,从而实现高度自动化且高效的安全关键场景生成.我们使用AdvSce在LGSVL仿真器中生成了面向Apollo 7.0自动驾驶系统的测试场景.结果表明,相比现有的安全关键场景生成工具, AdvSce具有更高的安全问题场景生成效率.
关键词 自动驾驶系统; 仿真测试; 安全关键场景生成; 基于搜索的优化; 行为序列提取; autonomous driving system; simulation-based testing; safety-critical scenario generation; searchbased optimization; behavioral sequence extraction;

计算机 软件 评述 Website Google Scholar SCOPUS引次: 0

基于深度学习的SQL生成研究综述

A survey of deep learning based text-to-SQL generation

梁清源, 朱琪豪, 孙泽宇, 张路, 张文杰, 熊英飞, 梁广泰, 郁莲
中国科学: 信息科学, 2022, 52(8): 1363-1392
摘要 SQL生成(text-to-SQL)是自动化软件工程的重要应用之一,也是语义解析领域的研究热点.SQL生成根据输入的自然语言描述自动生成相应的SQL数据库查询语句,它允许非专业人员在不了解SQL语法的情况下访问数据库.随着大量SQL相关数据集的不断构造以及人工智能技术的卓越进步, SQL生成任务也得到了极大的发展.基于深度学习的SQL生成(deep learning-based text-to-SQL)能够利用大规模数据的优势,从已有数据中学习自然语言、数据库以及SQL语句的表示,并根据新的自然语言输入生成符合查询需求的SQL语句.相对于传统的SQL生成,基于深度学习的SQL生成具有高准确率、输入信息灵活和可迭代学习的优点.近年来,研究者在基于深度学习的SQL生成方面进行了一系列的研究,本文从SQL生成场景、数据集、模型结构和评估方法层面对现有研究进行分类综述.
关键词 SQL生成; 语义解析; 深度学习; 代码生成; 编码–解码模型; text-to-SQL; semantic parsing; deep learning; code generation; encoder-decoder;

计算机 软件 论文 Website Google Scholar SCOPUS引次: 2

一种基于列计算的空间并置模式挖掘方法

A spatial co-location pattern mining approach based on column calculation

杨培忠, 王丽珍, 王晓璇, 周丽华
中国科学: 信息科学, 2022, 52(6): 1053-1068
摘要 空间并置(co-location)模式挖掘旨在发现空间特征间的关联关系.一个并置模式是空间特征集合的子集,它们的实例在空间中频繁并置出现.传统的并置模式挖掘方法大多基于表实例计算模式的并置程度,但表实例的生成和存储将导致巨大的时间、空间消耗.针对这一问题,本文提出了一种基于列计算的空间并置模式挖掘方法,不再生成表实例,只需要搜索模式的参与实例.为了加速参与实例搜索,设计了实例搜索空间剪枝、候选参与实例验证、频繁性提前感知等优化策略.在此基础上,提出了CPM-Col算法,讨论了算法的复杂度、正确性和完备性.在真实和模拟数据集上进行了大量实验,实验结果表明,本文提出的算法比其他7个baseline算法具有更好的性能和可扩展性,特别地,CPM-Col算法的效率提升达到数倍至数个量级.此外,实验验证了本文提出的优化策略的有效性.
关键词 空间数据挖掘; 并置模式; 列计算; 搜索算法; 剪枝技术; spatial data mining; co-location pattern; column calculation; search algorithm; pruning technique;

计算机 软件 论文 Website Google Scholar SCOPUS引次: 1

组合云系统可靠性概念漂移在线度量方法研究

Reliability concept drift online measurement for composite cloud systems

王磊, 张云秋, 徐丙凤, 徐逸卿
中国科学: 信息科学, 2021, 51(9): 1438-1450
摘要 随着全球云计算产业规模的迅速增长,采用按需付费的方式,基于云服务组合实现大规模软件服务的动态集成和协同,从而构造复杂软件,已成为一种切实可行的方法.所构建的组合云系统运行在动态、不确定的环境下,如何应对系统运行可靠性数据流的概念漂移问题,保障系统运行质量,是一个亟待解决的挑战性问题.为给针对组合云系统的可靠性自适应提供早期指导,本文基于主动式缺陷管理思想,研究组合云系统运行风险的在线感知方法,提出基于Sinkhorn距离的可靠性概念漂移在线度量方法 RCDMeas.这一方法通过引入熵正则化和不动点迭代,计算系统历史累积的可靠性流数据和临近的可靠性流数据的分布距离,从而识别组合云系统可靠性概念漂移及系统潜在运行风险.大规模数据实验结果验证了本文方法的有效性.本文的工作对服务组合系统的自动化运维具有重要的理论意义与实际应用价值.
关键词 组合云系统; 可靠性; 概念漂移; 在线; 运行质量保障; composite cloud systems; reliability; concept drift; online; execution quality assurance;

计算机 软件 论文 Website Google Scholar SCOPUS引次: 1

基于路径相似度的并行程序多路径覆盖调度序列排序

Path similarity-based scheduling sequence sorting for multi-path coverage of parallel programs

潘峰, 巩敦卫, 田甜, 姚香娟, 李吟
中国科学: 信息科学, 2021, 51(4): 565-581
摘要 测试是提高软件可靠性的重要方法.消息传递并行程序中存在的不确定通信语句,使得进程执行顺序具有不确定性,这增加了测试该类程序的难度.鉴于进程执行顺序对目标路径覆盖难易程度的影响,本文研究消息传递并行程序多路径覆盖调度序列排序方法,以提高多路径覆盖测试数据生成的效率.首先,在每个调度序列下,以每个采样的程序输入执行程序,生成路径覆盖矩阵;然后,针对每条目标路径,分别计算与路径覆盖矩阵中每条路径的相似度,生成多个路径相似度矩阵;接着,基于这些路径相似度矩阵的特征量,评价调度序列的性能,并依此对调度序列排序;最后,基于调度序列排序集,使用随机采样法,生成覆盖所有目标路径的测试数据,并使用缺陷检测平均百分比(average percentage of faults detected, APFD)指标评估调度序列排序集.将所提方法应用于9个基准并行程序中,并与随机方法和传统方法进行比较.实验结果表明,所提方法对路径覆盖率没有影响,但显著减少了被测程序执行次数和运行时间.
关键词 消息传递并行程序; 多路径覆盖; 测试; 调度序列排序; 路径相似度; message-passing parallel program; multi-path coverage; testing; scheduling sequence sorting; path similarity;

计算机 软件 论文 Website Google Scholar SCOPUS引次: 1

基于互联网群体智能的拼图问题求解

Solving pictorial jigsaw puzzles via Internet-based collective intelligence

申博, 张伟, 赵海燕, 金芝, 吴艳红
中国科学: 信息科学, 2021, 51(2): 206-230
摘要 拼图游戏是一类复杂问题的典型代表.这类问题的复杂性体现在其无法通过自上而下、集中控制的方式进行有效求解.通常情况下,拼图游戏由一个玩家独立完成,或由几个玩家围坐在一起协同完成.本文提出一种基于互联网人类群体智能的拼图问题求解方法.该方法使用一种被称为"探索–融合–反馈"的回路用于支持人类玩家群体在互联网环境中进行并行、协同的拼图问题求解.其中,探索活动由玩家实施,融合与反馈活动由拼图环境自动实施.在探索活动中,每个玩家独立进行拼图问题的求解,不与其他玩家发生直接的交互.在任何时刻,一个玩家探索活动的结果是一个关于当前拼图问题的片段解,以及一组被该玩家判断为错误的图块邻接关系.在融合活动中,拼图环境实时地将所有玩家的当前探索结果融合在一起,形成一个不断演化的群体观点图.在反馈活动中,对于每一个玩家,拼图环境根据该玩家的当前探索结果和当前的群体观点图,向该玩家推荐特定的信息,以加速其拼图进程.我们实现了一个支持上述方法的多人在线拼图环境,并在2~10人规模的玩家群体中进行了初步的实验.实验结果表明:(1)在这一多人拼图环境中,拼图求解时间大致正比于玩家数量的倒数,且以玩家群体中的最强个体为基准点,群体拼图效率能够实现31.36%~64.57%的提升;(2)在该环境中,最快完成拼图的玩家获得的反馈信息平均具有86.34%的准确率,且随着群体规模的增加,反馈信息在最快玩家拼图结果中的平均占比逐渐从20%增加到45%左右;(3)相比于面对面协同的群体拼图求解方式,该环境展示出更好的群体规模可扩展性,且拼图结果总是具有100%的正确率,而拼图问题自动求解算法平均只具有52%的正确率.我们希望本文工作能够为探索群体智能在互联网环境下的更广泛应用提供一些有用的信息或观点.
关键词 人类群体智能; 互联网; 复杂问题求解; 拼图问题; 信息融合与反馈; collective human intelligence; Internet; complex problem solving; pictorial jigsaw puzzle; information integration and feedback;