基于动作链的形式化任务协同规划
刘泽森, 李忠奎, 国萌
中国科学: 信息科学, 2024, 54(11): 2623-2641
摘要 基于形式化方法的多智能体任务规划因其丰富的任务形式和多样的系统功能而备受关注.然而,随着智能体数量增加,规划复杂度呈指数级增长,因此形式化方法在计算效率和集群规模上都受到了限制.已有的改良方法中,基于图搜索的方法对计算效率改进有限,只能处理中等规模的集群;而基于组合优化的算法忽略了智能体动作模型,无法处理大规模协同任务.本文针对以上局限,提出了基于智能体动作链的偏序任务分配算法,在保证正确性的基础上大幅提升规划性能.进一步针对环境不确定性和在线新任务,设计了自适应重规划算法和协作同步机制,确保任务执行过程中的鲁棒性.最后,通过数值仿真和对比验证了算法的有效性和可靠性.
关键词 多智能体任务规划; 形式化方法; 线性时序逻辑; 在线自适应; 偏序集; multiagent task planning; formal method; linear temporal logic; online self-adaptation; partially ordered set
Zesen LIU, Zhongkui LI, Meng GUO. Collaborative planning of formal tasks based on action chains. Sci Sin Inform, 2024, 54(11): 2623-2641, doi: 10.1360/SSI-2024-0105
基于自博弈强化学习的异构无人机集群协同对抗决策方法
严锐驰, 李帅, 王晨, 吴琦, 孙基男, 张世琨, 谢广明
中国科学: 信息科学, 2024, 54(7): 1709-1729
摘要 随着无人机技术的发展,无人机集群对抗已成为国内外研究热点.现有决策算法的研究主要集中于同构无人机集群对抗场景,且当应用于更复杂对抗场景时,存在奖励函数设计难度大、决策实时性难以满足等问题.为此,本文针对异构无人机集群对抗的实时机动决策问题展开研究.首先,构建了一个长机–僚机异构无人机集群的对抗仿真环境,其中,长机和僚机具有不同的机动和攻击能力,且对胜负具有不同影响力.其次,本文提出了一种基于多智能体强化学习的分布式无人机集群协同机动控制算法,并设计了一套结合课程学习和自博弈的策略训练与优化方法.通过设计简单的稀疏奖励结合课程学习方法即可学到异构无人机集群协同机动策略;引入自博弈对抗方式,使得对手无人机的策略更具针对性,以提升对抗的强度,从而进一步优化机动策略,使其更贴近实际需求.最后,仿真验证了本文所提方法的有效性和可扩展性.
关键词 集群对抗; 协同决策; 自博弈; 多智能体强化学习; 无人机; swarm confrontation; cooperative decision-making; self-play; multi-agent reinforcement learning; UAV
Ruichi YAN, Shuai LI, Chen WANG, et al. Cooperative decision-making for heterogeneous UAV swarm confrontation based on self-play reinforcement learning. Sci Sin Inform, 2024, 54(7): 1709-1729, doi: 10.1360/SSI-2023-0267
基于信息论的智能驾驶可解释多模态感知
张新钰, 国纪龙, 李骏, 李德毅, 张世焱, 沈思甜, 吴凡, 刘华平
中国科学: 信息科学, 2024, 54(6): 1419-1440
摘要 智能驾驶汽车已成为人们关注的热点话题之一.然而,现有的智能驾驶技术仍面临一系列挑战,如交通障碍物的遮挡所引起的模型漏检,以及当汽车驶入隧道等光线骤变的场景时所引起的传感器感知精度下降导致的误检问题等.为保证复杂场景下车辆的感知安全,智能驾驶多模态感知技术应运而生.然而,现有的多模态融合方法仍局限于对检测精度的提升,缺乏感知过程的可解释性,并缺少对模型感知过程的评价指标.本文从信息论角度出发,按照通信模型的构建方法对感知模型进行设计,提出了一种基于信源信道联合编码理论的多模态融合感知模型,从理论上对模型的感知过程进行解释.同时,提出了一种新的评价指标——平均信息熵变(average entropy variation, AEV),用AEV来实时反映模型与外界感知交互过程中的稳定性.进而,对多模态模型的感知过程进行量化分析,增加模型的可解释性.最后,与其他的感知模型在KITTI数据集的评估结果进行比较,我们的模型在经过相似的网络结构时平均信息熵变下降到0.5904,更好地保证了检测任务的感知安全.
关键词 可解释性; 信息论; 信源信道联合编码; 多模态融合; 智能驾驶; interpretability; theory of information; joint source-channel coding; multimodal fusion; intelligent driving
Xinyu ZHANG, Jilong GUO, Jun LI, et al. Information-theoretic-based interpretable multimodal perception for intelligent vehicles. Sci Sin Inform, 2024, 54(6): 1419-1440, doi: 10.1360/SSI-2023-0086
数据驱动的冗余机器人双层运动规划
刘梅, 尚明生
中国科学: 信息科学, 2024, 54(4): 960-975
摘要 冗余机器人在智能制造、救灾抢险与太空探索等领域扮演着重要角色.然而,对结构信息不准确或未知的冗余机器人进行运动规划是一个棘手的问题.此外,若不考虑冗余机器人末端执行器的姿态约束,可能会因姿态的不可控性导致任务失败.为解决该问题,在考虑末端姿态保持和多层关节物理限制的基础上,本文针对模型未知的冗余机器人提出了一种基于数据驱动技术的双层运动规划方案.该方案在关节角加速度层求解的同时能实现最小化关节角速度范数的要求.进而,构建一个离散神经动力学求解器以在线求解该方案.理论分析、仿真和物理实验验证了所提数据驱动的冗余机器人双层运动规划方案的可行性和有效性.
关键词 冗余机器人; 姿态保持; 数据驱动; 神经动力学; 非线性优化; redundant robots; orientation maintaining; data-driven; neural dynamics; nonlinear optimization
Mei LIU, Mingsheng SHANG. Data-driven double-level motion planning for redundant robots. Sci Sin Inform, 2024, 54(4): 960-975, doi: 10.1360/SSI-2023-0100
隐私保护下的多智能体系统弹性一致性控制
张冲, 伍益明, 徐明, 郑宁
中国科学: 信息科学, 2024, 54(4): 927-943
摘要 针对多智能体系统通信网络遭受欺骗攻击与隐私窃取问题,本文提出了一种新的具备隐私保护能力的多智能体系统弹性一致性算法.首先考虑到多智能体系统在信息传输环节直接将真实状态信息暴露给外界的问题,设计了一种基于状态分配思想的节点状态信息处理机制,来保证系统中节点状态信息隐私的安全性.其次考虑到外部攻击者对系统收敛的影响,在状态分配机制上进一步引入了检测环节,从而保证系统安全收敛.然后通过数学理论分析证明了算法能够有效保护节点初始状态信息隐私的同时能够保证系统实现弹性一致性收敛.最后通过数值仿真实验与对比实验,进一步验证了本文算法的有效性.
关键词 多智能体系统; 弹性一致性; 欺骗攻击; 隐私保护; 网络安全; multi-agent systems; resilient consensus; deception attack; privacy-preserving; cyber security
Chong ZHANG, Yiming WU, Ming XU, et al. Resilient consensus control of multi-agent systems under privacy protection. Sci Sin Inform, 2024, 54(4): 927-943, doi: 10.1360/SSI-2023-0124
自动驾驶车辆道路跟驰与状态一致性控制
郭胜辉, 罗世坚, 黄大荣, 宋家锋
中国科学: 信息科学, 2024, 54(2): 394-412
摘要 针对含有未知输入和外部干扰的非线性自动驾驶车辆时变跟驰队列系统,研究系统部分状态可测情况下的车辆道路跟驰和状态一致性控制问题.基于车辆跟驰和二自由度动力学模型,得到含有外部干扰和未知输入的离散化状态方程,利用前导跟驰特性,得到自动驾驶车辆跟驰队列系统;利用比例积分状态观测器解决系统部分状态不可测问题,提出一种基于观测器实现含有未知输入和外部干扰的自动驾驶车辆状态一致性控制协议;将观测器估计效果和一致性控制问题转化为误差系统的稳定性问题,由此构造Lyapunov-Krasovkii函数,利用离散系统稳定性理论推导出一个充分条件;通过求解线性矩阵不等式(linear matrix inequality, LMI)得到跟驰系统的增益矩阵和参数矩阵,利用H_∞性能指标分析系统鲁棒性.仿真结果表明:所设计观测器能够估计未知输入、外部干扰和系统状态,并且基于观测器设计能够使自动驾驶车辆道路跟驰和状态达到一致.
关键词 智慧交通; 自动驾驶车辆; 道路跟驰; 多智能体系统; 一致性控制; 外部干扰; intelligent transportation; autonomous vehicle system; path following; multiagent system; consistency control; external disturbance
Shenghui GUO, Shijian LUO, Darong HUANG, et al. Path following and status consistency control of autonomous vehicles. Sci Sin Inform, 2024, 54(2): 394-412, doi: 10.1360/SSI-2022-0424
移动机器人导航技术综述
姚陈鹏, 石文博, 刘成菊, 陈虹, 陈启军
中国科学: 信息科学, 2023, 53(12): 2303-2324
摘要 作为移动机器人的核心技术之一,导航技术涉及感知、决策、控制等多层架构,包含建图、定位、规划等主要模块,兼容经典控制与机器学习等多样算法,其相关研究涉及面广,时间跨度大,联系较为不明显.为梳理不同工作间关联,帮助快速了解移动机器人导航技术发展与挑战,本文从“导航”的词语释义与数学描述出发,以“导”与“航”两个主要目标为线索贯穿全文.通过分析不同环境下的导航应用局限,探究环境的空间复杂性与时间不确定性对导航技术产生的影响,阐明复杂场景应用下的研究现状与关键挑战.全文借助对近几十年来相关文献的归类梳理,寻找不同研究间的相关联系、研究初衷以及可能方案,拟在帮助读者加深对导航技术理解的同时,为后续研究提供思路参考.
关键词 移动机器人; 导航技术; 导航效率; 导航安全; 复杂环境; mobile robot; navigation technologies; navigation efficiency; navigation safety; complex environment
Chenpeng YAO, Wenbo SHI, Chengju LIU, et al. An overview of mobile robot navigation technology. Sci Sin Inform, 2023, 53(12): 2303-2324, doi: 10.1360/SSI-2022-0420
泛在计算视角下的群智模块化机器人
吴磊, 郭斌, 徐若楠, 刘思聪, 丁亚三, 党朝辉
中国科学: 信息科学, 2023, 53(11): 2107-2151
摘要 模块化机器人具备鲁棒、低成本和多功能性等优势,近年来得到研究人员的广泛关注,并在多领域不断替代或拓展传统的单体机器人.随着模块化机器人技术的发展,以及其与泛在计算、群体智能等前沿技术的紧密融合,将不断拓展在太空探测、智能制造、灾难救援等领域的应用,成为人机物三元融合空间中无处不在的新型智能终端.本文基于泛在计算新视角,对近年来群智模块化机器人领域的工作进行了系统性研究,构建并拓展其概念空间体系,阐释其自重构、自组织、自适应、持续演化等六大关键技术及最新发展趋势,进而介绍其在典型领域的创新应用.最后,对群智模块化机器人的未来发展方向及开放性挑战进行了分析和展望.
关键词 模块化机器人; 群体智能; 泛在计算; 自重构; 自组织; modular robots; crowd intelligence; ubiquitous computing; self-reconfiguration; self-organizing
Lei WU, Bin GUO, Ruonan XU, et al. Emergence of crowd modular robotics: a ubiquitous computing perspective. Sci Sin Inform, 2023, 53(11): 2107-2151, doi: 10.1360/SSI-2022-0385
无人机系统自主安全: 定义、建模与分级
潘泉, 郭亚宁, 吕洋, 李扬, 谈政
中国科学: 信息科学, 2023, 53(8): 1608-1628
摘要 自主与安全平衡是无人机技术与产业健康、快速发展的战略需求和核心关键.在同时面对“不断提升的无人自主飞行性能”与“日趋严峻的物理、信息、智能等多域安全威胁”的挑战下,仅借鉴有人机安全体系,适度拓展适航飞行和感知规避为核心的安全架构已不能满足现在和未来无人机系统的安全需求,构建无人机自主安全新架构显得十分必要和迫切.本文从自主性这一无人机固有的本质属性出发,初步研究了无人机自主安全架构,重点定义和表征了“无人机自主安全”新概念、构建了面向多域安全威胁和系统高度自主的无人机系统自主安全新模型、提出了无人机系统自主安全能力分级,为我国无人机行业健康快速发展提供基础支撑,为其他无人系统安全体系建立提供借鉴.
关键词 无人机系统; 多域威胁; 自主安全; 资源配置; unmanned aerial system; multi-domain threat; autonomous safety and security; resource configuration;
Quan PAN, Yaning GUO, Yang LYU, et al. Autonomous safety and security of UAV systems: definition, modeling, and gradation. Sci Sin Inform, 2023, 53(8): 1608-1628, doi: 10.1360/SSI-2022-0338
无人机续航能力
李学龙
中国科学: 信息科学, 2023, 53(7): 1233-1261
摘要 无人机是多样化的民生应用及临地安防技术领域的重要成员,“无人机到底能飞多久?”这个疑问已经在行业内引起了广泛的思考.作为无人机的心脏,其动力系统与无人机的飞行性能有着重要的关系,已成为航空领域最重要的发展方向之一.根据无人机动力系统的分类,本文分析了油动无人机、电动无人机、光动无人机的研究现状以及需要解决的技术问题,并特别关注了如何通过信号处理的方式达到智能飞行器长航时的目标,为无人机的续航能力及其动力的发展提供参考.
关键词 无人机; 智能飞行器; 续航能力; 油动无人机; 电动无人机; 光动无人机; UAVs; intelligent aircraft; endurance; oil-powered UAVs; electric UAVs; optics-driven UAVs;
Xuelong LI. Endurance of unmanned aerial vehicles. Sci Sin Inform, 2023, 53(7): 1233-1261, doi: 10.1360/SSI-2023-0130
基于弹性分析与函数回归模型的示教轨迹学习与泛化方法
肖宏远, 刘成菊, 陈启军
中国科学: 信息科学, 2022, 52(10): 1822-1836
摘要 示教学习是解决仿人机器人动态轨迹规划问题的高效方法.示教轨迹作为一种函数型数据,天然地具有耦合的时空特征,需要在函数型数据分析的理论框架下进行研究.传统的示教学习成果以“预处理”的形式解决上述耦合问题,不能充分利用示教轨迹的函数型数据本质.为了充分利用这一本质,本文采用弹性分析方法,将示教轨迹视作函数型数据,解决它们的时–空特征解耦问题.基于解耦后的示教轨迹,本文建立函数型回归模型并将其应用于动态轨迹的生成,实现示教轨迹在不同任务参数下的泛化.在实验中, JACO-2机械臂学习形态各异的技能并在不同的任务参数下完成任务,验证了提出方法的有效性.本文在统一的数学框架下,基于函数型数据分析的数学方法,解决一类仿人机器人的示教轨迹学习与泛化问题,具有较好的理论统一性与可实践性.
关键词 示教学习; 轨迹生成; 函数型数据; 弹性分析; 函数回归模型; learning from demonstration; trajectory generation; functional data; elastic analysis; functional regression model;
Hongyuan XIAO, Chengju LIU, Qijun CHEN. Learning and generalizing demonstration trajectories based on elastic analysis and the functional regression model. Sci Sin Inform, 2022, 52(10): 1822-1836, doi: 10.1360/SSI-2021-0259
面向特殊应用场景的无人机智能决策与控制专刊
仿猎鹰扑翼飞行器自主飞行控制系统设计
孙永斌, 马宝忠, 贺威, 何修宇, 付强
中国科学: 信息科学, 2022, 52(9): 1656-1671
摘要 仿生扑翼飞行器作为一种新型的飞行器,具有噪声小、隐蔽性好、机动性强、能量利用效率高等优势,在民用和军用领域具有广阔的应用前景.仿生扑翼飞行器的自主飞行能力是高效执行飞行任务的关键.目前,国内外飞行器的自主飞行研究已经取得了一些成果,然而鲜有以仿生扑翼飞行器为载体的研究.仿生扑翼飞行器特有的驱动结构给自主飞行控制研究带来了较大的挑战.本文以仿猎鹰扑翼飞行器作为研究平台设计了自主飞行控制系统.由于仿猎鹰扑翼飞行器的负载较小,本文采用了重量较轻的STM32微型计算平台作为主控芯片设计了硬件系统.由于微型计算平台的算力有限,本文综合考虑制导精度和运算速度,提出了一种线性/非线性切换制导算法,并通过仿真实验与线性制导、非线性制导算法进行了对比,证明了其更加适合于仿猎鹰扑翼飞行器.考虑到仿猎鹰扑翼飞行器的机构滞后问题,对其滚转角和高度设计了一个串级PID控制器.结合面向仿猎鹰扑翼飞行器的地面站软件,最终实现了基于仿猎鹰扑翼飞行器的自主定高圆弧轨迹跟踪任务.
关键词 仿生扑翼飞行器; 自主飞行; 线性制导; 非线性制导; 轨迹跟踪; bionic flapping-wing aircraft; autonomous flight; linear guidance; nonlinear guidance; trajectory tracking;
Yongbin SUN, Baozhong MA, Wei HE, et al. Design of an autonomous flight control system for imitation falcon flapping-wing aircraft. Sci Sin Inform, 2022, 52(9): 1656-1671, doi: 10.1360/SSI-2022-0067
面向特殊应用场景的无人机智能决策与控制专刊
基于随机采样的高层消防无人机协同搜索规划
李鸿一, 陈锦涛, 任鸿儒, 鲁仁全
中国科学: 信息科学, 2022, 52(9): 1610-1626
摘要 本文面向高层消防救援提出一种基于随机采样的多无人机协同搜索规划方法.首先,受随机树状采样搜索算法启发,提出一种搜索点最优分布方法,利用其在复杂环境下对有限空间重复搜索的特性,同时解决多无人机的路径点分布问题和任务分配问题.其次,设计一种基于交易规则的搜索点优化方法,以进一步提升搜索覆盖范围.然后,利用改进的和声搜索算法得到每架无人机遍历节点的最优顺序,进而获得各无人机的规划路径.最后,采用多线程方法模拟实际任务中的分布式运算,验证所提出方法的可行性.
关键词 高层消防; 随机采样; 和声搜索算法; 多无人机协同; 路径规划; high-rise firefighting; random sampling; harmony search; multi-UAV cooperation; path planning;
Hongyi LI, Jintao CHEN, Hongru REN, et al. Random-sampling-based multi-UAV cooperative search planning for high-rise firefighting. Sci Sin Inform, 2022, 52(9): 1610-1626, doi: 10.1360/SSI-2022-0038
面向特殊应用场景的无人机智能决策与控制专刊
无人机污染源自主搜寻算法综述
李中国, 陈文华, 刘存佳
中国科学: 信息科学, 2022, 52(9): 1579-1597
摘要 自主搜寻在环境保护、灾后搜救和工业监控等方面有重要作用.无人机传感平台凭借其灵活的机动性成为实现自主搜寻的有效途径之一.针对自主搜寻中两个关键任务,即污染源定位和污染边界跟踪,本文分别梳理了相关算法体系,并揭示了其设计思想的本质.对于污染物溯源,控制驱动和信息驱动两类算法是目前的研究主流,但两者的结合却鲜有报道.在边界跟踪方面,本文从单平台和多平台协作两方面总结了现有文献的控制和估计方法.根据双重控制思想,本文分析了相关算法的设计思路,并展望了下一步的研究重点.
关键词 自主搜寻; 无人机; 污染源搜寻; 边界跟踪; 双重控制; 探索与利用; autonomous search; UAV; source seeking; boundary tracking; dual control; exploration and exploitation;
Zhongguo LI, Wen-Hua CHEN, Cunjia LIU. Review of UAV-based autonomous search algorithms for hazardous sources. Sci Sin Inform, 2022, 52(9): 1579-1597, doi: 10.1360/SSI-2022-0044
考虑状态约束的五自由度塔式吊车多目标最优轨迹规划
刘卓清, 孙宁, 吴易鸣, 杨桐, 梁潇, 方勇纯
中国科学: 信息科学, 2022, 52(3): 521-538
摘要 为了提高塔式吊车的实际工作效率,往往需要在驱动旋臂和台车的同时改变绳长,以同步实现负载的运输与起落吊运.然而,目前针对变绳长塔式吊车控制问题的研究非常有限,依然处于起步阶段.对于变绳长塔式吊车而言,如何在保证系统良好暂态性能的基础上,减少运输时间、降低系统能耗,并同时实现综合最优是一个亟待解决的实际问题.为此,本文提出了一种考虑状态约束的五自由度塔式吊车多目标最优轨迹规划方法,首次实现了运输时间和系统能耗的Pareto最优,并可从理论上保证状态变量及其对应速度满足物理约束.具体而言,本文通过微分平坦输出信号构造和B样条曲线设计,实现了目标轨迹的定位和防摆性能,并利用改进的非支配近邻免疫算法(nondominated neighbor immune algorithm, NNIA)解决了多目标优化问题.最后,通过多组实际实验验证了所提方法的有效性.
关键词 塔式吊车; 欠驱动系统; 多目标优化; 轨迹规划; 摆动抑制; tower cranes; underactuated systems; multi-objective optimization; trajectory planning; swing suppression;
Zhuoqing LIU, Ning SUN, Yiming WU, et al. Multi-objective trajectory planning for 5-DOF underactuated tower cranes with state constraints. Sci Sin Inform, 2022, 52(3): 521-538, doi: 10.1360/SSI-2021-0106