人工智能系统(18)
工业大模型: 体系架构、关键技术与典型应用
任磊, 王海腾, 董家宝, 贾子翟, 李世祥, 王宇清, 赖李媛君, 黄迪, 张霖, 吴文峻, 李伯虎
中国科学: 信息科学, 2024, 54(11): 2606-2622
摘要 随着新一代人工智能的发展,大模型(如GPT-4o等)凭借大规模训练数据、网络参数和算力涌现出强大的生成能力、泛化能力和自然交互能力,展现出改变工业世界的巨大潜力.尽管大模型已在自然语言等多个领域取得突破性进展,但其在工业应用中的探索仍处于初级阶段,当前工业大模型的系统性研究仍属空白.工业应用中特有的异质数据模态、复杂多样的专业化场景、长流程的关联性决策、以及对于可信性实时性的高要求,使得通用大模型无法直接用于解决复杂的工业问题,亟需开展全新的工业大模型基础理论和关键技术研究.本文系统地探讨了工业大模型的挑战问题、概念内涵、体系架构、构建方法、关键技术与典型应用.从5个挑战问题的分析出发,提出了工业大模型的全新定义和体系架构;同时,提出了工业大模型的四阶段构建方法,阐述了工业大模型核心关键技术;然后,基于所提出的工业大模型6种核心应用能力,探讨了面向产品全生命周期的工业大模型典型应用场景,并给出了“基石”工业大模型原型系统在生成式人工智能方面的应用实例;最后,探讨和展望了工业大模型未来的研究方向和开放性问题.本文将为工业大模型这一全新研究方向的开辟与发展,提供基础理论、关键技术和行业应用的全面指导.
关键词 工业大模型; 工业基础模型; 生成式人工智能; 具身智能; 工业智能体; 智能制造; industrial foundation model; industrial AI foundation model; AIGC; embodied intelligence; industrial agent; intelligent manufacturing
Lei REN, Haiteng WANG, Jiabao DONG, et al. Industrial foundation model: architecture, key technologies, and typical applications. Sci Sin Inform, 2024, 54(11): 2606-2622, doi: 10.1360/SSI-2024-0185
基于深度强化学习的卫星动态任务实时调度时效性优化方法
李可, 熊顺蕊, 戴朋林, 宋彤雨, 禹旭敏, 李天瑞
中国科学: 信息科学, 2024, 54(10): 2443-2469
摘要 随着全球卫星数量的快速增长和天基网络的蓬勃发展,优化卫星任务调度以确保任务观测时效性变得至关重要.任务调度方法不仅影响观测数据采集的效率,还直接关系到天基信息系统能否及时响应多种实时应用需求.然而,针对非周期动态任务,传统批处理调度方法存在局限性,需收集完所有任务信息后才能作出决策,而现有基于深度强化学习的实时调度方法也无法保证紧急任务的观测时效性.鉴于此,本文首次提出了“时效性优化的敏捷卫星动态任务实时调度”问题,该问题定义任务观测时效性指标,综合考虑任务观测延迟和接收任务的总收益,以最大化所有任务观测时效性.为了求解该问题,设计了两阶段时效性优化算法PPODL-HR.在任务选择阶段,提出了基于深度神经网络和长短期记忆网络的近端策略优化以加快模型的收敛速度;在资源分配阶段,设计了启发式规则,通过任务合并进一步降低任务切换所需的卫星转换时间.通过数值仿真和STK仿真验证, PPODL-HR算法在任务观测时效性方面优于传统的静态批处理调度和现有的动态任务实时调度算法,且适用于不同任务密度和不同紧急性任务占比的情况.特别地,与经典的动态任务实时调度算法相比,任务观测时效性提高了21.14%,任务观测延迟降低了4.55%,接收任务的总收益增加了20.70%.
关键词 时效性优化; 卫星任务调度; 动态任务实时调度; 深度强化学习; 任务观测时效性; 启发式; timeliness optimization; satellite task scheduling; real-time scheduling for dynamic tasks; deep reinforcement learning; timeliness of task observation; heuristic rule
Ke LI, Shunrui XIONG, Penglin DAI, et al. Timeliness optimization of real-time scheduling for satellite dynamic tasks based on deep reinforcement learning. Sci Sin Inform, 2024, 54(10): 2443-2469, doi: 10.1360/SSI-2023-0368
基于MASAC强化学习算法的多无人机协同路径规划
方城亮, 杨飞生, 潘泉
中国科学: 信息科学, 2024, 54(8): 1871-1883
摘要 针对动态不确定环境下异构多无人机协同路径规划问题,提出了一种新的多智能体深度强化学习算法.首先,开发了一个空域场景下多无人机到达目标地点的强化学习环境,环境引入了无人机动力学方程,并考虑了无人机异构的因素以及安全避障的需求.其次,设计了任务完成率、编队保持率、飞行时间等性能指标,用以衡量算法的优劣.然后,将多无人机协同路径规划问题建模为部分可观Markov决策过程,提出了一种多智能体柔性执行评价(multi-agent soft actor critic, MASAC)算法寻求该问题的近似最优策略.最后,通过仿真实验验证了所提算法的有效性和优越性.
关键词 多无人机; 路径规划; 多智能体深度强化学习; 部分可观Markov决策过程; MASAC算法; multi-UAV; path planning; multi-agent deep reinforcement learning; partially observable Markov decision process; multi-agent soft actor critic algorithm
Chengliang FANG, Feisheng YANG, Quan PAN. Multi-UAV collaborative path planning based on multi-agent soft actor critic. Sci Sin Inform, 2024, 54(8): 1871-1883, doi: 10.1360/SSI-2024-0050
基于深度强化学习和知识迁移的飞机装配脉动生产线调度方法
钟金成, 马浩宇, 龙明盛, 王建民
中国科学: 信息科学, 2024, 54(6): 1441-1457
摘要 飞机装配是飞机制造中的关键环节,如何对飞机装配脉动生产线进行合理调度,实现降本增效,是智能制造领域的重要科学问题.然而,飞机装配脉动生产线场景复杂,装配单架飞机就包含上万道工序,这为飞机装配调度问题的形式化建模和高效求解带来新的挑战,因而当前生产实践中主要依靠人类专家经验进行手工调度.本文聚焦降低人力负载的优化目标,提出两种领域特定的技术以解决飞机装配调度问题.首先,将飞机装配脉动生产线调度问题建模为两个马尔可夫(Markov)决策过程,通过双重强化学习智能体决策生成飞机装配的近似调度方案.其次,针对强化学习决策鲁棒性不足的缺陷,提出领域知识迁移方法,将强化学习的求解知识迁移到整数规划约束剪枝中,最后利用整数规划求解器优化得到综合性能优异的调度方案.在飞机装配生产线的真实数据上完成了实验验证,结果表明本文提出的基于深度强化学习和知识迁移的调度方法能够成功扩展到年产量近百架次的飞机装配脉动生产线调度问题,将组合优化方法难以求解的问题优化到分钟级求解,相较于基线方法取得显著性能优势.
关键词 飞机装配; 智能调度; 组合优化; 强化学习; 知识迁移; aircraft assembly; intelligent scheduling; combinatorial optimization; reinforcement learning; knowledge transfer
Jincheng ZHONG, Haoyu MA, Mingsheng LONG, et al. Scheduling approach for aircraft assembly pulsation production lines with deep reinforcement learning and knowledge transfer. Sci Sin Inform, 2024, 54(6): 1441-1457, doi: 10.1360/SSI-2023-0197
自动驾驶开源数据体系: 现状与未来
李弘扬, 李阳, 王晖杰, 曾嘉, 徐慧琳, 蔡品隆, 陈立, 严骏驰, 徐丰, 熊璐, 王井东, 朱福堂, 许春景, 汪天才, 夏飞, 穆北鹏, 彭志辉, 林达华, 乔宇
中国科学: 信息科学, 2024, 54(6): 1283-1318
摘要 随着自动驾驶技术的不断成熟与应用,系统性梳理开源自动驾驶数据集有利于产业生态良性循环.现有自动驾驶数据集可大致分为两代,第一代数据集的传感模态复杂度相对较低、数据集规模相对较小,且大多局限于感知级任务,以发布于2012年的KITTI为代表.相比于第一代数据集,第二代数据集的特征为传感模态复杂度较高、数据集规模与多样性较丰富、所设置任务从感知扩展到预测、规控上,以2019年前后提出的nu Scenes, Waymo为代表.本文联合学术界、产业界同仁,首次系统性梳理了国内外70余种开源自动驾驶数据集,对如何构建高质量数据集、数据在算法闭环体系中发挥的核心作用、如何利用生成式大模型规模化生产数据等进行了总结.此外,就未来第三代自动驾驶数据集应该具备的特质和数据规模,以及需要解决的科学与技术问题,进行了详细分析与讨论.希望本文的归纳与展望能促进新一代自动驾驶数据集与生态体系的建设、推动关键领域自主原创与科技自强的发展.
关键词 自动驾驶; 数据算法闭环; 基础模型; 数据集与挑战赛; autonomous driving; data pipeline; foundation model; dataset and challenge
Hongyang LI, Yang LI, Huijie WANG, et al. Open-sourced data ecosystem in autonomous driving: the present and future. Sci Sin Inform, 2024, 54(6): 1283-1318, doi: 10.1360/SSI-2023-0313
单样本学习下时序约束稀疏表示的物体识别方法
童小宝, 熊鹏文, 宋爱国, 刘小平
中国科学: 信息科学, 2024, 54(1): 191-209
摘要 非接触式传感器相比接触式触觉传感器可以避免与物体直接接触过程中产生的噪声,因而能够获取更有价值的原始数据表征物体内在属性;然而针对非接触式传感器感知的物体属性数据而言,现有算法难以实现单样本学习下的物体准确识别.为解决这一问题,本文提出一种新颖的单样本学习下时序约束稀疏表示方法 (one-shot learning with temporally constrained sparse representation, OSL-TCSR)用于识别5种不同材料下的50个物体类别.首先将两种原始数据(Lumini光谱和SCiO光谱)并行投影至共享子空间,并且使用聚类典型关联分析法(cluster canonical correlation analysis, C-CCA)计算两种原始数据的聚类相关性特征;其次通过稀疏表示分别计算得到聚类相关性特征数据以及原始数据的编码向量,并利用原始数据的编码向量对相关性特征数据的编码向量进行二次投影映射;然后将两次映射后的原始数据和相关性特征数据进行重构,以充分耦合化两种光谱数据,解决了单样本学习下的数据稀缺问题;进一步地,设计新颖的时序约束稀疏表示方法计算重构后的原始数据和相关性特征数据,以充分考虑每个光谱序列的时序特征;最后与最新的物体识别方法进行实验对比,结果表明提出的OSL-TCSR方法提高了单样本学习情况下的物体识别结果.此外, OSL-TCSR还可灵活迁移至多种应用场景,比如材料识别或纹理识别等.
关键词 物体识别; 聚类相关性特征; 单样本学习; 时序约束正则化; object recognition; clustering correlation characteristics; one-shot learning; temporally constrained regularization
Xiaobao TONG, Pengwen XIONG, Aiguo SONG, et al. Object recognition based on one-shot learning with temporally constrained sparse representation. Sci Sin Inform, 2024, 54(1): 191-209, doi: 10.1360/SSI-2022-0256
舰载机保障作业人机协同决策方法
李亚飞, 高磊, 蒿宏杰, 靳远远, 王可, 徐明亮
中国科学: 信息科学, 2023, 53(12): 2493-2510
摘要 舰载机保障作业是航空母舰航空保障系统的重要组成部分,其调度效率不仅影响舰载机出动架次率,而且严重制约航空母舰作战效能发挥.在多舰载机保障的动态甲板作业环境下,安全高效地为舰载机分配保障资源,最大限度地减少舰载机因资源分配冲突产生的时间开销,是提高舰载机保障作业调度效率的关键途经.现有基于启发式、机器学习等方法舰载机保障作业调度策略,存在计算量大、鲁棒性差、训练效率低等问题.为此,本文将舰载机保障作业调度问题建模为分布式多智能体协同控制的顺序决策问题,构建了一种新颖的基于人机协同的多智能体作业调度决策框架HCMTPF(human-machine collaborative multi-agent task planning framework),有效地提高了保障作业调度决策模型的学习效率.在此基础上,提出了一种基于人类行为可信度的自适应作业分配方法,进一步提高了智能体自主探索能力和人类指导经验利用率.经大量仿真实验验证,本文提出的舰载机保障作业人机协同决策方法比其他方法在计算性能和学习效率方面具有明显优势.
关键词 舰载机; 人机协同; 深度强化学习; 任务分配; 资源分配; carrier aircraft; human-machine collaboration; deep reinforcement learning; task allocation; resource allocation
Yafei LI, Lei GAO, Hongjie HAO, et al. Human-machine collaborative decision-making for carrier aircraft support operations. Sci Sin Inform, 2023, 53(12): 2493-2510, doi: 10.1360/SSI-2022-0403
博弈智能的研究与应用
郝建业, 邵坤, 李凯, 李栋, 毛航宇, 胡舒悦, 王震
中国科学: 信息科学, 2023, 53(10): 1892-1923
摘要 博弈智能是一个涵盖博弈论、人工智能等方向的交叉领域,重点研究个体或组织间的交互作用,以及如何通过对博弈关系的定量建模进而实现最优策略的精确求解,最终形成智能化决策和决策知识库.近年来,随着行为数据的海量爆发和博弈形式的多样化,博弈智能吸引了越来越多学者的研究兴趣,并在现实生活中得到广泛应用.本文围绕博弈智能这一研究领域,分别从3个方面进行了系统的调研、分析和总结.首先,回顾了博弈智能的相关背景,涵盖了单智能体马尔可夫(Markov)决策过程,基于博弈论的多智能体建模技术,以及强化学习、博弈学习等多智能体求解方案.其次,依照智能体之间的博弈关系不同,将博弈分为合作博弈、对抗博弈以及混合博弈这三大类范式,并分别介绍了每种博弈智能范式下的主要研究问题、主流研究方法以及当前典型应用.最后,总结了博弈智能的研究现状,以及亟待解决的主要问题与研究挑战,并展望了学术界和工业界的未来应用前景,为相关研究人员提供参考,进一步推动国家人工智能发展战略.
关键词 博弈智能; 博弈论; 人工智能; 多智能体系统; 强化学习; 均衡求解; game intelligence; game theory; artificial intelligence; multiagent systems; reinforcement learning; equilibrium computing
Jianye HAO, Kun SHAO, Kai LI, et al. Research and applications of game intelligence. Sci Sin Inform, 2023, 53(10): 1892-1923, doi: 10.1360/SSI-2023-0010
面向人机序贯决策实现共享控制下的仲裁优化
张倩倩, 赵云波, 吕文君, 陈谋
中国科学: 信息科学, 2023, 53(9): 1768-1783
摘要 共享控制存在于众多由人类智能和机器智能共同参与的序贯决策场景.由于人的决策范围和智能机器的决策范围尚未予以明确划分,需要加以实时仲裁从而达到人机共存并且共享决策权限.为此本文提出了一种仲裁优化方法,该方法的独特之处在于引入自主性边界概念,优化了共享控制中人机决策动作的仲裁机制.本文为自主性边界的计算和更新维护提供了思路,能够基于贝叶斯规则的意图推理分析人机共享系统可能要实现的目标,从而确定仲裁参数.此外,本文还分析了自主性边界的不确定性以促进边界信息对共享控制中决策质量的优化效果.实验结果表明,所提出的方法在累积奖励、成功率、撞击率方面表现出色,这些说明了本文提出的共享控制中的仲裁优化方法在求解人机序贯决策问题时的有效性和价值.
关键词 共享控制; 仲裁优化; 自主性边界; 人机序贯决策; 强化学习; shared control; arbitration optimization; autonomous boundary; human-machine sequential decision-making; reinforcement learning
Qianqian ZHANG, Yun-Bo ZHAO, Wenjun LV, et al. Shared control with optimized arbitration for human-machine sequential decision-making. Sci Sin Inform, 2023, 53(9): 1768-1783, doi: 10.1360/SSI-2022-0295
数据驱动的策略优化控制律设计最新研究综述
赵斐然, 游科友
中国科学: 信息科学, 2023, 53(6): 1027-1049
摘要 随着通信技术和新一代人工智能的迅速发展,强化学习这一数据驱动的控制方法引起了极大的关注.本文回顾了强化学习中的一类典型方法——策略优化法——在系统控制律设计上的最新研究进展.主要讨论了其在各种重要线性最优控制问题上的收敛性及样本复杂度,例如线性二次控制、输出反馈控制、■控制、分布式控制等.此外,对策略优化法在网络化系统控制中的应用作了展望.
关键词 线性系统; 最优控制; 策略梯度法; 强化学习; 数据驱动控制; linear system; optimal control; policy gradient method; reinforcement learning; data-driven control;
Feiran ZHAO, Keyou YOU. Survey of recent progress in data-driven policy optimization for controller design. Sci Sin Inform, 2023, 53(6): 1027-1049, doi: 10.1360/SSI-2022-0455
博弈收益控制研究进展
王龙, 陈芳, 陈星如
中国科学: 信息科学, 2023, 53(4): 623-646
摘要 在博弈论中,单个个体控制全部个体的收益通常被认为是不可能的.一个例外是20世纪末在重复囚徒困境中提出的均衡器策略:使用这种策略的个体可以将对手的收益设置为由收益函数所决定的某个区间内的任意值.十余年后发现的零行列式策略通过单方面设置个体收益的线性关系,将该结果一般化.在此基础上,关于博弈收益控制的研究取得了一系列成果.本文概述了博弈收益控制的研究现状;介绍了单次博弈和重复博弈中的收益控制技术;从收益控制的基本概念、能控制的收益关系、收益控制策略的形式和收益控制策略的演化特性等方面总结了博弈中收益控制的主要进展和成果;并讨论了博弈收益控制的未来发展趋势.
关键词 博弈论; 收益控制; 零行列式策略; 演化博弈论; 策略设计; game theory; payoff control; zero-determinant strategy; evolutionary game theory; strategy design;
Long WANG, Fang CHEN, Xingru CHEN. Payoff control in game theory. Sci Sin Inform, 2023, 53(4): 623-646, doi: 10.1360/SSI-2022-0263
非完全信息下人机合作对抗博弈专题
基于MASAC的无人机集群对抗博弈方法
王尔申, 刘帆, 宏晨, 郭靖, 何宁, 赵琳, 薛健
中国科学: 信息科学, 2022, 52(12): 2254-2269
摘要 随着无人机智能化水平的提高和集群控制技术的发展,无人机集群对抗智能决策方法将成为未来无人机作战的关键技术.无人机集群对抗学习环境具有维度高、非线性、信息有缺失、动作空间连续等复杂特点.近年来,以深度学习和强化学习为代表的人工智能技术取得了很大突破,深度强化学习在解决复杂环境下智能决策问题方面展现出了不俗能力.本文受多智能体集中式训练–分布式执行框架和最大化策略熵思想的启发,提出一种基于非完全信息的多智能体柔性行动器–评判器(multi-agent soft actor-critic, MASAC)深度强化学习方法,建立基于多智能体深度强化学习的无人机集群对抗博弈模型,构建连续空间多无人机作战环境,对红蓝双方无人机集群的非对称性对抗进行仿真实验,实验结果表明MASAC优于现有流行的多智能体深度强化学习方法,能使博弈双方收敛到收益更高的博弈均衡点.进一步对MASAC的收敛情况进行实验和分析,结果显示MASAC具有良好的收敛性和稳定性,能够保证MASAC在无人机集群对抗智能决策方面的实用性.
关键词 深度强化学习; 多智能体; 对抗博弈; MASAC; 无人机集群; deep reinforcement learning; multi-agent; confrontation game; MASAC; UAV clusters;
Ershen WANG, Fan LIU, Chen HONG, et al. MASAC-based confrontation game method of UAV clusters. Sci Sin Inform, 2022, 52(12): 2254-2269, doi: 10.1360/SSI-2022-0303
非完全信息下人机合作对抗博弈专题
非完备策略集下人机对抗空战决策方法
李守义, 陈谋, 王玉惠, 吴庆宪, 贺建良
中国科学: 信息科学, 2022, 52(12): 2239-2253
摘要 在真实的空战对抗环境中,不确定性广泛存在.本文考虑人机对抗场景中的空战决策问题,提出了一种非完备策略集下的博弈决策方法.首先,将对抗的无人机群和有人机群的动态博弈过程分解为不同的决策阶段,并将当前的决策阶段建模为一个零和博弈模型.所建模型考虑了有人机群的策略不完全可知的情形,并用一个不确定效用矩阵来描述这种非完备策略.随后,基于矩阵博弈中的最大最小策略概念,提出了非完备策略下博弈模型的求解方法,从而给出了无人机群的决策序列.最后通过仿真实验验证了所提方法的有效性.
关键词 无人机; 空战决策; 人机对抗; 非完备策略集; 博弈论; 最大最小策略; unmanned air vehicle(UAV); air combat decision-making; human-computer gaming; incomplete strategy set; game theory; maximum-minimum strategy;
Shouyi LI, Mou CHEN, Yuhui WANG, et al. Human-computer gaming decision-making method in air combat under an incomplete strategy set. Sci Sin Inform, 2022, 52(12): 2239-2253, doi: 10.1360/SSI-2022-0222
非完全信息下人机合作对抗博弈专题
分层决策多机空战对抗方法
王欢, 周旭, 邓亦敏, 刘小峰
中国科学: 信息科学, 2022, 52(12): 2225-2238
摘要 在空战研究领域,战术决策旨在提高博弈对抗收益,进而提升战机攻击效率.现有战术决策算法大多基于规则方法设计,当应用于多机空战的复杂环境时则存在设计难度大,难以求解最优解等问题.本文提出一种分层决策多机空战对抗方法,首先,在训练初始阶段借鉴已有人类专家经验,指导模型训练;其次,根据战术动作类型设计分层动作决策网络,降低动作决策空间维度;最后,将训练产生的对抗经验按阶段分解,降低策略学习难度.在多机空战仿真环境中进行了实验验证,相比于现有多机空战决策方法,本文提出的方法在训练收敛性和决策性能方面均具有更好的表现.
关键词 多机空战; 动作决策网络; 博弈; 分层强化学习; 决策收益; multi-aircraft air combat; action decision-making network; game; hierarchical reinforcement learning; decision gain;
Huan WANG, Xu ZHOU, Yimin DENG, et al. A hierarchical decision-making method for multi-aircraft air combat confrontation. Sci Sin Inform, 2022, 52(12): 2225-2238, doi: 10.1360/SSI-2022-0185
非完全信息下人机合作对抗博弈专题
非完全信息下基于PPO-CFR的扩展式博弈决策
黄蕾, 朱进, 段福庆
中国科学: 信息科学, 2022, 52(12): 2178-2194
摘要 非完全信息下的人机对抗通常可以通过双人零和博弈模型加以描述,反事实后悔最小化(counterfactual regret minimization, CFR)是处理非完全信息双人零和博弈的一种流行算法.然而现有CFR及其变体算法在迭代过程中使用固定的后悔值计算和策略更新类型,在非完全信息扩展式博弈下表现各有优劣,泛化性能薄弱.针对这一问题,本文将强化学习近端策略优化(proximal policy optimization,PPO)算法与CFR算法相结合,提出一种PPO-CFR算法,通过训练出理性的智能体,从而实现CFR迭代过程后悔值计算和策略更新类型的自适应选择,以提高算法的泛化性能,并实现非完全信息扩展式博弈的策略优化.本文采用通用的扑克博弈实验验证所提算法,并制定逐步奖励函数训练智能体的动作策略,实验结果表明,与现有方法相比, PPO-CFR算法具有更好的泛化性能和更低的可利用度,迭代策略更为逼近纳什均衡策略.
关键词 非完全信息; 扩展式博弈; 反事实后悔最小化; 近端策略优化; 博弈决策; incomplete information; extensive game; counterfactual regret minimization; proximal policy optimization; game decision-making;
Lei HUANG, Jin ZHU, Fuqing DUAN. Extensive game decision based on the PPO-CFR algorithm under incomplete information. Sci Sin Inform, 2022, 52(12): 2178-2194, doi: 10.1360/SSI-2022-0216
非完全信息下人机合作对抗博弈专题
非全时有效人类决策下的人机共享自主方法
游诗艺, 康宇, 赵云波, 张倩倩
中国科学: 信息科学, 2022, 52(12): 2165-2177
摘要 在人机共享自主中,人和智能机器以互补的能力共同完成实时控制任务,以实现双方单独控制无法达到的性能.现有的许多人机共享自主方法倾向于假设人的决策始终“有效”,即这些决策促进了任务的完成,且有效地反映了人类的真实意图.然而,在现实中,由于疲劳、分心等多种原因,人的决策会在一定程度上“无效”,不满足这些方法的基本假设,导致方法失效,进而导致任务失败.本文提出了一种新的基于深度强化学习的人机共享自主方法,使系统能够在人类决策长期无效的情况下完成正确的目标.具体来说,我们使用深度强化学习训练从系统状态和人类决策到决策价值的端到端映射,以显式判断人类决策是否无效.如果无效,机器将接管系统以获得更好的性能.我们将该方法应用于实时控制任务中,结果表明该方法能够及时、准确地判断人类决策的有效性,分配相应的控制权限,并最终提高了系统性能.
关键词 人机系统; 共享自主; 非全时有效决策; 深度强化学习; 仲裁; human-machine system; shared autonomy; non-full-time effective decision; deep reinforcement learning; arbitration;
Shiyi YOU, Yu KANG, Yun-Bo ZHAO, et al. Human-machine shared autonomy approach for non-full-time effective human decisions. Sci Sin Inform, 2022, 52(12): 2165-2177, doi: 10.1360/SSI-2022-0225
具有学习和推理能力的空间无人系统智能架构
黄煌, 李谋, 刘磊, 汤亮, 刘昊, 谢心如, 刘乃龙, 魏春岭, 邢琰, 姜甜甜, 胡海东, 常亚菲, 胡勇, 杨孟飞
中国科学: 信息科学, 2022, 52(11): 2093-2105
摘要 以卫星、飞船、深空探测器为代表的航天器是一类典型的无人系统,经历了从自动化到自主化的不断发展.为提升航天器对未知空间环境和复杂空间任务的适应能力和智能自主水平,以空间无人系统为研究对象设计了具有学习和推理能力的无人系统智能架构,给出架构的组成及功能;接着分析该架构中学习和推理能力的运作机制,并针对架构所需的动作库和知识库的构建、更新与扩展方法等关键技术提出解决方案;最后通过地外星表巡视采样任务示例,具体说明在该智能架构下的新知识生成、基于知识的推理和自主执行任务的过程,以及过程中知识库、环境、任务和动作库之间的交互关系.
关键词 学习和推理能力; 空间无人系统; 智能架构; 动作库; 知识库; learning and reasoning capabilities; space unmanned system; intelligent architecture; action library; knowledge library;
Huang HUANG, Mou LI, Lei LIU, et al. Intelligent architecture of space unmanned system with learning and reasoning capabilities. Sci Sin Inform, 2022, 52(11): 2093-2105, doi: 10.1360/SSI-2022-0036
基于强化学习的高速列车群运行调整方法
代学武, 程丽娟, 崔东亮, 俞胜平, 袁志明, 应志鹏
中国科学: 信息科学, 2022, 52(5): 890-906
摘要 随着我国高速铁路建设成网,行车密度不断提高,在出现突发事件导致列车晚点时,行车调度的复杂性和难度急剧增加,如何动态调整列车群运行,以减少晚点,提高准点率是运行调整的核心.本文提出了一种适用于突发事件下高速列车群运行调整的无模型强化学习方法.首先将多个列车在多个车站和闭塞区间的运行调整建模为受约束的资源占用和配置的多阶段序贯决策过程,提出了基于动态时空拓扑矩阵的车站和区间统一化建模方法.针对高铁列车群时空关联强的特点,首次提出了一种包含车辆位置、路网资源等时空分布信息的强化学习状态空间、动作空间和回报函数,构建了有效的奖励反馈机制.然后,针对高铁运行系统搜索空间巨大的难点,提出了启发式动作子空间自适应生成方法,利用部分显式静态约束构建启发式规则减少搜索空间,有效减少了无模型强化学习的试错次数,提高了求解效率,也保留了无模型通用性好的优点.最后,基于京广高铁实际案例的仿真分析表明,在发生不同时空范围的大风限速,导致多车延误的事件下,所提出的算法均能较好收敛,明显减少列车群内晚点传播,与MILP, ACO, FCFS方法相比,列车群的平均晚点时间可减少2%~20%.
关键词 强化学习; 时空拓扑矩阵; 列车运行调整; FCFS算法; 优化; reinforcement learning; spatio-temporal topology matrix; train rescheduling; FCFS algorithm; optimization;
Xuewu DAI, Lijuan CHENG, Dongliang CUI, et al. Rescheduling of high-speed trains: a reinforcement learning approach. Sci Sin Inform, 2022, 52(5): 890-906, doi: 10.1360/SSI-2021-0073
复杂网络与系统(6)
基于间歇控制策略的双层网络广义同步
宋长江, 周进, 卫红凯, 张森
中国科学: 信息科学, 2024, 54(8): 1924-1939
摘要 复杂网络是刻画现实世界的有效工具,而同步现象是复杂网络中最为普遍的现象之一,广义同步更因其普适性吸引着研究者的目光.本文研究单向耦合双层驱动–响应网络的广义同步问题.判定广义同步存在的辅助系统方法因其简单有效自提出起便被广泛使用,并于21世纪初被推广应用于复杂网络.而对于不能自发同步的网络,间歇控制是一种常见且有效的控制机制.间歇控制策略不仅符合现实场景,还能够减少通信,节约控制资源.基于此,本文研究单向耦合双层网络的层间广义同步,并利用辅助系统方法,提出间歇控制策略下的双层网络广义同步准则.首先,本文提出线性反馈牵制间歇控制机制下的网络广义同步准则.进一步,为节约控制资源,考虑自适应牵制控制器在间歇控制策略下的网络广义同步问题.本文从理论和仿真两方面证实了间歇控制策略下的双层网络层间广义同步可行性.
关键词 双层复杂网络; 广义同步; 间歇控制; 牵制控制; 自适应控制; two-layer complex network; generalized synchronization; intermittent control; pinning control; adaptive control
Changjiang SONG, Jin ZHOU, Hongkai WEI, et al. Generalized synchronization of two-layer networks based on intermittent control strategy. Sci Sin Inform, 2024, 54(8): 1924-1939, doi: 10.1360/SSI-2023-0385
火力与制导资源联合分配的快速构造算法组合设计
王加根, 辛斌, 李冠呈
中国科学: 信息科学, 2024, 54(6): 1458-1473
摘要 火力与制导资源联合分配问题是军事运筹学研究中典型的NP完全问题,其求解具有较高的实时性要求.精确求解算法难以适用,而近来提出的构造算法的时间开销也相对较大,严重影响算法的实际应用.为了解决该问题,本文将其建模为多阶段传感器–武器–目标分配(sensor-weapon-target assignment, S-WTA)问题,并分解成两类作战资源分配子问题.在武器分配阶段采用了一种基于威胁值确定分配优先级的快速构造算法,在传感器分配阶段提出了一种新的基于阶段顺序确定分配优先级的快速构造算法,该算法能充分利用约束条件,大幅度减小时间开销.本文在两种基本构造算法与基于边际损失的构造算法的基础上进一步提出了构造算法序列化组合,对多阶段S-WTA问题进行求解.计算实验验证了新提出的基本构造算法的快速性以及构造算法序列化组合相比于各种基本构造算法的性能优势.
关键词 异构资源联合分配; 传感器 – 武器 – 目标分配; 启发式算法; 构造算法; 协同作战; heterogeneous resources co-allocation; sensor-weapon-target assignment; heuristic algorithms; constructive algorithms; cooperative engagement
Jiagen WANG, Bin XIN, Guancheng LI. Combinatorial design of fast construction algorithms for joint allocation of firepower and guidance resources. Sci Sin Inform, 2024, 54(6): 1458-1473, doi: 10.1360/SSI-2023-0253
基于多阶邻居传播度量和拓扑特征的高影响力节点识别
罗余, 王建波, 李平, 杜占玮, 许小可
中国科学: 信息科学, 2024, 54(4): 944-959
摘要 如何定量评估复杂网络中节点的影响力是一个重要的研究课题,因为它有助于深入理解网络的结构和功能.现有的多数方法主要基于网络固有拓扑的分析建立,缺少对多阶邻居节点的传播性质和拓扑信息的综合利用,然而它们对影响力节点识别有重要影响.为此,本文提出了一种综合多阶邻居传播度量和拓扑特征(multi-order neighbor propagation metrics and topological features, MNPMTF)的算法来有效识别复杂网络中的影响力节点.首先,该算法结合传播模型和最短路径来刻画邻居节点的传播概率,从而量化节点之间信息传播的可能性.其次,考虑多阶邻居中的邻居重叠比形成邻居重叠度,进而量化信息在邻居网络中的传播路径.再次,利用节点的k壳、h指数和聚类系数构成新指标KHC系数,以此来描述节点的拓扑特征.最后,算法综合3阶邻居范围内的传播概率、邻居重叠度和拓扑特征以评估节点的影响力.在9个真实网络上的大量实验表明,所提算法在排序准确性、有效性和区分能力等多方面均优于7种具有代表性的方法,为复杂网络中节点影响力评估提供了一种新的思路.
关键词 传播概率; 邻居重叠度; KHC系数; 影响力节点; 复杂网络; propagation probability; neighbor overlap; KHC coefficient; influential nodes; complex networks
Yu LUO, Jianbo WANG, Ping LI, et al. Identification of high-influential nodes based on multi-order neighbor propagation metrics and topological features. Sci Sin Inform, 2024, 54(4): 944-959, doi: 10.1360/SSI-2023-0201
高阶网络牵制控制中单纯形的选择
周进, 李博, 陆君安, 史定华
中国科学: 信息科学, 2024, 54(3): 708-718
摘要 随着网络科学的发展,普通网络无法描述多个个体间的交互作用,这就有必要引入高阶网络.高阶网络能够刻画普通网络无法描述的网络特征,其中单纯形(2阶以上)扮演着关键角色.牵制控制具有“四两拨千斤”的作用,在高阶网络中只需牵制一部分单纯形就能达到同步.但如何选取合适的单纯形进行牵制控制,是一个充满挑战而又全新的课题.本文给出高阶网络达到同步的自适应牵制控制律,并提出如何选择合适的单纯形进行牵制,选择方式由高阶网络广义Laplacian矩阵次小特征值对应的单位特征向量分量决定.数值仿真结果表明该方法简单有效,牵制控制效果与单纯形选择方式一致.
关键词 复杂网络; 高阶网络; 牵制控制; 同步; 单纯形; complex networks; higher-order networks; pinning control; synchronization; simplexes
Jin ZHOU, Bo LI, Jun-An LU, et al. Selection of simplexes in pinning control of higher-order networks. Sci Sin Inform, 2024, 54(3): 708-718, doi: 10.1360/SSI-2023-0142
基于半张量积的双合作博弈Shapley值计算
李志强, 李文鸽, 何秋锦, 宋金利, 杨俊起
中国科学: 信息科学, 2022, 52(7): 1302-1316
摘要 合作博弈中的参与人只将合作、不合作作为自己的策略,而双合作博弈是合作博弈的一般化,参与者以合作、不合作和弃权作为自己的策略,以获得自己所在的联盟利益的最大化,从而使自己的收益达到最优.与合作博弈一样,如何分配参与者联盟获得的总收益是双合作博弈的一个重要研究问题.本文利用矩阵半张量积工具,研究了双合作博弈的Shapley值计算问题.首先构造了双合作博弈的Shapley矩阵,然后将双合作博弈的Shapley值计算转化为双合作博弈的特征函数矩阵与Shapley矩阵乘积形式.本文得到的Shapley值矩阵计算公式形式简洁,不但简化了计算,而且为双合作博弈的研究提供了新的工具.
关键词 合作博弈; 双合作博弈; Shapley值; Shapley矩阵; 矩阵半张量积; cooperative game; bicooperative game; Shapley value; Shapley matrix; semi-tensor product of matrices;
Zhiqiang LI, Wenge LI, Qiujin HE, et al. The Shapley value for bicooperative games based on the semi-tensor product. Sci Sin Inform, 2022, 52(7): 1302-1316, doi: 10.1360/SSI-2021-0337
基于生物网络的关系推断原理、方法与应用
李梢, 张鹏, 古槿, 江瑞, 李衍达
中国科学: 信息科学, 2022, 52(5): 856-869
摘要 在生物医学大数据时代,如何全面有效地发现致病基因、药物靶标等关键要素,从整体上理解宏观表型的微观本质,是目前信息科学与中西医学交叉研究面临的重大共性挑战之一.生物系统是典型的复杂系统,克服上述挑战的关键是:如何通过深入理解复杂生物系统的“关系”本质,解决复杂系统多层次信息融合难题以及生物医学大数据中广泛存在的维度高、噪声大、样本少等难点.“生物网络”是构成复杂生物系统的基础,反映人体内部基因和基因产物等各种生物分子的相互关系、生物分子与疾病和药物等不同层次的关系,生物网络已被广泛用于生物医学大数据的分析.李梢课题组从20余年前开始中西医药与生物网络的关联研究,率先提出“网络靶标”假说,并进行方法构建与应用.本文对基于生物网络的关系推断理论与方法进行总结与思考.首先,从原理上,发现疾病宏观表型与微观分子在复杂生物网络中存在“层次模块化关系”,即宏观层次的涌现在微观上具有局域模块性,宏观表型越相似,微观致病基因或药物靶标在网络上的模块性关联越强.其次,从方法上,给出基于生物网络从生物医学大数据、少量目标样本中推断关键生物要素的“关系推断”一般性方法框架:以层次模块化关系为基础,从全局角度进行关系网络构建、关系表示与建模、未知关系推断,实现关系的实体化、数学化、整体化.进而,从应用上,基于生物网络的关系推断方法在致病基因与药物靶标预测、疾病标志物识别、中医药机制解析等方面表现出很好的性能.综上,关系推断方法能够为从系统角度和分子水平揭示中西医药科学原理提供系统解决方案,也为网络药理学等新兴学科提供重要的原理和方法学支撑.
关键词 复杂生物网络; 模块化; 多层次关联; 关系推断; 小样本推断; 网络药理学; complex biological network; modularity; multilevel relationship; relationship inference; small-sample inference; network pharmacology;
Shao LI, Peng ZHANG, Jin GU, et al. Principle, method and application of relationship inference based on biological networks. Sci Sin Inform, 2022, 52(5): 856-869, doi: 10.1360/SSI-2021-0243
分布式控制与优化(12)
基于联盟形成博弈的异构无人机集群分布式任务分配算法
薛舒心, 马亚杰, 姜斌, 李文博, 刘成瑞
中国科学: 信息科学, 2024, 54(11): 2657-2673
摘要 针对无人机集群携带异构资源以及任务的异构需求下的复杂任务分配优化求解问题,提出一种基于联盟形成博弈的分布式任务分配算法.首先针对任务分配问题规模较大的特点以及资源的异构性,提出一种基于异构资源的改进K-medoids聚类算法,通过对无人机集群和任务进行聚类的预处理,降低了任务分配的规模和难度.考虑任务需求、机载资源以及路径成本等条件建立任务分配模型,将原有任务分配问题转化为联盟划分问题,设计了一种基于联盟形成博弈的分布式任务分配算法进行求解.最后,将30个具有异构需求的任务分配给100架携带3种异构资源的无人机的仿真结果表明,所提算法能够实现较好的任务分配效果,同时极大提高任务分配的实时性,充分发挥集群效能.
关键词 任务分配; 异构无人机集群; 异构资源; 聚类算法; 联盟形成博弈; task allocation; heterogeneous UAV swarms; heterogeneous resources; clustering algorithm; coalition formation game
Shuxin XUE, Yajie MA, Bin JIANG, et al. Distributed task allocation algorithm for heterogeneous unmanned aerial vehicle swarm based on coalition formation game. Sci Sin Inform, 2024, 54(11): 2657-2673, doi: 10.1360/SSI-2024-0167
智能超表面辅助的无线通信网络性能优化综述
虞文武, 聂晓凯, 蔡豫晋, 李广举, 刘洪喆, 程强, 崔铁军
中国科学: 信息科学, 2024, 54(11): 2503-2517
摘要 作为新一代智能化综合数字信息基础设施,第六代移动通信(6G)深度融合人工智能、大数据以及先进计算等技术,构建泛在互联,智能体高效互通的新型网络模式,具有更大系统容量、更快信息传输速率以及更加智能化与数字化的性能特征.智能超表面(reconfigurable intelligent surface, RIS)是推动未来6G通信网络实现超级无线带宽、超大规模连接以及极其可靠通信能力等方面性能的极具潜力的新兴技术.该技术是基于在数字超材料平面上集成的大量低成本无源反射元件,通过自适应配置无线传播环境,显著提高无线通信网络在复杂场景下的性能,而实现自适应动态调控通信链路的关键在于对RIS辅助的网络系统优化.为此,本文通过对RIS近年来在网络性能优化方面相关研究文献进行综述,从RIS辅助通信的网络架构及其性能优化方案和应用场景两个方面总结了当前RIS辅助的无线通信网络性能优化研究成果与进展,并进一步讨论了通信网络部署RIS的潜在未来研究方向.
关键词 智能超表面; 无线通信网络; 性能优化; 6G; reconfigurable intelligent surface; wireless communication networks; performance optimization
Wenwu YU, Xiaokai NIE, Yujin CAI, et al. A survey on the performance optimization of wireless communication networks assisted by reconfigurable intelligent surface. Sci Sin Inform, 2024, 54(11): 2503-2517, doi: 10.1360/SSI-2024-0060
风电场分布式经济模型预测控制
孔小兵, 王文文, 刘向杰
中国科学: 信息科学, 2024, 54(9): 2200-2223
摘要 随着风电场规模的不断扩大,尾流效应导致场内下游风机发电功率降低和疲劳载荷加剧问题日益严重.为了降低风电场运营成本,提高动态经济性能,本文提出了一种风电场分层控制结构.在上层通过优化全场风机的诱导因子实现当前风向下的全场最大风能捕获,为下层本地控制提供各机组的最佳降载跟踪功率基准.在下层采用基于终端区域约束的稳定分布式经济模型预测控制策略对各风机实施本地控制,在保证满足电网负荷需求的同时有效降低机组的疲劳载荷,提高风电场的动态经济性.最后,通过SimWindFarm软件对由9台风机组成的风电场进行仿真实验,验证了风向变化、阶跃风速扰动和湍流风速扰动3种情况下所设计控制策略的有效性.
关键词 风电场控制; 尾流效应; 疲劳载荷; 分布式经济模型预测控制; 凸序列规划; wind farm control; wake effect; fatigue load; distributed economic model predictive control; sequential convex programming
Xiaobing KONG, Wenwen WANG, Xiangjie LIU. Distributed economic model predictive control of wind farms. Sci Sin Inform, 2024, 54(9): 2200-2223, doi: 10.1360/SSI-2024-0081
一类基于分数阶梯度信息的变阶次扩散LMS算法
杨洋, 莫立坡, 左敏, 于永光
中国科学: 信息科学, 2024, 54(8): 1907-1923
摘要 针对分布式网络中的参数估计问题,本文提出了一类基于分数阶梯度信息的扩散LMS算法,主要利用分数阶梯度的变阶次机制来提升算法的各项性能.首先,针对已有的集中式分数阶梯度LMS算法,将其推广到分布式网络中的参数估计问题上来.进而,讨论了所提算法的收敛速度和收敛精度.其次,考虑到分数阶阶次对于算法性能的影响,设计了一个变分数阶阶次的策略来充分发挥分数阶的优点以提升算法的收敛特性.进一步,证明了切换拓扑结构下所提算法的收敛性.最后,通过数值仿真结果,从收敛速度、收敛精度、鲁棒性等角度验证了所提算法的有效性和优越性.
关键词 分布式估计; 扩散式 LMS 算法; 适应性滤波; 切换拓扑; 分数阶微积分; distributed estimation; diffusion LMS algorithm; adaptive filter; switching topologies; fractional calculus
Yang YANG, Lipo MO, Min ZUO, et al. A class of diffusion LMS algorithm with variable fractional order gradient. Sci Sin Inform, 2024, 54(8): 1907-1923, doi: 10.1360/SSI-2024-0003
扰动线性多智能体系统的分布式资源分配算法
时侠圣, 孙长银, 穆朝絮
中国科学: 信息科学, 2024, 54(4): 911-926
摘要 针对一般异构线性多智能体系统的分布式资源分配问题,结合智能体动力学特性设计一类分布式优化算法,旨在实现扰动抑制的同时完成资源的最优分配.面对扰动模型已知干扰信号,本文利用智能体状态信息设计一种自适应分布式优化算法,其中拉格朗日(Lagrange)乘子对偶变量控制参数自动增加,直至拉格朗日乘子对偶变量达到一致.当智能体状态信息不可测时,本文将上述算法修改为基于输出反馈的分布式优化算法.当全局成本函数强凸时,借助拉萨尔(LaSalle)不变性引理证明上述所提算法渐近收敛到全局最优解.面对未知扰动信号,本文利用扩张状态观测器技术设计一种分布式优化算法.当未知扰动信号为常数或其微分趋于零时,利用李雅普诺夫(Lyapunov)理论证明上述算法渐近收敛至全局最优解.最后利用数值仿真验证上述算法有效.
关键词 异构多智能体系统; 资源分配; 自适应通信权重; 状态反馈; 输出反馈; 未知扰动; heterogeneous multi-agent systems; resource allocation; adaptive communication weight; state feedback; output feedback; unknown disturbance
Xiasheng SHI, Changyin SUN, Chaoxu MU. Distributed resource allocation algorithms for linear multi-agent systems with disturbances. Sci Sin Inform, 2024, 54(4): 911-926, doi: 10.1360/SSI-2023-0093
具有非协同步长的噪声鲁棒分布式资源分配算法
吴温文, 朱善迎, 刘帅, 关新平
中国科学: 信息科学, 2024, 54(3): 692-707
摘要 针对通信噪声干扰下的资源分配问题,本文提出了基于对偶梯度追踪的分布式算法以实现资源的最优配置.通过设计新的噪声追踪策略与引入抑制系数,本文算法对噪声干扰具有更好的鲁棒性,并且支持各节点使用非协同步长进行迭代更新.理论分析证明了对于非Lipschitz光滑甚至不可微的强凸目标函数,算法在噪声干扰下仍能收敛到最优解邻域并且具有O(1/k)收敛速率.最后,在IEEE14母线和IEEE 118母线系统上验证了本文所提出分布式算法的有效性和可拓展性.
关键词 分布式优化; 对偶问题; 噪声抑制; 资源分配; 非协同步长; distributed optimization; dual problem; noise suppression; resource allocation; uncoordinated stepsizes
Wenwen WU, Shanying ZHU, Shuai LIU, et al. Noise-robust distributed resource allocation with uncoordinated step-sizes. Sci Sin Inform, 2024, 54(3): 692-707, doi: 10.1360/SSI-2023-0022
基于事件触发的互联电力系统分布式负荷频率预测控制
马苗苗, 李钰梅, 崔婧, 刘向杰
中国科学: 信息科学, 2023, 53(7): 1392-1403
摘要 针对具有约束和扰动的多区域互联电力系统负荷频率控制(load frequency control, LFC)问题,本文提出了一种事件触发分布式模型预测控制(event-triggered distributed model predictive control,ET-DMPC)策略.将大规模互联电力系统分解成多个动态耦合的子系统,考虑发电机变化率约束(generation rate constraint, GRC)和调速器阀门位置限制,建立分布式预测控制优化问题.为了降低系统计算负担,减少计算资源的消耗和浪费,基于预测值和系统实际状态的误差构造事件触发条件.在事件触发机制下,只有子系统满足相应的事件触发条件时,控制器才传输状态信息和求解优化问题,并与邻域子系统交互最优解作用下的关联信息.仿真结果表明,本文提出的控制策略在负荷扰动和系统参数不确定的情况下具有良好的鲁棒性,同时极大地降低了系统的计算负担.
关键词 负荷频率控制; 分布式模型预测控制; 事件触发; 互联电力系统; 发电机变化率约束; load frequency control; distributed model predictive control; event-triggered; interconnected power system; GRC;
Miaomiao MA, Yumei LI, Jing CUI, et al. Event-triggered distributed model predictive load frequency control of an interconnected power system. Sci Sin Inform, 2023, 53(7): 1392-1403, doi: 10.1360/SSI-2022-0343
基于边云协同的建筑能源系统分布式供需协同优化
徐占伯, 周春翔, 吴江, 刘坤, 管晓宏
中国科学: 信息科学, 2023, 53(3): 517-534
摘要 建筑能源系统能耗总量巨大且用能弹性高,具有很大的节能优化潜力,其提效节能被认为是降低能源电力系统终端碳排放、实现“2030碳达峰、2060碳中和”国家战略目标的重要途径之一.然而,建筑能源系统节能优化面临人员行为与系统能耗交互影响、多种能源介质时空多尺度耦合与供需能量平衡等建模挑战,以及系统决策空间随建筑规模指数增长的维数灾计算复杂性挑战.针对上述挑战,本文从信息物理融合的角度出发,提出了基于节点–流量模型的建筑能源系统分布式优化模型,刻画了电、气、热等能源物理网络与信息网络的交互影响,实现了局部数据采集和计算的一体化结构设计,支撑边云协同计算体系.进而,设计了基于边云协同的分布式迭代优化算法,证明了算法的收敛性,可实现建筑能源系统供需协同优化,并大大降低了对全局信息的依赖性和通信需求.本文以6种不同规模下实际建筑系统的数值测试结果,验证了所提方法的性能和有效性,特别在大规模建筑能源系统上具有良好的应用前景.
关键词 建筑能源系统; 信息物理融合系统; 边云协同计算; 供需协同优化; 系统优化; building energy system; cyber-physical system; edge-cloud computing; supply-demand coordination; system optimization;
Zhanbo XU, Chunxiang ZHOU, Jiang WU, et al. Edge-cloud framework-based distributed optimization of a building energy system with supply-demand coordination. Sci Sin Inform, 2023, 53(3): 517-534, doi: 10.1360/SSI-2022-0053
网络攻击下产品与供应链协同演进系统数据驱动变更控制设计
李庆奎, 高雪峰, 彭晨, 张蕴隆, 易军凯
中国科学: 信息科学, 2023, 53(2): 325-343
摘要 产品与供应链协同演进系统(product and supply chain synchronous evolution system, PSCSE)是一类复杂的分布式信息物理系统(cyber-physical system, CPS),含有大量的未建模动态与不确定性.剧烈的需求波动及突发的网络事件,使系统结构参数极易发生变化.产品设计变更是维持PSCSES稳定、满足用户需求及保证经济效益的重要手段.本文研究基于分布式CPS的PSCSES在受到DoS攻击下的应急变更控制问题.首先,针对PSCSES在网络攻击下数据包丢失问题,利用每条子链的历史数据设计基于循环神经网络(recurrent neural network, RNN)的预测器以弥补因网络攻击造成的库存数据丢失;其次,利用博弈论思想将H∞一致性控制问题转化为多人零和图博弈问题,提出一种应急变更补偿机制;进而基于Q-learning的策略迭代技术设计了模型未知的控制器求解算法,实现了系统的库存状态H∞一致性.最后,仿真实验验证了所提方法的有效性.
关键词 网络攻击; 数据驱动; 供应链; 变更控制设计; 多智能体; cyber-attacks; data-driven; supply chain; change control design; multi-agent;
Qingkui LI, Xuefeng GAO, Chen PENG, et al. Data-driven change control design for product and supply chain synchronous evolution systems under cyber-attacks. Sci Sin Inform, 2023, 53(2): 325-343, doi: 10.1360/SSI-2021-0435
有向图中含弹性关节多机械臂系统的分布式一致性
孟祥正, 吴爱国, 梅杰, 马广富
中国科学: 信息科学, 2023, 53(1): 81-96
摘要 本文主要研究有向图中含弹性关节多机械臂系统的一致性问题,利用模型参考自适应一致性方法,将含弹性关节多机械臂系统的一致性问题转化成参考模型的一致性和单个机械臂系统的轨迹跟踪问题两个子问题.考虑到机械臂的相对角速度信息难以获取的情况,提出了无需相对角速度信息的线性参考模型.在轨迹跟踪算法设计上,利用反步法对单个机械臂系统设计了跟踪控制算法,使得系统达到关节角度趋于一致的结果.
关键词 含弹性关节机械臂; 一致性; 分布式控制; 多智能体系统; 有向图; manipulator with elastic joints; consensus; distributed control; multi-agent systems; directed graph;
Xiangzheng MENG, Aiguo WU, Jie MEI, et al. Consensus of multiple manipulators with elastic joints under a directed graph. Sci Sin Inform, 2023, 53(1): 81-96, doi: 10.1360/SSI-2021-0349
车站封锁下基于问题知识的高速铁路列车运行实时调整方法
王荣笙, 张琦, 张涛, 林鹏, 丁舒忻, 袁志明
中国科学: 信息科学, 2022, 52(11): 2121-2140
摘要 针对突发事件导致的车站封锁情况,本文以列车运行图为问题对象,以进化计算框架为基础,提出基于问题知识的运行图实时调整方法,通过减小列车总晚点时间,保证高铁运营的安全高效和旅客的满意舒适.首先,基于调整列车发车次序的运行图调整策略提出排列编码方法,用于减少解空间的无效搜索.之后,根据“紧追踪”的列车运行追踪方式,设计启发式解码方法消除所有行车作业约束,提升算法求解效率.最后,将调度员调整运行图的经验作为问题知识,用于初始化进化计算的初始种群,由此提出基于问题知识的启发式种群初始化方法,加快算法前期的收敛速度并提高求解方案质量.以京津高速线为例,在北京南站设置车站封锁下20~150 min不同封锁时长的9个典型场景,选择加强精英保留遗传算法和差分进化算法,分别应用实整数编码和排列编码,与随机种群初始化和启发式种群初始化的不同组合进行仿真实验.仿真结果表明,相较于实整数编码难以获取可行解, 2种进化算法应用排列编码方法后,能在9 s的平均时间内给出列车总晚点时间最小的调整方案.在启发式种群初始化的改进下, 2种进化算法能更快地收敛于近似最优解.选取加强精英保留遗传算法应用排列编码和启发式种群初始化的改进变体,作为本文最优改进进化算法.针对CPLEX无法在10 min获得最优解的7个场景,该改进进化算法都能在20 s内给出近似最优解.
关键词 高速铁路; 列车运行调整; 车站封锁; 进化计算; 遗传算法; 排列编码优化; high-speed railway; train rescheduling; station blockage; evolutionary computing; genetic algorithm; permutation-based optimization;
Rongsheng WANG, Qi ZHANG, Tao ZHANG, et al. Real-time rescheduling approach of train operation for high-speed railways using problem-specific knowledge under a station blockage. Sci Sin Inform, 2022, 52(11): 2121-2140, doi: 10.1360/SSI-2021-0332
考虑V2G背景下微电网的一致性能量管理策略
任丽娜, 武瀚, 焦晓红
中国科学: 信息科学, 2022, 52(6): 1098-1113
摘要 电动汽车具有移动储能器的特性,对其充放电行为进行合理调度可以对电网负荷起到削峰填谷作用,并提高电网对风光能源的吸纳能力,为此本文研究了含有电动汽车与电网交互(vehicle-to-grid,V2G)的孤岛微电网分布式能量管理策略.首先通过充放电电价诱导机制,提出一种包含电动汽车聚合商的多智能体微电网效益模型,进而考虑实际能源系统在发电损耗及功率平衡约束下的社会效益最大化问题.其次利用微电网内分布式能源之间信息交互,设计基于多智能体一致性理论的优化求解算法,并进一步考虑系统中存在通信随机时延的情况,最终实现社会效益最大化且系统电价达到一致,并对此研究背景下算法的收敛性进行分析,给出了收敛条件.最后采用标准IEEE-11总线结构对系统进行仿真验证,证明了所提控制策略的有效性.
关键词 V2G; 多智能体系统; 发电损耗; 通信时延; 分布式一致性; V2G; multi-agent system; power loss; time delay; distributed consistency;
Lina REN, Han WU, Xiaohong JIAO. Consistency-based energy management strategy for microgrids with V2G. Sci Sin Inform, 2022, 52(6): 1098-1113, doi: 10.1360/SSI-2021-0218
故障诊断与控制系统安全(14)
非平稳工业过程异常监测方法:综述与展望
王敏, 冯智彬, 吴德浩, 张景欣, 周东华
中国科学: 信息科学, 2024, 54(8): 1807-1826
摘要 实际工业过程受多种因素(如原材料变化、负载波动、设备老化等)的影响,往往表现出非平稳特性,即过程监测数据统计特性随时间发生变化,因此非平稳过程异常监测备受关注并已成为监测领域的焦点之一.本文从监测方法的角度对非平稳过程异常监测相关研究成果进行了系统性的回顾:首先对非平稳过程的概念和技术难点进行了概述;其次,将非平稳过程监测方法根据原理的差异划分为五大类,并总结了各类方法的优点与不足;最后,结合当前技术发展的现状,对非平稳过程研究中的挑战进行了深入分析与展望.
关键词 非平稳过程; 过程监测; 自适应建模; 协整分析; 平稳子空间分析; 慢特征分析; 深度学习; non-stationary processes; process monitoring; adaptive modeling; cointegration analysis; stationary subspace analysis; slow feature analysis; deep learning
Min WANG, Zhibin FENG, Dehao WU, et al. Overview and prospect of abnormal monitoring methods for non-stationary processes. Sci Sin Inform, 2024, 54(8): 1807-1826, doi: 10.1360/SSI-2023-0377
基于异构图注意力的工业设备故障诊断知识图谱补全方法
马亚杰, 刘洋, 姜斌, 冒泽慧, 刘剑慰, 刘文静
中国科学: 信息科学, 2024, 54(2): 354-372
摘要 针对工业设备故障诊断知识图谱故障实体属性残缺、故障关系链接缺失的问题,本文提出了一种基于知识图谱异构图注意力网络(knowledge graph heterogeneous graph attention network, KGHAN)模型的工业设备故障诊断知识图谱补全方法,通过对故障实体概念补全和故障关系链接补全完善了工业设备故障诊断知识图谱.所提KGHAN模型在异构图注意力网络模型的基础上,融合了故障知识结构信息和故障图结构信息,有效地表征了故障实体和故障关系的嵌入表示,提高了故障实体概念补全任务的准确率和故障关系链接补全任务的命中率.将所提工业设备故障诊断知识图谱补全方法应用在国内某企业的工业设备故障运维数据上,结果表明,故障实体概念补全任务的准确率提高了约10%,故障关系链接补全任务的命中率提高了约37%,验证了方法的有效性.
关键词 知识图谱补全; 知识图谱; 图神经网络; 故障诊断; 工业设备; knowledge graph completion; knowledge graph; graph neural network; fault diagnosis; industrial equipment
Yajie MA, Yang LIU, Bin JIANG, et al. Knowledge graph completion method for industrial equipment fault diagnosis based on heterogeneous graph attention. Sci Sin Inform, 2024, 54(2): 354-372, doi: 10.1360/SSI-2022-0440
基于前景理论的行为安全博弈
路石, 杨浩, 姜斌
中国科学: 信息科学, 2024, 54(1): 210-226
摘要 本文基于前景理论在博弈的框架下研究了行为感知概率对网络化系统中攻防资源配置的影响.首先,在理性决策情形下,通过融合物理系统、执行器攻击和资源分配模型,构建了一个新的安全博弈框架.其次,针对决策者依靠感知概率而非真实概率进行主观决策的情形,基于前景理论构造了行为安全博弈模型.然后,建立了安全博弈和行为安全博弈下期望收益函数关于攻防资源凹凸性的充要条件,并深入分析和比较了安全博弈和行为安全博弈下攻防资源最优配置的存在性和唯一性以及行为概率对安全博弈的影响.最后以无人机群为例进行了仿真,验证了所提方法的有效性.
关键词 执行器攻击; 前景理论; 资源分配; 安全博弈; 行为安全博弈; actuator attacks; prospect theory; resource allocation; security game; behavioral security game
Shi LU, Hao YANG, Bin JIANG. Prospect theory-based behavioral security game. Sci Sin Inform, 2024, 54(1): 210-226, doi: 10.1360/SSI-2023-0002
多方ARX系统的协作安全辨识——一种基于门限Paillier密码体制的最小二乘辨识方法
谭建伟, 王继民, 张纪峰
中国科学: 信息科学, 2023, 53(12): 2472-2492
摘要 本文研究了多方参与的随机线性系统的协作安全参数辨识问题,提出了一种基于门限Paillier密码体制的安全多方最小二乘辨识算法.具体地,通过对正负整数的合理编码,将(门限) Paillier密码体制的加密对象及同态特性由非负整数扩展到了整数.利用门限Paillier密码体制和将数据沿时间轴切分的方法,设计了相应的安全多方参数辨识算法.给出了算法正确加解密所需的明文空间大小条件、保证隐私安全性的时间切分长度条件以及一定条件下估计误差与加密量化误差之间的定量关系.证明了,只要选取的时间切分长度合适,对于任意一个参与者,即使其他所有参与者联合起来仍然无法得到其具体的隐私信息.最后,通过数值仿真验证了算法的有效性.
关键词 多方参与的ARX系统; 隐私安全; 系统辨识; 门限Paillier加密体制; 最小二乘方法; multi-participant ARX system; privacy security; system identification; threshold Paillier cryptosystem; least squares method
Jianwei TAN, Jimin WANG, Jifeng ZHANG. Cooperative secure parameter identification of multi-participant ARX system — threshold Paillier cryptosystem-based least-squares identification algorithm. Sci Sin Inform, 2023, 53(12): 2472-2492, doi: 10.1360/SSI-2023-0140
数据驱动的多工况过程异常监测方法: 综述与展望
张景欣, 周东华, 陈茂银, 吴德浩
中国科学: 信息科学, 2023, 53(11): 2087-2106
摘要 由于原材料、设定点、外界环境等因素变化,工业过程通常具有多个运行工况.多工况过程异常监测技术是保证工业系统安全运行的有效方式,也是过程监测技术的研究热点与难点.首先,对多工况过程异常监测方法进行概述,并将多工况过程的常见处理方式归纳为整体建模、自适应建模、混合建模和多模型建模方法;其次,分别回顾了多工况平稳过程和多工况非平稳过程的研究现状,并分析了各类方法的优缺点;最后,结合实际工业系统特点,指出该领域亟须解决的问题和未来发展方向.
关键词 数据驱动; 多工况过程; 异常监测; 平稳过程; 非平稳过程; 故障检测; data-driven; multimode processes; anomaly monitoring; stationary processes; nonstationary processes; fault detection
Jingxin ZHANG, Donghua ZHOU, Maoyin CHEN, et al. Data-driven anomaly monitoring methods for multimode processes: overview and perspectives. Sci Sin Inform, 2023, 53(11): 2087-2106, doi: 10.1360/SSI-2022-0404
基于启发式时空图神经网络的多变量时序异常检测
姜羽, 陈华, 张小刚, 王炼红, 王鼎湘
中国科学: 信息科学, 2023, 53(9): 1784-1801
摘要 针对信息物理系统的多变量时序数据的异常检测是预防系统故障、保证安全生产的必要手段.由于系统变量间的强耦合性和传播效应,设计异常检测算法时应考虑系统变量间的耦合特性、传播有向性和因果时滞性,从系统结构变化的角度检测早期异常.本文提出一种端到端的启发式时空图神经网络(heuristic spatio-temporal graph neural network, HST-GNN)用于多变量时序数据的异常检测.首先,考虑变量间关系的有向性和集群性,设计一种有向相似性函数和基于启发式聚类算法的图结构学习算法,对多变量时序数据进行图建模以学习变量间的空间耦合关系;其次,使用门控卷积注意单元和多头图注意层作为时空图注意模块,从时空层面同时捕获系统的非线性因果时序和空间耦合深度特征;最后,量化系统的图结构特征,将其作为时空图网络提取的传感器深度特征的补充,输入自编码器中,从系统级别和传感器级别来检测异常.本文在4个公共数据集上验证了HST-GNN的性能.实验结果表明,稀疏有向的图结构有利于系统耦合特性的提取,从系统和传感器级别检测异常增加了模型对不显著的早期异常的敏感度.
关键词 多变量时序数据; 无监督异常检测; 启发式图结构; 时空图注意网络; 系统级图结构特征; multivariable time series data; unsupervised anomaly detection; heuristic graph structure; spatiotemporal graph attention network; system-level graph structure features
Yu JIANG, Hua CHEN, Xiaogang ZHANG, et al. Multivariable time series anomaly detection using heuristic spatio-temporal graph neural network. Sci Sin Inform, 2023, 53(9): 1784-1801, doi: 10.1360/SSI-2022-0425
基于Transformer GAN架构的多变量时间序列异常检测
蔡美玲, 汪家喜, 刘金平, 唐朝晖, 谢永芳
中国科学: 信息科学, 2023, 53(5): 972-992
摘要 基于过程中实时采集的多变量时序关联数据进行异常检测是预防工业过程事故、保障系统安全的关键环节之一.然而,工业多变量时间序列异常检测仍面临如下两大难题:(1)时序数据变量间复杂的非线性关联特性缺乏有效的表达方法;(2)正常/异常分布极度不均衡的时间序列间复杂的相关性有待深入挖掘.本文提出一种新的基于多变量时间序列的无监督异常检测方法 ——基于Transformer GAN的多变量时间序列异常检测方法 (TGAN-MTSAD). TGAN-MTSAD采用Transformer网络作为生成对抗网络的基本模型,引入了图注意力层以自动学习时序多元变量间的复杂依赖关系,还应用了patch技巧使模型能够有效捕捉时间窗口内的异常细节信息,并提出了基于重构误差与鉴别误差相结合的异常分数计算方法.采用3个真实世界的数据集对所提方法进行了大量的性能验证与对比实验分析.结果表明, TGAN-MTSAD可以有效检测过程中的时序异常,在大多数情况下优于基线方法,并且具有良好的可解释性,可用于复杂工业异常诊断.
关键词 多变量时间序列; 异常检测; Transformer; 异常分数; 图注意力; multivariate time series; anomaly detection; Transformer; anomaly score; graph attention;
Meiling CAI, Jiaxi WANG, Jinping LIU, et al. Transformer-GAN architecture for anomaly detection in multivariate time series. Sci Sin Inform, 2023, 53(5): 972-992, doi: 10.1360/SSI-2022-0133
非平衡数据下基于自适应迁移与宽度学习的多工况故障诊断
姜午恺, 周平
中国科学: 信息科学, 2023, 53(5): 946-971
摘要 针对高维不平衡数据的多工况故障诊断难题,提出一种非平衡数据条件下基于动态自适应迁移的宽度学习方法 (TL-BLS),并应用于污水处理过程的多工况故障诊断.首先,针对工业过程中不同工况下存在数据分布差异过大的问题,采用迁移学习流形变换方法拉近源域数据和目标域数据的距离;其次,针对后续自适应迁移中需要伪标签的条件,提出考虑数据不平衡的两阶段目标域伪标签预测方法,第一阶段使用基于类间关系的伪标签方法得到可靠度高的伪标签,第二阶段使用考虑子集差异的集成方法来获得可靠度更高且兼顾数据不平衡问题的伪标签;最终,建立带流形正则化项和具有动态平衡因子的自适应迁移与宽度学习方法,并在宽度学习系统和自适应迁移中引入权重矩阵来解决数据非平衡的问题,实现多工况过程下的故障诊断.污水处理过程数据实验及其比较分析表明所提方法具有更优的故障识别效果和更好的实用性.
关键词 故障诊断; 迁移学习; 宽度学习系统; 流形学习; 集成学习; 污水处理过程; 非平衡数据; fault diagnosis; transfer learning; broad learning system; manifold learning; ensemble learning; sewage treatment process; imbalanced data;
Wukai JIANG, Ping ZHOU. Multi-condition fault diagnosis based on adaptive transfer and broad learning under imbalanced data. Sci Sin Inform, 2023, 53(5): 946-971, doi: 10.1360/SSI-2022-0118
面向工业监控典型监督任务的深度迁移学习方法: 现状、挑战与展望
柴铮, 汪嘉业, 赵春晖, 丁进良, 孙优贤
中国科学: 信息科学, 2023, 53(5): 821-840
摘要 基于深度迁移学习的工业监控方法在近年来获得了大量研究关注,特别是在以故障诊断、软测量等为代表的工业监控典型监督任务中.通过挖掘与迁移相似源域的知识来完成对目标域的建模,这类方法为实际工业场景中变工况等原因导致的跨域监控问题提供了新的思路.本文系统梳理了面向工业监控典型监督任务的深度迁移学习方法,并将其分为基于模型迁移、基于样例迁移与基于特征迁移的工业监控方法.在此基础上,对不同类方法的基本研究思想在故障诊断与软测量任务中的研究进展进行了详细阐述.随后,从实际工业场景的复杂欠数据问题、可迁移性的量化与负迁移问题、工业过程的动态特性问题等角度,指出了当前基于深度迁移学习的工业监控研究中存在的挑战,并对该领域的未来研究方向做出进一步展望.
关键词 迁移学习; 深度学习; 跨域工业监控; 故障诊断; 软测量; transfer learning; deep learning; cross-domain industrial monitoring; fault diagnosis; soft sensor;
Zheng CHAI, Jiaye WANG, Chunhui ZHAO, et al. Deep transfer learning methods for typical supervised tasks in industrial monitoring: state-of-the-art, challenges, and perspectives. Sci Sin Inform, 2023, 53(5): 821-840, doi: 10.1360/SSI-2022-0328
基于知识图谱和多任务学习的工业生产关键设备故障诊断方法
卞嘉楠, 冒泽慧, 姜斌, 马亚杰, 刘文静
中国科学: 信息科学, 2023, 53(4): 699-714
摘要 针对工业生产关键设备故障数据稀疏的问题和故障诊断的需求,本文提出了一种基于知识图谱和多任务学习的工业生产关键设备故障诊断模型MKFD (multi-task learning for knowledge graphenhanced fault diagnosis),通过对故障根因的推断实现故障诊断.设计了多任务学习框架,并构造了一种改进十字绣单元用于实现框架内子任务之间的信息共享.利用运维数据构建故障现象–故障根因关联矩阵,使用多层感知机搭建知识图谱嵌入模型;分别将关联矩阵嵌入和知识图谱嵌入作为多任务学习框架中的两个子任务,通过子任务的交替学习,优化MKFD模型参数,实现对故障根因的推断,从而达到故障诊断的目的.最后,基于国内某工业企业的运维数据所构建的两个工业生产关键设备故障知识图谱对上述方案进行了验证实验,结果证明所提出的方法具有良好的性能.
关键词 故障诊断; 知识图谱; 多任务学习; 工业生产关键设备; 推荐系统; fault diagnosis; knowledge graph; multi-task learning; critical industrial equipment; recommender system;
Jianan BIAN, Zehui MAO, Bin JIANG, et al. Fault diagnosis method of critical industrial equipment based on knowledge graphs and multi-task learning. Sci Sin Inform, 2023, 53(4): 699-714, doi: 10.1360/SSI-2022-0060
旋转导向钻井工具装备的微小故障检测
盛立, 牛艺春, 刘诗洋, 王伟亮, 高明, 周东华
中国科学: 信息科学, 2022, 52(11): 2106-2120
摘要 旋转导向钻井系统是油气开发领域的高端装备,其核心部分——动态指向式旋转导向钻井工具的可靠运行是钻井系统正常工作的重要前提.本文基于模型的方法研究了导向钻井工具装备的微小故障检测,有望为系统的运行维护与健康管理提供重要保障.首先,基于机理建模方法得到了导向钻井工具装备的数学模型.然后,利用移动加权平均方法提高了残差对微小故障的敏感性.基于非中心χ~2分布的性质,实现了对微小故障在统计意义下的可检测性分析,得到了保证误报率与漏报率在允许范围内的窗口长度和权值.最后,在旋转导向钻井工具原理样机上进行实验,实验结果验证了所提方法的有效性.
关键词 旋转导向钻井工具装备; 微小故障检测; 故障可检测性分析; 误报率; 漏报率; rotary steerable drilling tool equipment; incipient fault detection; fault detectability analysis; false alarm rate; missed detection rate;
Li SHENG, Yichun NIU, Shiyang LIU, et al. Incipient fault detection of rotary steerable drilling tool equipment. Sci Sin Inform, 2022, 52(11): 2106-2120, doi: 10.1360/SSI-2021-0309
知识嵌入式图神经网络在风机多元状态预测中的应用
刘颖, 李阳光, 瞿树晖, 董纪昌, 王竞凡
中国科学: 信息科学, 2022, 52(10): 1870-1882
摘要 风机状态预测是风电数字化和智能运维的关键环节.深度学习由于在挖掘复杂高维数据隐藏关系上具有强大潜力,逐渐被应用于风机状态预测中.然而深度学习在实际运行中也存在着推理性和解释性差等局限性,如何将领域知识与智能算法有效结合是智能运维的一个重要方向.本文以多元时间序列图神经网络通用框架(multivariate time series graph neural network, MT-GNN)为基础,提出了一个知识嵌入式图神经网络模型(knowledge-embedded graph neural network, K-GNN),对风机多元时间序列状态数据进行预测.在该模型中,本文将知识嵌入模块与图学习模块相结合,通过嵌入相关、因果、专家经验3种知识矩阵,更好地刻画出状态变量之间的关联关系.结果显示,在3种知识嵌入式K-GNN模型中,嵌入了专家经验矩阵的图神经网络模型在预测上的表现更为出色,说明领域知识能够有效提升图神经网络模型的泛化性能和可解释性.本文的研究成果对于风电预测性维护技术的研发和推广具有参考意义.
关键词 风力发电机; 状态预测; 多元时间序列; 专家经验; 图神经网络; wind turbines; state prediction; multivariate time series; expert experience; graph neural network;
Ying LIU, Yangguang LI, Shuhui QU, et al. Application of knowledge-embedded graph neural network for multivariate state prediction of wind turbines. Sci Sin Inform, 2022, 52(10): 1870-1882, doi: 10.1360/SSI-2021-0300
非正障碍函数: 面向非线性系统安全控制的一类新颖障碍函数
朱哲人, 张新民, 柴毅, 宋执环
中国科学: 信息科学, 2022, 52(10): 1853-1869
摘要 面向系统状态安全的分析与控制,是目前控制领域内的热点研究之一.针对一类具有可行状态集的动态系统,本文深入讨论障碍函数与状态安全判据之间的相关性,通过设计一种新颖的障碍函数,提出了基于障碍函数的状态安全判据,该状态安全判据可用于此类系统的安全分析、诊断与控制.受启发于倒数障碍函数与零障碍函数,本文设计了一类非正障碍函数,并在此基础上提出了面向可行状态集的动态系统状态安全判据,通过验证该可行状态集的前向不变性,从而保证系统的安全性;根据非正障碍函数,建立了控制障碍函数,以此设计面向动态控制系统的状态安全控制器,保障系统的运行安全.上述理论与方法在一类连续搅拌釜反应器的安全运行控制中得以应用,通过仿真验证,证明了理论与方法的有效性,实现了基于障碍函数的安全控制理论在过程控制中的首次尝试.
关键词 非正障碍函数; 动态系统; 状态安全控制; 安全性判据; 控制障碍函数; non-positive barrier function; dynamical systems; state-safety control; safety criteria; control barrier function;
Zheren ZHU, Xinmin ZHANG, Yi CHAI, et al. Non-positive barrier function: a new notion of barrier function for state-safety control of nonlinear dynamical systems. Sci Sin Inform, 2022, 52(10): 1853-1869, doi: 10.1360/SSI-2021-0313
电力系统安全仿真技术: 工程安全、网络安全与信息物理综合安全
王子骏, 刘杨, 鲍远义, 管晓宏, 吴桐, 卢建刚, 余志文, 袁晓舒, 刘烃
中国科学: 信息科学, 2022, 52(3): 399-429
摘要 电力系统安全仿真是面向电力系统自身故障或外部攻击等安全威胁,通过仿真实验或借助数值计算研究系统行为的技术.随着自动控制、网络通信、人工智能等信息技术的广泛应用,电力系统已发展成为物理系统与信息系统深度耦合的信息物理融合系统.物理破坏或网络攻击产生的故障在电力系统中相互关联,可跨域传播,产生新的安全威胁形态.电力系统安全仿真正在面临新的挑战.本文回顾了历史上影响广泛的电力系统安全事件;从工程安全、网络安全、信息物理综合安全3个维度,分析电力系统安全仿真的需求和技术发展,对代表性的安全仿真平台进行分类和总结;探讨电力系统安全仿真技术面临的挑战和发展趋势.
关键词 信息物理融合系统; 工程安全; 网络安全; 信息物理综合安全; 电力系统安全仿真技术; cyber-physical system(CPS); engineering safety; network security; cyber-physical integrated security; power system security simulation technology;
Zijun WANG, Yang LIU, Yuanyi BAO, et al. Power system security simulation technologies: engineering safety, network security and cyber-physical integrated security. Sci Sin Inform, 2022, 52(3): 399-429, doi: 10.1360/SSI-2021-0210
滤波、估计与参数辨识(2)
基于状态分解的网络化系统分布式状态估计
邓云松, 钟毅, 饶红霞, 徐雍, 鲁仁全
中国科学: 信息科学, 2024, 54(9): 2224-2239
摘要 本文研究了离散时间网络化系统的分布式状态估计问题,提出了一种基于状态分解的新型分布式状态估计方法.通过解耦系统的能观状态分量,网络中各传感器节点可独立估计对应分量,实现了估计方法的完全分布式设计.针对网络信息传输冗余问题,建立了状态预测值扩散策略,各传感器仅需向外传输其能观状态分量的预测值,大幅降低了传感器网络各节点的计算与通信资源消耗.为证明本文所设计估计方法的误差协方差有界性,构造了紧凑形式误差协方差迭代式,得到了协方差存在上下界的充分条件.最后,通过仿真在估计精度和鲁棒性上与现有估计方法进行了对比分析,验证了所设计估计方法的有效性.
关键词 分布式状态估计; 网络化系统; 传感器网络; 状态分解; 有界性分析; distributed state estimation; networked systems; sensor networks; state decomposition; boundedness analysis
Yunsong DENG, Yi ZHONG, Hongxia RAO, et al. Distributed state estimation of networked systems based on state decomposition. Sci Sin Inform, 2024, 54(9): 2224-2239, doi: 10.1360/SSI-2024-0029
非线性递推辨识理论在量刑数据分析中的应用
王芳, 张蓝天, 郭雷
中国科学: 信息科学, 2022, 52(10): 1837-1852
摘要 司法大数据已成为法律实证研究和智慧司法工程建设的重要基础,相应地,数据计算结果的可解释性与可靠性等基础性问题愈加重要.为此,我们对非线性递推辨识理论进行了相应创新,并应用于量刑数据分析.具体来讲,依据相关法律建立了更加符合法逻辑的非线性随机量刑模型(S-模型),应用我们提出的非线性递推辨识算法和建立的关于有限数据样本下辨识精度的数学理论,对近20万故意伤害罪判决数据进行了计算分析.研究发现,与传统线性模型及最小二乘算法相比,基于我们的S-模型和非线性递推辨识算法所给出的计算结果,更符合量刑基本原则和具体规则,可以更准确地反映量刑要素的影响及变化,并具有更好的预测能力.
关键词 非线性模型; 递推辨识算法; 辨识精度保证; 量刑; 故意伤害罪; 司法判决数据; nonlinear model; recursive identification algorithm; identification accuracy guarantee; sentencing; crime of intentional injury; judicial documents data;
Fang WANG, Lantian ZHANG, Lei GUO. Applications of nonlinear recursive identification theory in sentencing data analyses. Sci Sin Inform, 2022, 52(10): 1837-1852, doi: 10.1360/SSI-2022-0325
面向多源自主导航的智能学习方法研究
王巍, 陈巍, 孟凡琛
中国科学: 信息科学, 2024, 54(12): 2778-2793
摘要 智能多源自主导航系统以北斗导航为基石、以惯性导航为支撑,旨在提供高度智能化的定位导航与授时服务,通过实现即插即入、无缝衔接、无感切换、可信完备等功能,以满足复杂多变的场景需求.采用以深度学习、强化学习为代表的智能学习方法,从复杂性与多尺度视角出发,探索智能多源自主导航中的优化与协同理论,建立以精准稳定、可信安全、可泛化、可解释、内嵌动力学机理为关键要素的智能学习方法,推动构建弹性、健壮、动态、可控与可信的精准智能多源自主导航模型与方法体系,从而有力支撑国家综合定位导航与授时体系的创新发展和先进导航技术的规模化应用.
关键词 智能多源自主导航; 内嵌动力学机理; 可泛化; 可解释; 可信性; 完备性; intelligent multi-source autonomous navigation; embedded system dynamics; generalizability; interpretability; dependability; completeness
Wei WANG, Wei CHEN, Fanchen MENG. Study on intelligent learning methods for multi-source autonomous navigation. Sci Sin Inform, 2024, 54(12): 2778-2793, doi: 10.1360/SSI-2024-0192
具有输出边界保护的飞行器姿态控制律设计
杨庶, 杨婷, 王欣然
中国科学: 信息科学, 2024, 54(10): 2470-2486
摘要 针对飞行器姿态控制问题,综合反步法和自适应控制理论设计了飞行器姿态控制律,采用高通滤波器估计控制律中所需的控制信号时间导数,解决了常规反步法存在的需要解析或数值求导的问题.基于投影算子方法设计了输出边界保护控制律,使飞行器输出响应不超过由超椭圆曲线定义的控制边界,在多变量控制下使控制边界匹配实际边界.根据Lyapunov稳定性理论证明了完整控制律的闭环稳定性,解决了高通滤波器与闭环系统稳定性的耦合问题.通过数值仿真检验了姿态控制律的控制性能,仿真结果表明飞行器闭环系统具有良好的俯仰角指令跟踪和协调转弯指令跟踪性能,并实现了迎角和侧滑角的输出边界保护.
关键词 姿态控制; 输出边界保护; 反步法控制; 自适应控制; 投影算子; attitude control; output boundary protection; backstepping control; adaptive control; projection operator
Shu YANG, Ting YANG, Xinran WANG. Attitude control law design for a flight vehicle with output boundary protections. Sci Sin Inform, 2024, 54(10): 2470-2486, doi: 10.1360/SSI-2024-0141
高超声速飞行器鲁棒自适应控制专题
高超声速滑翔飞行器预定时间碰撞规避编队控制
王婕, 王鼎华, 王婷, 户艳鹏
中国科学: 信息科学, 2024, 54(10): 2326-2342
摘要 针对高超声速滑翔飞行器的编队控制问题,提出了基于预定时间稳定性理论的控制策略.首先,建立高超声速滑翔飞行器六自由度制导控制一体化模型,基于反演结构对模型进行简化处理,在此基础上,设计预定时间控制律,实现期望队形形成及编队保持;其次,利用人工势场理论,设计避碰/规避势场函数项,避免高超声速滑翔飞行器与其邻机之间的碰撞,并实现对威胁区的规避;再次,基于Lyapunov稳定理论对高声速滑翔飞行器在预定时间内的编队稳定性进行严格证明;最后,通过Matlab/Simulink进行仿真,仿真结果验证了本文所提的控制策略能够实现预定时间内高超声速滑翔飞行器的编队队形生成保持及碰撞规避.
关键词 高超声速滑翔飞行器; 预定时间控制; 人工势场算法; 编队控制; 制导控制一体化; hypersonic glide vehicle; predefined time control; artificial potential field method; formation control; integrated guidance and control
Jie WANG, Dinghua WANG, Ting WANG, et al. Collision avoidance and formation control of hypersonic glide vehicles within predefined time. Sci Sin Inform, 2024, 54(10): 2326-2342, doi: 10.1360/SSI-2024-0128
高超声速飞行器鲁棒自适应控制专题
高超声速飞行器主被动复合一体化容错控制方法
周大鹏, 富佳伟, 杨大鹏
中国科学: 信息科学, 2024, 54(10): 2295-2307
摘要 针对高超声速飞行环境力热载荷严酷,执行机构易发生脆化、热损伤、缺损等故障,进而导致姿态控制精度下降甚至失稳等问题,本文提出了主被动复合故障容错控制方法.该方法在舵面缺失故障发生初期,采用滑模控制策略满足鲁棒增稳控制需求,同时,采用在线气动辨识方法,估计故障引起的气动参数变化,在满足瞬时增稳需求后,结合气动参数辨识结果与飞发一体化自适应控制进行控制重构,提升故障后高超声速飞行器飞发一体化控制品质.通过数学仿真对比验证表明该方法的有效性,验证了该方法相对于单一容错控制策略具有更强的鲁棒性和更好的控制性能.
关键词 高超声速飞行器; 舵面缺失故障; 容错控制; 气动参数辨识; 飞发一体化; hypersonic vehicle; missing elevator failure; fault-tolerant control; aerodynamic parameter identification; integrated flight/propulsion
Dapeng ZHOU, Jiawei FU, Dapeng YANG. Fault-tolerant control method for airbreathing hypersonic vehicles based on an activepassive composite approach. Sci Sin Inform, 2024, 54(10): 2295-2307, doi: 10.1360/SSI-2023-0322
引入反事实基线的无人机集群对抗博弈方法
王尔申, 陈纪浩, 宏晨, 刘帆, 陈艾东, 景竑元
中国科学: 信息科学, 2024, 54(7): 1775-1792
摘要 无人机在协同对抗博弈上的应用越来越广泛和深入,尤其是无人机集群在协同探测、全域对抗、策略骗扰等对抗任务中,发挥着越来越重要作用,可靠高效的无人机集群博弈方法是当前的研究热点.本文将反事实基线思想引入到无人机集群对抗博弈环境,提出一种基于反事实多智能体策略梯度(counterfactual multi-agent policy gradients, COMA)的无人机集群对抗博弈方法;在具有无限连续状态、动作的无人机对抗环境中,基于无人机动力学模型,设置符合实际环境的击敌条件和奖励函数,构建基于多智能体深度强化学习的无人机集群对抗博弈模型.红蓝双方无人机集群采取不同的对抗博弈方法,利用多智能体粒子群环境(multi-agent particle environment, MPE)对红蓝双方无人机集群进行非对称性对抗实验,实验结果表明平均累积奖励能够收敛到纳什均衡,在解决4 vs. 8的对抗决策问题方面, COMA方法的平均命中率较DQN和MADDPG分别提升39%和17%,在平均胜率方面比DQN和MADDPG分别提升34%和17%.最后,通过对COMA方法的收敛性和稳定性的深入分析,保证了COMA方法在无人机集群对抗博弈任务上的实用性和鲁棒性.
关键词 无人机集群; 对抗博弈; 多智能体; 深度强化学习; 纳什均衡; UAV swarm; confrontation game; multi-agent; deep reinforcement learning; Nash equilibrium
Ershen WANG, Jihao CHEN, Chen HONG, et al. UAV swarm adversarial game method with a counterfactual baseline. Sci Sin Inform, 2024, 54(7): 1775-1792, doi: 10.1360/SSI-2023-0305
一种基于透射不变性原理的高机动编队控制方法
王常虹, 陈济泽
中国科学: 信息科学, 2023, 53(10): 1965-1981
摘要 本文给出了一种具有高机动性的透射编队控制方法,解决了经典的仿射编队控制受限于平行关系的常约束,无法直接实现战术攻防上常用的前后三角、前后梯形等队形的快速切换问题.该方法受启发于框架理论中的透射不变性原理,通过引入透射像和自应力矩阵来对编队构型进行定义,实现了在仅增加一个领航者且队形凹凸性不变的前提下,任意目标队形的保共线和交比的一致性跟踪,提高了队形的可操作性.所推导的透射可定位条件和队形连续变换条件为透射编队控制的应用提供了理论依据.此外,在攻防切换任务和联合切换任务两种情景下的仿真测试结果也进一步证明了该编队控制方法的可靠性.
关键词 透射变换; 编队控制; 战术任务; 多智能体系统; 自应力矩阵; projective transformation; formation control; tactical tasks; multiagent systems; self-stress matrix
Changhong WANG, Jize CHEN. A high-mobility formation control method based on the principle of projective invariance. Sci Sin Inform, 2023, 53(10): 1965-1981, doi: 10.1360/SSI-2022-0409
非完全信息下人机合作对抗博弈专题
障碍环境下基于生物捕食逃逸行为的多运动体边界防御博弈方法
仝秉达, 段海滨, 夏洁, 刘小峰
中国科学: 信息科学, 2022, 52(12): 2213-2224
摘要 基于微分对策的追逃博弈和疆土防御问题是多智能体对抗博弈控制的关键问题之一.本文研究了含障碍物的有界区域中多运动体边界防御博弈方法.首先通过对自然界中生物的捕食逃逸行为进行分析,对多运动体边界防御博弈系统进行了建模,得到不同情况下博弈终止条件和价值函数.其次,本文对含障碍环境下博弈双方的主导区域和界栅面进行了分析,并与无障碍情况进行了对比.最后,数值仿真验证了本文提出的多运动体边界防御方法满足微分对策中的鞍点策略条件和有效性.
关键词 捕食逃逸; 协同控制; 边界防御; 微分对策; 鞍点策略; predation and escape; cooperative control; border defense; differential games; saddle point strategy;
Bingda TONG, Haibin DUAN, Jie XIA, et al. Multi-agent border defense differential game based on biological predation and escape behavior in an obstacle environment. Sci Sin Inform, 2022, 52(12): 2213-2224, doi: 10.1360/SSI-2022-0211
面向特殊应用场景的无人机智能决策与控制专刊
基于干扰区间观测器的无人机预设性能着舰飞行控制
胡伟, 雍可南, 陈谋
中国科学: 信息科学, 2022, 52(9): 1711-1726
摘要 无人机在现代战争中已发挥重要作用,为夺取海域制空权,航母配备无人机是必然趋势.面向无人机着舰的高精度控制要求,本文针对存在建模误差与外部干扰的无人机,在动态面控制框架下提出一种基于干扰区间观测器的无人机预设性能着舰飞行控制策略.该策略能够对未知项提供区间估计,在前馈补偿未知项的同时,控制律将根据区间估计的宽度动态调节控制器增益,从而保证无人机的轨迹始终处在着舰轨迹约束范围内.同时,在干扰区间观测器与飞行控制律设计过程中,引入非线性增益,有效地处理了着舰机动中的状态非线性耦合.最后,基于Lyapunov函数方法与不变集理论,给出着舰飞行控制策略的参数设计条件,数值仿真也进一步表明该策略的有效性.
关键词 无人机; 着舰控制; 预设性能控制; 干扰观测器; 区间观测器; unmanned aerial vehicle; carrier landing control; prescribed performance-based control; disturbance observer; interval observer;
Wei HU, Kenan YONG, Mou CHEN. Disturbance interval observer-based carrier landing control of unmanned aerial vehicles using prescribed performance. Sci Sin Inform, 2022, 52(9): 1711-1726, doi: 10.1360/SSI-2022-0051
面向特殊应用场景的无人机智能决策与控制专刊
面向宽域飞行的组合动力空天飞行器切换控制
程怡新, 许斌, 洪锐
中国科学: 信息科学, 2022, 52(9): 1687-1710
摘要 针对组合动力空天飞行器宽域爬升过程存在的模态转换、气动参数未知以及外界时变干扰等问题,研究了一种基于飞行包线模态划分的切换控制方案.对飞行器六自由度模型和发动机推力模型进行气动和推力特性分析,给出了模态划分结果和模态转换过渡过程.基于切换信号设计建立了空天飞行器切换系统,设计终端滑模软切换控制策略来保证模态的平稳转换,并利用神经网络和非线性扰动观测器协同处理系统不确定性和外界时变干扰.通过多Lyapunov函数方法对闭环切换系统的稳定性进行了分析,且仿真结果验证了所提方法的有效性.
关键词 空天飞行器; 组合动力; 模态转换; 切换控制; 鲁棒自适应控制; aerospace vehicle; combined power; modal transition; switching control; robust adaptive control;
Yixin CHENG, Bin XU, Rui HONG. Switching control of combined power aerospace vehicles for wide-area flight. Sci Sin Inform, 2022, 52(9): 1687-1710, doi: 10.1360/SSI-2022-0055
面向特殊应用场景的无人机智能决策与控制专刊
基于动态目标概率分布的核电站无人机航路强化学习规划
周同乐, 陈谋
中国科学: 信息科学, 2022, 52(9): 1642-1655
摘要 针对核电站空中动态入侵目标,本文提出了一种基于动态目标概率分布的无人机航路强化学习规划算法,实现了对空中入侵目标的有效拦截.根据入侵目标的状态信息基于概率扩散原理计算目标的概率分布,推理目标可能出现的位置.在此基础上,设计了基于航路点转移规则的行动空间和基于目标概率分布的报酬函数动态更新机制,通过Q-学习不断优化路径,构建了基于目标概率分布和强化学习的无人机航路规划框架,实现了无人机航路强化学习规划.仿真结果表明,该方法能够针对核电站空中入侵目标,实现目标点变化情况下无人机的自主航路规划.
关键词 无人机; 核电站; 航路规划; 动态目标概率分布; 强化学习; UAV; nuclear power plant; path planning; dynamic target probability distribution; reinforcement learning;
Tongle ZHOU, Mou CHEN. Path reinforcement learning planning of nuclear power plant UAVs based on dynamic target probability distribution. Sci Sin Inform, 2022, 52(9): 1642-1655, doi: 10.1360/SSI-2022-0050
面向特殊应用场景的无人机智能决策与控制专刊
面向复杂未知多障碍环境的多无人机分布式在线轨迹规划
张学伟, 田栢苓, 鲁瀚辰, 谌宏鸣, 宗群
中国科学: 信息科学, 2022, 52(9): 1627-1641
摘要 考虑复杂未知多障碍环境对无人机实时轨迹规划性能的影响,提出了基于Tube-MPC和模型预测路径积分(model predictive path integral, MPPI)控制相结合的多无人机分布式实时轨迹规划框架与方法.首先,考虑无人机在多障碍环境下的避碰避障需求,构造代价函数表征轨迹规划过程中的约束条件,将多无人机的轨迹规划问题转化为随机最优控制问题.其次,借鉴Tube-MPC思想,设计并实现了多无人机分布式轨迹规划框架,通过将低频标称控制器与高频辅助控制器串联保证了系统的实时性和鲁棒性.再次,为避免传统方法在求解过程中的维数灾难,提出基于MPPI的多无人机异步轨迹规划方法,该方法通过基于GPU的并行蒙特卡洛(Monte-Carlo)随机前向采样技术,将多无人机随机最优控制问题的求解转化为给定代价函数下对采样轨迹期望的求解,进而获得最优控制序列,其显著特点是求解速度快且避免了基于梯度求解方法对约束条件和代价函数连续性及凸特性的要求.最后,通过Gazebo虚拟仿真平台,在复杂未知多障碍环境下对算法的有效性进行了验证.
关键词 未知多障碍环境; 多无人机; 在线轨迹规划; 模型预测路径积分; GPU并行加速; unknown obstacle-rich environment; multi-UAV; online trajectory planning; model predictive path integral; GPU parallel acceleration;
Xuewei ZHANG, Bailing TIAN, Hanchen LU, et al. Multi-UAV decentralized online trajectory planning in complex unknown obstacle-rich environments. Sci Sin Inform, 2022, 52(9): 1627-1641, doi: 10.1360/SSI-2022-0048
面向特殊应用场景的无人机智能决策与控制专刊
基于合作竞争公共物品博弈的无人机集群动态资源分配
王浩淼, 段海滨, 魏晨
中国科学: 信息科学, 2022, 52(9): 1598-1609
摘要 无人机集群动态资源分配是其任务规划的挑战性关键技术难题.本文提出了一种基于合作竞争机制的动态资源分配方法,将无人机集群与网络进化博弈模型进行对应,建立了基于无人机拓扑网络的博弈模型,通过设计针对特殊个体的调控规则,达到提升系统平均收益的目的.最后,通过无人机博弈模型的仿真实验,根据网络结构、模型参数,以及不同激发机制下系统的稳态结果,验证了本文所提无人机动态资源分配方法的可行性和有效性.
关键词 无人机集群; 公共物品博弈; 动态资源分配; 合作机制; 竞争机制; UAV swarm; public goods game; dynamic resource allocation; cooperative mechanism; competition mechanism;
Haomiao WANG, Haibin DUAN, Chen WEI. Dynamic resource allocation of UAV swarms based on cooperative and competitive public goods game. Sci Sin Inform, 2022, 52(9): 1598-1609, doi: 10.1360/SSI-2021-0416
推力矢量极性错误下的飞行控制自主重构技术
潘豪, 胡瑞光, 宋征宇, 邵梦晗
中国科学: 信息科学, 2022, 52(5): 870-889
摘要 飞行故障在线自主辨识与控制重构是实现航天智能飞行的一个重要标志.本文针对运载火箭飞行中的推力矢量极性错误,研究了基于人工神经网络的故障识别与自主重构方法.在明确故障模式基础上,结合扩张状态观测器(extended state observer, ESO)观测结果,提出了考虑模型偏差的仿真训练样本设计方法,并分别采用基于反向传播(back propagation, BP)神经网络和长短时记忆(long short term memory, LSTM)网络方法进行了故障辨识设计,仿真结果表明,两种方法均具有较高识别准确度,均可实现推力矢量极性错误下的平稳自主重构,相比而言,基于滑窗时间序列的LSTM网络方法更具优势,具有较高的识别准确度.
关键词 极性错误; 自主重构; 扩张状态观测器; 反向传播; 长短时记忆; polarity errors; autonomous reconstruction; extended state observer(ESO); back propagation(BP); long short term memory(LSTM);
Hao PAN, Ruiguang HU, Zhengyu SONG, et al. Autonomous reconfiguration of flight control under thrust vector polarity errors. Sci Sin Inform, 2022, 52(5): 870-889, doi: 10.1360/SSI-2021-0305
角速度受限下航天器姿态机动事件触发控制
石永霞, 胡庆雷, 邵小东
中国科学: 信息科学, 2022, 52(3): 506-520
摘要 针对角速度受限和通信资源有限的航天器姿态系统,考虑转动惯量难以精确获得并且存在外部干扰的情况,提出一种基于神经网络的自适应事件触发姿态机动控制算法.该算法首先基于预设性能技术,将角速度受限约束转换为性能边界约束,进一步通过误差转换,建立姿态系统的等效误差模型,将存在角速度约束的航天器姿态系统机动控制问题巧妙地转化为无约束误差系统的状态有界稳定控制问题;然后,选用径向基神经网络设计自适应律,在线逼近系统中由未知转动惯量带来的不确定性项.与此同时,考虑到星载通信资源有限的问题,通过建立触发控制信号与实时控制信号之间的显式关系,设计一个统一的时变事件触发机制,当触发条件满足时同步更新控制器和自适应律,大大减少了控制器和执行器之间频繁的网络信号传输.此外,触发机制中时变项的引入严格保证了触发控制无Zeno现象发生.最后,仿真结果表明了所提出的姿态控制算法不但能够保证航天器高精度、高稳定度、高鲁棒性地完成指定姿态机动任务,而且可以减少大约97.50%的控制信号更新,这大大缓解了航天器的通信负担.
关键词 航天器; 角速度受限; 预设性能控制; 通信资源有限; 事件触发机制; spacecraft; angular velocity constraint; prescribed performance control; limited communication resources; event-triggered mechanism;
Yongxia SHI, Qinglei HU, Xiaodong SHAO. Event-triggered attitude maneuver control of spacecraft under angular velocity constraints. Sci Sin Inform, 2022, 52(3): 506-520, doi: 10.1360/SSI-2021-0136
网络化控制系统(9)
混合攻击下基于带宽感知型事件触发机制的负荷频率控制
丁瑞森, 杨飞生, 付远超, 潘泉
中国科学: 信息科学, 2024, 54(12): 2828-2840
摘要 针对混合攻击下的一类新型电力系统,本文提出了一种负荷频率安全控制方案,实现在欺骗与拒绝服务(denial of service, DoS)攻击下的闭环稳定与安全运行.首先,基于确认字符(acknowledgement character, ACK)技术提出了一种针对非周期性DoS攻击的“阴阳”检测机制.其次,为保持系统控制性能并节约网络通信资源,提出了一种新颖的带宽感知事件触发机制.再次,建立了一个混合攻击下包含风力发电机组与电池储能系统的多区域电力系统切换模型.利用Lyapunov-Krasovskii泛函(Lyapunov-Krasovskii functional, LKF)理论与线性矩阵不等式(linear matrix inequality, LMI)技术,给出满足H∞性能的系统指数均方稳定充分条件,并导出了事件触发负荷频率安全控制器的设计准则.最后,通过仿真实验验证了所提DoS攻击检测机制和事件触发安全控制器的有效性与优越性.
关键词 欺骗攻击; 非周期性DoS攻击; 带宽感知事件触发机制; 攻击检测; 负荷频率控制; deception attack; intermittent DoS attack; bandwidth-aware event-triggering mechanism; attack detection; load frequency control
Ruisen DING, Feisheng YANG, Yuanchao FU, et al. Load frequency control based on bandwidth-aware event-triggering mechanism under hybrid attacks. Sci Sin Inform, 2024, 54(12): 2828-2840, doi: 10.1360/SSI-2024-0086
基于流速场预测的水下机器人编队包围算法
曹文强, 闫敬, 杨睍, 陈彩莲, 关新平
中国科学: 信息科学, 2024, 54(12): 2794-2810
摘要 水下目标编队包围控制旨在通过水下机器人环绕运动,可实现对目标的近距离全方位监测.然而,未知流速场与水下机器人模型不确定等约束,导致水下机器人难以形成可靠、稳定的编队队形.为此,研究了基于流速场预测的水下机器人编队包围问题.首先,根据水下机器人真实轨迹与估计轨迹,设计了分布式流速场参数估计器,以实现流速场实时预测.基于此,结合水下机器人状态与环境信息,提出了动力学模型神经网络估计器,设计了基于导航向量场的目标编队包围算法,以在避障同时对移动目标实现包围控制.最后,给出导航向量场和模型估计器权重更新率的理论推导过程.仿真与实验结果表明,所提流速场预测方法可摆脱对划分栅格的依赖,同时,所提算法能在障碍物与未知流速场环境下完成目标包围任务.
关键词 流速场; 水下机器人; 包围; 导航向量场; flow velocity field; autonomous underwater vehicle; surrounding; guidance vector field
Wenqiang CAO, Jing YAN, Xian YANG, et al. Flow field prediction-based formation surrounding algorithm for autonomous underwater vehicles. Sci Sin Inform, 2024, 54(12): 2794-2810, doi: 10.1360/SSI-2024-0151
随机切换和不确定目标下异质非线性多智能体系统的一致性跟踪控制
孙亚平, 杨鑫松, 苏厚胜
中国科学: 信息科学, 2024, 54(11): 2674-2688
摘要 本文探讨了不确定目标下异质非线性切换多智能体系统的一致性跟踪问题,其中待跟踪的目标具有未知的控制输入且不受界的限定;所采用的随机切换机制不仅考虑了转移概率,还考虑了驻留时间.由于目标的不确定性、非线性、异质性以及随机切换特性,一致性跟踪问题很难直接用现有方法解决.因此,本文为一致性跟踪问题开发了一种新的依模态双层设计框架.基于该框架并通过引入自由矩阵和参数提出了一个新的多重李雅普诺夫函数,给出了异质非线性切换多智能体系统能几乎必然指数型一致性跟踪上不确定目标的条件.最后,通过数值仿真验证了所提控制方案的有效性.
关键词 多智能体系统; 一致性跟踪; 非线性; 随机切换; 不确定性; multi-agent systems; consensus tracking; nonlinear; random switching; uncertain
Yaping SUN, Xinsong YANG, Housheng SU. Consensus tracking control of heterogeneous nonlinear multi-agent systems with random switching and uncertain targets. Sci Sin Inform, 2024, 54(11): 2674-2688, doi: 10.1360/SSI-2024-0168
通信拓扑切换下车辆队列分布式多目标预测控制
何德峰, 罗捷, 李永福
中国科学: 信息科学, 2024, 54(9): 2263-2279
摘要 考虑存在通信拓扑切换的非线性车辆队列多目标编队控制问题,提出一种分布式多目标模型预测控制(multi-objective model predictive control, Mo-MPC)策略.首先,利用邻居车辆状态信息以及与时间相关的图函数构造队列协同控制目标函数,再使用字典序优化描述分布式Mo-MPC问题.然后,采用平均终端等式约束保证各车预测终端状态的收敛性.进一步结合权值矩阵充分条件和兼容性约束,利用切换系统公共Lyapunov稳定性技术保证车辆队列闭环系统的稳定性.同时,为了抑制前车状态误差波动沿着队列传播,使用一类状态误差最大值约束保证车辆队列的L∞弦稳定性.最后,利用两组典型工况的对比仿真结果验证本文策略较传统编队控制策略在经济性能方面的提升.
关键词 非线性车辆队列; 分布式模型预测控制; 多目标控制; 切换通信拓扑; 稳定性; nonlinear vehicle platoon; distributed model predictive control; multi-objective control; switching topology; stability
Defeng HE, Jie LUO, Yongfu LI. Distributed multi-objective predictive control of vehicle platoons with switching communication topologies. Sci Sin Inform, 2024, 54(9): 2263-2279, doi: 10.1360/SSI-2024-0027
基于自适应动态时钟通信的二阶多智能体系统完全分布式一致性
邓甲, 王付永, 刘忠信, 陈增强
中国科学: 信息科学, 2023, 53(1): 97-110
摘要 针对无向通信拓扑下二阶多智能体系统的一致性问题,本文提出了一种基于自适应动态时钟的新型事件触发控制策略.智能体根据自身的动态时钟来确定触发时刻,在触发时刻向邻居广播自身的状态信息并自适应重置时钟.每个智能体只获取邻居在触发时刻的状态信息,且仅依赖自身的状态和邻居在触发时刻的状态来更新时钟和控制信号,无需使用邻居的实时状态信息,也无需使用通信拓扑的任何全局信息.所设计的控制策略有效避免了连续通信,并且是完全分布式的.利用代数图论以及Lyapunov稳定性分析方法证明了所提出的控制策略能保证系统是渐近稳定的并且不存在Zeno行为.仿真示例进一步验证了所提出控制策略的有效性.
关键词 完全分布式一致性; 多智能体系统; 事件触发控制; 自适应动态时钟; Zeno行为; fully distributed consensus; multi-agent systems; event-triggered control; adaptive dynamic clock; Zeno behavior;
Jia DENG, Fuyong WANG, Zhongxin LIU, et al. Fully distributed consensus control for second-order multi-agent systems based on adaptive dynamic clock communication. Sci Sin Inform, 2023, 53(1): 97-110, doi: 10.1360/SSI-2021-0426
非完全信息下人机合作对抗博弈专题
基于虚拟排斥力的移动多智能体覆盖控制动态博弈算法
宿浩, 张宝琳, 籍艳, 蔡智辉, 薛健, 马慧, 郑元世
中国科学: 信息科学, 2022, 52(12): 2195-2212
摘要 为提高移动多智能体系统的覆盖控制效率,通常要求移动智能体在覆盖控制过程中进行多信息甚至全信息交互.在此情形下,覆盖控制成本和能耗将大幅增加.如何在提高移动智能体覆盖效率的同时,尽可能降低控制成本一直是移动智能体覆盖控制领域的重要课题之一.本文研究非完全信息条件下的移动多智能体覆盖控制方法,提出了基于虚拟排斥力的移动多智能体覆盖控制合作博弈算法.首先,将移动多智能体集群分解为若干个子集群,群中每个智能体只能观测到各自周围一定范围内其他智能体的信息,将移动多智能体集群的覆盖控制问题转化为非完全信息条件下移动多智能体子群的合作博弈分布覆盖问题;其次,给出了各移动智能体子群的博弈规则,并提出了一种基于虚拟排斥力的智能体分布覆盖博弈决策策略,用以计算并确定集群中每个智能体在覆盖控制过程中的新候选位置;第三,将移动多智能体系统覆盖控制问题分解为以刚性虚拟结构为参照系的覆盖控制问题,简化了多智能体系统覆盖控制中位移路径的规划设计.仿真算例表明,本文提出的基于虚拟排斥力的覆盖控制合作博弈算法,可以实现不完全信息条件下移动多智能体系统的分布覆盖控制任务,有效节约移动智能体的覆盖控制成本;同时,和已有的覆盖控制算法相比,本文提出的动态合作博弈覆盖算法,覆盖控制过程中智能体移动次数更少,覆盖率更高.
关键词 动态博弈; 网络覆盖; 分布算法; 多智能体系统; 虚拟排斥力; dynamic game; network coverage; distributed algorithms; multi-agent systems; virtual repulsive force;
Hao SU, Bao-Lin ZHANG, Yan JI, et al. Dynamic game coverage control algorithms for multiple mobile agents through virtual repulsive force. Sci Sin Inform, 2022, 52(12): 2195-2212, doi: 10.1360/SSI-2022-0219
通信距离受限下无人机集群轨迹分布式滚动规划
徐广通, 孟子阳, 龙腾, 王祝, 孙景亮
中国科学: 信息科学, 2022, 52(8): 1527-1541
摘要 针对通信距离受限下无人机集群轨迹规划时效性与安全性问题,本文构建了分布式滚动规划框架,提出了局部优先级解耦的序列凸优化方法 (local-priority-decoupled sequential convex programming,LPD-SCP),将集群轨迹规划问题分解为一系列短时域单机凸优化子问题,在保证求解效率的基础上确保了轨迹的安全性.本文推导了确保飞行安全的可行规划时域长度,设计了通信距离受限的局部优先级解耦机制,根据通信状态动态调整邻域内无人机规避优先级,实现通信距离受限下的机间避撞.更进一步,定制了轨迹时间一致协调策略,通过更新飞行时间下边界约束,实现邻域内无人机飞行时间一致性.理论分析了所提LPD-SCP能够通过多次滚动规划获得满足约束的集群轨迹.数值仿真试验结果表明:LPD-SCP能够在通信距离受限条件下规划出满足飞行动力学、机间避碰与时间一致约束的协同轨迹,且15架无人机短时域集结轨迹生成时间不大于4 s.
关键词 集群轨迹规划; 通信距离受限; 滚动规划架构; 局部优先级解耦; 序列凸优化; trajectory planning of swarms; communication distance limitation; receding planning framework; local priority decoupling; sequential convex programming;
Guangtong XU, Ziyang MENG, Teng LONG, et al. Trajectory distributed receding planning for UAV swarms subject to limited communication distance. Sci Sin Inform, 2022, 52(8): 1527-1541, doi: 10.1360/SSI-2021-0251
网络化不确定非线性时滞系统的状态估计
徐雍, 饶红霞, 王卓, 鲁仁全, 李宗
中国科学: 信息科学, 2022, 52(8): 1513-1526
摘要 本文研究了离散不确定非线性时滞系统在网络传输不可靠情况下的状态估计问题.针对网络传输丢包问题,采用伯努利(Bernoulli)随机模型,建立了控制信号和输入信号的不可靠传输模型.本文通过状态扩展的方法处理不确定非线性项,得到了扩展状态系统.基于不可靠的控制和测量信息,设计了状态预测器和估计器,并给出相应的误差系统.通过设计最优估计器增益,本文给出了状态预测误差协方差的迭代公式.为了进一步提高状态估计器的精度,设计了一种新型的参数迭代优化方法.针对状态预测误差协方差,本文得到了其稳定性的判别准则.最后,通过一例数值仿真,验证了所得结论的有效性.
关键词 网络化控制系统; 扩展状态估计; 时滞; 不确定非线性; 丢包; networked control system; extended state estimation; time delay; nonlinear uncertainty; packet dropout;
Yong XU, Hongxia RAO, Zhuo WANG, et al. State estimation for networked uncertain nonlinear systems with time-delays. Sci Sin Inform, 2022, 52(8): 1513-1526, doi: 10.1360/SSI-2021-0228
合作竞争网络下的多智能体系统链路故障检测
邵晋梁, 石磊, 李彤, 张希琳
中国科学: 信息科学, 2022, 52(8): 1500-1512
摘要 本文提出分布式符号簇一致协议,研究合作竞争网络下的多智能体系统链路故障检测问题.首先,应用符号图理论和非负矩阵理论的相关知识分析智能体在符号簇一致性协议下的渐近收敛性和最终收敛状态.其次,通过观察链路发生故障前后智能体收敛状态的变化,给出精确判断故障链路的方法.该方法同时适用于单链路故障和多链路故障的情形.最后,通过数值模拟验证该方法的有效性.
关键词 多智能体系统; 合作竞争网络; 链路故障检测; 一致性; 分布式协议; multi-agent systems; cooperation-competition networks; link failure detection; consensus; distributed protocol;
Jinliang SHAO, Lei SHI, Tong LI, et al. Link failure detection for multi-agent systems on cooperation-competition networks. Sci Sin Inform, 2022, 52(8): 1500-1512, doi: 10.1360/SSI-2021-0120
非线性系统与控制(10)
深度嵌入适应度评估分配策略的约束多目标进化优化方法
左明成, 巩敦卫
中国科学: 信息科学, 2024, 54(12): 2811-2827
摘要 很多实际问题可以归结为约束多目标优化问题.尽管已有多种求解约束多目标优化问题的方法,但是,在全局搜索空间中高效分配适应度评估资源,实现解方案可行性、收敛性和多样性的平衡仍然是个挑战.鉴于此,本文提出深度嵌入适应度评估分配策略的约束多目标进化优化方法,识别搜索空间中的重点区域,引导种群高效进化.该方法首先采用去噪自编码器设计进化种群的降维模型,获取种群在低维空间的流形;然后,在低维空间中聚类种群数据,获得每类种群约束违反度的方差,辅助感知适合每一种群个体的低维全局和局部搜索范围;最后,基于去噪自编码器获得种群个体的原始空间搜索范围,准确分配适应度评估资源.该方法可嵌入已有的进化算法,能不同程度地提升这些进化算法的性能.将所提方法应用于33个基准测试问题和15个矿山综合能源系统运行优化问题,实验结果表明了所提方法求解约束多目标优化问题的有效性.
关键词 约束多目标优化; 适应度评估分配; 深度嵌入; 进化优化; 矿山综合能源系统; constrained multi-objective optimization; fitness evaluation allocation; deep embedding; evolutionary optimization; integrated mine energy system
Mingcheng ZUO, Dunwei GONG. Constrained multi-objective evolutionary optimization method with a deep-embedded fitness evaluation allocation strategy. Sci Sin Inform, 2024, 54(12): 2811-2827, doi: 10.1360/SSI-2024-0025
有输出约束的二阶切换系统固定时间输出反馈镇定
林相泽, 黄景新, 程佳妮, 李世华
中国科学: 信息科学, 2024, 54(11): 2642-2656
摘要 本文研究了具有输出约束的二阶切换非线性系统的固定时间输出反馈镇定问题.构造降阶切换状态观测器以估计未测量状态,并与设计的切换状态反馈控制器相结合,实现了闭环切换系统的固定时间输出反馈镇定.利用正切型障碍Lyapunov函数保证闭环切换系统在固定时间稳定的同时满足输出约束.由于构造的障碍Lyapunov函数当约束趋向于无穷时可退化为无约束的公共Lyapunov函数形式,因此,本文提出的方法适用于具有或没有输出约束两种情况,而无需改变所设计的切换控制器和观测器结构,具有一定的普适性.利用双极限齐次方法证明了文中结论.数值例子和连续搅拌釜式反应器的固定时间控制验证了文中所提方法的有效性.
关键词 切换非线性系统; 固定时间; 输出反馈; 输出约束; 双极限齐次方法; switched nonlinear systems; fixed-time; output feedback; output constrains; bi-limit homogeneous method
Xiangze LIN, Jingxin HUANG, Jiani CHENG, et al. Fixed-time output feedback stabilization for second-order switched systems with output constraints. Sci Sin Inform, 2024, 54(11): 2642-2656, doi: 10.1360/SSI-2024-0045
基于参数优化和补偿信号的非线性广义预测控制方法
肖振飞, 刘宁, 张亚军, 柴天佑
中国科学: 信息科学, 2024, 54(9): 2240-2262
摘要 针对一类存在干扰和未知不确定性的复杂非线性被控过程的跟踪控制问题,将广义预测控制和信号补偿法相结合,提出了补偿信号驱动的非线性广义预测控制方法.采用低阶线性模型和未知非线性项来表示被控对象,未知非线性项表示系统建模误差及干扰等不确定性.采用低阶线性模型设计广义预测控制器,根据广义预测控制闭环系统可获得未知非线性项对系统影响的跟踪误差,引入最小化跟踪误差和控制量波动的一步最优控制设计补偿信号,抵消未知非线性项对被控对象的影响,改善系统动态性能.所提方法将以往要求未知非线性项全局有界的条件放宽为Lipschitz条件,证明了闭环系统的稳定性和收敛性.为了进一步提升系统动态性能,提出了基于梯度下降法的控制器加权参数的优化方法.仿真对比实验验证了所提算法的有效性.
关键词 预测控制; 补偿信号; 一步最优控制; Lipschitz条件; 梯度下降; predictive control; compensation signal; one-step ahead optimal control; Lipschitz condition; gradient descent
Zhenfei XIAO, Ning LIU, Yajun ZHANG, et al. Nonlinear generalized predictive control method based on parameter optimization and compensation signal. Sci Sin Inform, 2024, 54(9): 2240-2262, doi: 10.1360/SSI-2023-0413
基于自适应观测器的液压锚杆钻机全局终端滑模有限时间转速控制
张振, 郭一楠, 朱松, 焦峰, 巩敦卫
中国科学: 信息科学, 2024, 54(8): 1884-1906
摘要 在煤矿巷道支护中,液压锚杆钻机转速系统具有显著的死区、时变参数、内部外部扰动等非线性特性,使其转速跟踪控制存在精度低、速度慢和超调等问题,从而无法实现高质量和高效率的支护作业.为了解决上述问题,提高煤矿巷道支护的自动化程度、增强安全性和可靠性,设计一种高效的控制方法十分必要.鉴于此,本文提出一种基于自适应扩张状态观测器的全局终端滑模有限时间控制方法.首先,基于跟踪误差,设计一种自适应扩张状态观测器,该观测器能够通过自适应调整估计增益实时响应系统动态,实现扰动估计和系统跟踪性能的改善,从而有效克服转速系统的非线性特性,改善动态性能.其次,构建一种快速、平滑、连续的收敛函数,并有机融合跟踪误差和估计误差,设计一种新颖的全局终端滑模面;并根据李雅普诺夫(Lyapunov)方法,提出全局终端滑模控制律,有效改善转速系统的稳态性能.基于此,将观测器估计的扰动在滑模控制律中加以补偿,构成所提控制器.最后,基于李雅普诺夫稳定理论,论证转速系统的有限时间稳定性,并通过对比实验验证所提方法的有效性.
关键词 液压锚杆钻机; 滑模控制; 扩张状态观测器; 有限时间稳定; 收敛函数; hydraulic roofbolter; sliding-mode control; extended state observer; finite-time stability; convergence function
Zhen ZHANG, Yinan GUO, Song ZHU, et al. Global terminal sliding-mode finite-time rotary control of hydraulic roofbolter based on an adaptive observer. Sci Sin Inform, 2024, 54(8): 1884-1906, doi: 10.1360/SSI-2023-0412
基于知识迁移的数据驱动迭代学习模型预测控制
马乐乐, 刘向杰, 高福荣
中国科学: 信息科学, 2024, 54(7): 1752-1774
摘要 迭代学习模型预测控制(iterative learning model predictive control, ILMPC)作为一种广泛应用于批次生产过程的数据驱动智能控制策略,能够在沿批次逐步提高跟踪性能的同时沿时间不断抑制实时干扰.现有ILMPC算法的点对点学习机制依赖于批次运行工况的强一致性,以此保证当前批次与历史批次间的有效信息传递.然而,生产需求和生产环境的变化通常会导致各批次的操作轨迹和操作周期存在差异,从而使得历史批次提供的先验知识对于后续批次呈现出不精确性和不完整性.为了提高ILMPC在变运行工况条件下的适应性和灵活性,本文提出了一种具有知识迁移机制的数据驱动ILMPC策略.建立自适应深度神经网络(deep neural network, DNN)沿批次学习ILMPC控制行为,实现历史控制经验在当前批次工况下的全面转换.为抑制DNN前期估计误差的影响,在知识迁移机制下进一步构建Tube控制结构下的ILMPC算法,保证ILMPC系统的时域稳定性和迭代域收敛性.针对非线性注塑过程的仿真实验验证了在操作轨迹和操作周期同时变化时,所提方法在跟踪精度和收敛速度方面具有明显优势.
关键词 迭代学习模型预测控制; 知识迁移; 数据驱动; 变运行工况; iterative learning model predictive control; knowledge transfer; data-driven; trial-varying operating conditions
Lele MA, Xiangjie LIU, Furong GAO. Data-driven iterative learning model predictive control based on knowledge transfer. Sci Sin Inform, 2024, 54(7): 1752-1774, doi: 10.1360/SSI-2023-0279
基于自抗扰的三自由度推力矢量飞行器的控制分配方法与理论
向飞宇, 薛文超, 陈森, 张言军
中国科学: 信息科学, 2023, 53(6): 1163-1180
摘要 推力矢量飞行器具有气动舵、推力矢量等改变本体姿态的多类控制输入,这使得推力矢量飞行器具备在日益复杂的空天环境下的高机动控制能力.同时,推力矢量飞行器的控制系统模型为非仿射非线性结构,并且包含复杂的不确定性,这使得其控制问题具有挑战性.本文针对三自由度推力矢量飞行器的角速度跟踪控制问题,采用自抗扰控制方法,实现了飞行过程中不确定性的主动补偿;基于气动舵优先和误差最小的准则,得到了控制输入最优解具有显式表达式的条件;针对控制输入最优解无法得到显式表达式的情况,证明了最优解一定在约束边界上,且可通过有限步求解;结合实际控制分配,定量给出了闭环系统的跟踪误差和估计误差的特性.在典型仿真环境下,本文提出的控制方法表现出有效性和鲁棒性,能够在强非线性和大范围不确定性下实现角速度跟踪目标.
关键词 推力矢量飞行器; 自抗扰控制; 扩张状态观测器; 控制分配; 自由度; thrust-vectored aircraft; active disturbance rejection control; extended state observer; control allocation; degree of freedom;
Feiyu XIANG, Wenchao XUE, Sen CHEN, et al. ADRC-based control allocation method and theory for 3-DOF thrust-vectored aircraft. Sci Sin Inform, 2023, 53(6): 1163-1180, doi: 10.1360/SSI-2022-0018
基于未知状态估计与神经网络补偿的增强PID控制方法
孙霄阳, 周平
中国科学: 信息科学, 2023, 53(4): 715-736
摘要 PID控制一直是应用最广泛的工业控制技术.但是基本PID控制算法仅考虑了动态系统输入–输出的外部特性,缺乏对系统内部状态信息的运用,因而在控制非线性耦合动态系统时往往难以获得满意的控制性能.本文在不改变原有PID控制设置的基础上,提出一种通过未知状态估计与神经网络控制补偿的增强PID (enhanced PID, En-PID)控制方法,可显著增强原有PID控制的性能.首先,采用扩展卡尔曼(Kalman)滤波技术对未知关键状态进行精确估计,并将状态估计值作为神经网络补偿控制器的输入,从而将基本PID控制算法并未使用的过程状态信息引入到控制输入;其次,采用K均值聚类算法求取历史输入数据的聚类中心,以此作为径向基函数(radial basis function, RBF)神经网络补偿器隐含层的中心向量;构建关于控制误差熵的优化性能指标,采用梯度下降算法对神经网络补偿器输出层权值向量进行优化和修正;最后,将RBF网络求取的补偿控制输入与原有PID控制器的基本控制输入进行综合,并共同作用于实际被控系统,实现高性能控制.理论分析和污水处理过程控制实验验证了所提方法的先进性和实用性.
关键词 增强PID控制; 扩展卡尔曼滤波; 径向基函数神经网络; 控制补偿; 熵; enhanced PID control; extended Kalman filtering; RBF neural network; control compensation; entropy;
Xiaoyang SUN, Ping ZHOU. Enhanced PID control method based on unknown state estimation and neural network-based compensation. Sci Sin Inform, 2023, 53(4): 715-736, doi: 10.1360/SSI-2022-0084
基于事件触发机制的多四旋翼无人机鲁棒自适应滑模姿态控制
李鸿一, 王琰, 姚得银, 周琪, 鲁仁全
中国科学: 信息科学, 2023, 53(1): 66-80
摘要 针对一类具有外部干扰的多四旋翼无人机姿态系统,研究其在无向拓扑下的姿态跟踪问题,提出一种基于事件触发机制的鲁棒自适应滑模控制方法.首先,建立多四旋翼无人机的姿态动力学模型,并引入干扰观测器,对系统受到的未知外部干扰进行估计.其次,为了节约四旋翼无人机的网络传输资源,本文在传感器和控制器之间引入事件触发机制,并结合鲁棒滑模控制算法,设计基于事件触发的鲁棒自适应滑模控制器.此外,通过Lyapunov稳定性理论证明闭环系统中所有信号最终有界,并证明所设计的事件触发机制能够有效避免Zeno行为.最后,仿真结果验证所提控制方法的有效性.
关键词 滑模控制; 事件触发机制; 干扰观测器; 姿态跟踪; 多四旋翼无人机系统; sliding mode control; event-triggered mechanism; disturbance observer; attitude tracking; MQUAVs;
Hongyi LI, Yan WANG, Deyin YAO, et al. Robust adaptive sliding mode attitude control of MQUAVs based on event-triggered mechanism. Sci Sin Inform, 2023, 53(1): 66-80, doi: 10.1360/SSI-2021-0358
执行器故障和非对称误差约束下的时延多智能体系统自适应事件触发控制
范利蓉, 王芳, 周超, 王坤
中国科学: 信息科学, 2022, 52(7): 1287-1301
摘要 本文针对非线性多智能体系统一致性跟踪控制问题,设计自适应事件触发控制策略.首先,通过引入非对称障碍Lyapunov函数,使输出误差满足非对称约束条件.其次,采用Lyapunov-Krasovskii(L-K)泛函和Young不等式消除状态时延的影响.利用模糊逻辑系统逼近未知非线性函数.再次,结合有界估计法和光滑函数有效补偿执行器故障和网络引起的误差.基于Lyapunov稳定性理论证明闭环系统半全局有界稳定.最后,通过仿真验证所设计控制策略的有效性.
关键词 多智能体系统; 状态时延; 事件触发控制; 非对称误差约束; 执行器故障; multi-agent systems; state time-delays; event-triggered control; asymmetric error constraints; actuator faults;
Lirong FAN, Fang WANG, Chao ZHOU, et al. Adaptive event-triggered control for time-delay multi-agent systems with actuator faults and asymmetric error constraints. Sci Sin Inform, 2022, 52(7): 1287-1301, doi: 10.1360/SSI-2020-0391
非线性多输入多输出连续时间系统基于历史采样数据的不确定性因素补偿控制
姚慧颖, 赵志良, 陈森, 柴天佑
中国科学: 信息科学, 2022, 52(3): 483-505
摘要 本文针对一类具有强耦合不确定性因素的连续时间多输入多输出非线性系统,提出了基于历史采样数据的不确定性因素补偿控制策略(sampled-data-based compensation control, SDBCC).与基于观测器的不确定性因素补偿控制不同,本文首先利用当前以及历史采样数据计算出由系统非线性耦合未建模动态和外部扰动构成的总扰动在前一采样周期内某时刻的精确值,然后利用该精确值在反馈环节对总扰动进行补偿以消除它的不利影响.连续时间系统在数据驱动的反馈控制作用下构成了一个混杂闭环控制系统,这连同系统的强耦合非线性不确定性因素为控制闭环系统的稳定性收敛性分析带来了挑战.为克服这一难题,本文发展了基于特征值和迭代序列的分析方法,证明了当系统跟踪目标为有界函数时,跟踪误差可随采样周期的减小而任意小,进而当跟踪目标为常数,并且系统的非线性项为时不变连续可微函数时,跟踪误差随时间趋于无穷大而趋近于零.二自由度无人机姿态控制的仿真结果验证了本文所提出方法的有效性和优越性.
关键词 不确定性; 非线性; MIMO系统; PID控制; 数据驱动控制; uncertainty; nonlinearity; MIMO system; PID control; data-driven control;
Huiying YAO, Zhiliang ZHAO, Sen CHEN, et al. Sampled-data-based uncertainty compensation control for a class of continuous-time nonlinear MIMO systems. Sci Sin Inform, 2022, 52(3): 483-505, doi: 10.1360/SSI-2021-0222
其他(7)
无人机群体自主控制专题简介
段海滨, Hugh Hong-Tao LIU
中国科学: 信息科学, 2024, 54(9): 2280-2280
摘要 无人机集群在军民诸多应用领域引起了极大的关注, 尤其在空中搜索、目标跟踪、边境巡逻、应急救援、交通管制、农业监测等特定任务领域已大显身手. 无人机群体自主控制是无人机集群方向的核心关键技术和“卡脖子”挑战痛点难题, 近年来国内外学者在无人机集群智能感知、协同控制、集群规划、态势评估、集成验证等方面取得了新的进展. SCIENCE CHINA Information Sciences 在2024 年67 卷第8 期组织出版了“无人机群体自主控制专题” (Special Topic: UAV Swarm Autonomous Control), 重点介绍了国内外学者在无人机群体自主控制方面的部分新理论和新方法.
随机系统分析与控制专题简介
张维海, 解学军
中国科学: 信息科学, 2024, 54(4): 988-988
摘要 随机控制理论在处理控制系统噪声、优化系统性能和增强鲁棒性等方面发挥关键作用, 是现代控制理论中的重要研究领域之一. 近年来, 随机控制理论和应用虽有显著进步, 但依然面临众多新的、具有挑战性的问题. 这些问题包括高阶和低阶非线性特性、输出约束的随机系统的稳定化问题、平均场随机系统最优策略的部分无模型或完全无模型的智能算法设计问题, 以及针对道路交通拥堵的随机网络控制策略问题等. 为了展示这些问题的最新研究进展, SCIENCE CHINA Information Sciences 在 2024 年 67 卷第 4 期组织并出版了 “随机系统分析与控制专题” (Special Topic: Analysis and Control of Stochastic Systems), 深入地探讨了随机系统基础理论与应用领域的研究现状及其创新成果.
网络系统的控制、优化和学习专题简介
任伟, 曹明, 陈智勇, 胡国强, 虞文武
中国科学: 信息科学, 2023, 53(10): 2055-2056
关键词 网络系统;
控制与优化的互动专题简介
姜钟平, 刘腾飞
中国科学: 信息科学, 2023, 53(7): 1438-1438
关键词 采样数据控制系统; 多智能体系统; 控制与优化; 伺服系统;
非完全信息下人机合作对抗博弈专题
编者按
康宇, 段海滨, 赵云波
中国科学: 信息科学, 2022, 52(12): 2163-2164
面向特殊应用场景的无人机智能决策与控制专刊
编者按
陈谋, 贺威
中国科学: 信息科学, 2022, 52(9): 1577-1578
信息物理系统专题简介
Shiyan HU, Changliu LIU, Vincenzo PIURI
中国科学: 信息科学, 2022, 52(2): 376-376
机器人与无人系统(15)
基于动作链的形式化任务协同规划
刘泽森, 李忠奎, 国萌
中国科学: 信息科学, 2024, 54(11): 2623-2641
摘要 基于形式化方法的多智能体任务规划因其丰富的任务形式和多样的系统功能而备受关注.然而,随着智能体数量增加,规划复杂度呈指数级增长,因此形式化方法在计算效率和集群规模上都受到了限制.已有的改良方法中,基于图搜索的方法对计算效率改进有限,只能处理中等规模的集群;而基于组合优化的算法忽略了智能体动作模型,无法处理大规模协同任务.本文针对以上局限,提出了基于智能体动作链的偏序任务分配算法,在保证正确性的基础上大幅提升规划性能.进一步针对环境不确定性和在线新任务,设计了自适应重规划算法和协作同步机制,确保任务执行过程中的鲁棒性.最后,通过数值仿真和对比验证了算法的有效性和可靠性.
关键词 多智能体任务规划; 形式化方法; 线性时序逻辑; 在线自适应; 偏序集; multiagent task planning; formal method; linear temporal logic; online self-adaptation; partially ordered set
Zesen LIU, Zhongkui LI, Meng GUO. Collaborative planning of formal tasks based on action chains. Sci Sin Inform, 2024, 54(11): 2623-2641, doi: 10.1360/SSI-2024-0105
基于自博弈强化学习的异构无人机集群协同对抗决策方法
严锐驰, 李帅, 王晨, 吴琦, 孙基男, 张世琨, 谢广明
中国科学: 信息科学, 2024, 54(7): 1709-1729
摘要 随着无人机技术的发展,无人机集群对抗已成为国内外研究热点.现有决策算法的研究主要集中于同构无人机集群对抗场景,且当应用于更复杂对抗场景时,存在奖励函数设计难度大、决策实时性难以满足等问题.为此,本文针对异构无人机集群对抗的实时机动决策问题展开研究.首先,构建了一个长机–僚机异构无人机集群的对抗仿真环境,其中,长机和僚机具有不同的机动和攻击能力,且对胜负具有不同影响力.其次,本文提出了一种基于多智能体强化学习的分布式无人机集群协同机动控制算法,并设计了一套结合课程学习和自博弈的策略训练与优化方法.通过设计简单的稀疏奖励结合课程学习方法即可学到异构无人机集群协同机动策略;引入自博弈对抗方式,使得对手无人机的策略更具针对性,以提升对抗的强度,从而进一步优化机动策略,使其更贴近实际需求.最后,仿真验证了本文所提方法的有效性和可扩展性.
关键词 集群对抗; 协同决策; 自博弈; 多智能体强化学习; 无人机; swarm confrontation; cooperative decision-making; self-play; multi-agent reinforcement learning; UAV
Ruichi YAN, Shuai LI, Chen WANG, et al. Cooperative decision-making for heterogeneous UAV swarm confrontation based on self-play reinforcement learning. Sci Sin Inform, 2024, 54(7): 1709-1729, doi: 10.1360/SSI-2023-0267
基于信息论的智能驾驶可解释多模态感知
张新钰, 国纪龙, 李骏, 李德毅, 张世焱, 沈思甜, 吴凡, 刘华平
中国科学: 信息科学, 2024, 54(6): 1419-1440
摘要 智能驾驶汽车已成为人们关注的热点话题之一.然而,现有的智能驾驶技术仍面临一系列挑战,如交通障碍物的遮挡所引起的模型漏检,以及当汽车驶入隧道等光线骤变的场景时所引起的传感器感知精度下降导致的误检问题等.为保证复杂场景下车辆的感知安全,智能驾驶多模态感知技术应运而生.然而,现有的多模态融合方法仍局限于对检测精度的提升,缺乏感知过程的可解释性,并缺少对模型感知过程的评价指标.本文从信息论角度出发,按照通信模型的构建方法对感知模型进行设计,提出了一种基于信源信道联合编码理论的多模态融合感知模型,从理论上对模型的感知过程进行解释.同时,提出了一种新的评价指标——平均信息熵变(average entropy variation, AEV),用AEV来实时反映模型与外界感知交互过程中的稳定性.进而,对多模态模型的感知过程进行量化分析,增加模型的可解释性.最后,与其他的感知模型在KITTI数据集的评估结果进行比较,我们的模型在经过相似的网络结构时平均信息熵变下降到0.5904,更好地保证了检测任务的感知安全.
关键词 可解释性; 信息论; 信源信道联合编码; 多模态融合; 智能驾驶; interpretability; theory of information; joint source-channel coding; multimodal fusion; intelligent driving
Xinyu ZHANG, Jilong GUO, Jun LI, et al. Information-theoretic-based interpretable multimodal perception for intelligent vehicles. Sci Sin Inform, 2024, 54(6): 1419-1440, doi: 10.1360/SSI-2023-0086
数据驱动的冗余机器人双层运动规划
刘梅, 尚明生
中国科学: 信息科学, 2024, 54(4): 960-975
摘要 冗余机器人在智能制造、救灾抢险与太空探索等领域扮演着重要角色.然而,对结构信息不准确或未知的冗余机器人进行运动规划是一个棘手的问题.此外,若不考虑冗余机器人末端执行器的姿态约束,可能会因姿态的不可控性导致任务失败.为解决该问题,在考虑末端姿态保持和多层关节物理限制的基础上,本文针对模型未知的冗余机器人提出了一种基于数据驱动技术的双层运动规划方案.该方案在关节角加速度层求解的同时能实现最小化关节角速度范数的要求.进而,构建一个离散神经动力学求解器以在线求解该方案.理论分析、仿真和物理实验验证了所提数据驱动的冗余机器人双层运动规划方案的可行性和有效性.
关键词 冗余机器人; 姿态保持; 数据驱动; 神经动力学; 非线性优化; redundant robots; orientation maintaining; data-driven; neural dynamics; nonlinear optimization
Mei LIU, Mingsheng SHANG. Data-driven double-level motion planning for redundant robots. Sci Sin Inform, 2024, 54(4): 960-975, doi: 10.1360/SSI-2023-0100
隐私保护下的多智能体系统弹性一致性控制
张冲, 伍益明, 徐明, 郑宁
中国科学: 信息科学, 2024, 54(4): 927-943
摘要 针对多智能体系统通信网络遭受欺骗攻击与隐私窃取问题,本文提出了一种新的具备隐私保护能力的多智能体系统弹性一致性算法.首先考虑到多智能体系统在信息传输环节直接将真实状态信息暴露给外界的问题,设计了一种基于状态分配思想的节点状态信息处理机制,来保证系统中节点状态信息隐私的安全性.其次考虑到外部攻击者对系统收敛的影响,在状态分配机制上进一步引入了检测环节,从而保证系统安全收敛.然后通过数学理论分析证明了算法能够有效保护节点初始状态信息隐私的同时能够保证系统实现弹性一致性收敛.最后通过数值仿真实验与对比实验,进一步验证了本文算法的有效性.
关键词 多智能体系统; 弹性一致性; 欺骗攻击; 隐私保护; 网络安全; multi-agent systems; resilient consensus; deception attack; privacy-preserving; cyber security
Chong ZHANG, Yiming WU, Ming XU, et al. Resilient consensus control of multi-agent systems under privacy protection. Sci Sin Inform, 2024, 54(4): 927-943, doi: 10.1360/SSI-2023-0124
自动驾驶车辆道路跟驰与状态一致性控制
郭胜辉, 罗世坚, 黄大荣, 宋家锋
中国科学: 信息科学, 2024, 54(2): 394-412
摘要 针对含有未知输入和外部干扰的非线性自动驾驶车辆时变跟驰队列系统,研究系统部分状态可测情况下的车辆道路跟驰和状态一致性控制问题.基于车辆跟驰和二自由度动力学模型,得到含有外部干扰和未知输入的离散化状态方程,利用前导跟驰特性,得到自动驾驶车辆跟驰队列系统;利用比例积分状态观测器解决系统部分状态不可测问题,提出一种基于观测器实现含有未知输入和外部干扰的自动驾驶车辆状态一致性控制协议;将观测器估计效果和一致性控制问题转化为误差系统的稳定性问题,由此构造Lyapunov-Krasovkii函数,利用离散系统稳定性理论推导出一个充分条件;通过求解线性矩阵不等式(linear matrix inequality, LMI)得到跟驰系统的增益矩阵和参数矩阵,利用H_∞性能指标分析系统鲁棒性.仿真结果表明:所设计观测器能够估计未知输入、外部干扰和系统状态,并且基于观测器设计能够使自动驾驶车辆道路跟驰和状态达到一致.
关键词 智慧交通; 自动驾驶车辆; 道路跟驰; 多智能体系统; 一致性控制; 外部干扰; intelligent transportation; autonomous vehicle system; path following; multiagent system; consistency control; external disturbance
Shenghui GUO, Shijian LUO, Darong HUANG, et al. Path following and status consistency control of autonomous vehicles. Sci Sin Inform, 2024, 54(2): 394-412, doi: 10.1360/SSI-2022-0424
移动机器人导航技术综述
姚陈鹏, 石文博, 刘成菊, 陈虹, 陈启军
中国科学: 信息科学, 2023, 53(12): 2303-2324
摘要 作为移动机器人的核心技术之一,导航技术涉及感知、决策、控制等多层架构,包含建图、定位、规划等主要模块,兼容经典控制与机器学习等多样算法,其相关研究涉及面广,时间跨度大,联系较为不明显.为梳理不同工作间关联,帮助快速了解移动机器人导航技术发展与挑战,本文从“导航”的词语释义与数学描述出发,以“导”与“航”两个主要目标为线索贯穿全文.通过分析不同环境下的导航应用局限,探究环境的空间复杂性与时间不确定性对导航技术产生的影响,阐明复杂场景应用下的研究现状与关键挑战.全文借助对近几十年来相关文献的归类梳理,寻找不同研究间的相关联系、研究初衷以及可能方案,拟在帮助读者加深对导航技术理解的同时,为后续研究提供思路参考.
关键词 移动机器人; 导航技术; 导航效率; 导航安全; 复杂环境; mobile robot; navigation technologies; navigation efficiency; navigation safety; complex environment
Chenpeng YAO, Wenbo SHI, Chengju LIU, et al. An overview of mobile robot navigation technology. Sci Sin Inform, 2023, 53(12): 2303-2324, doi: 10.1360/SSI-2022-0420
泛在计算视角下的群智模块化机器人
吴磊, 郭斌, 徐若楠, 刘思聪, 丁亚三, 党朝辉
中国科学: 信息科学, 2023, 53(11): 2107-2151
摘要 模块化机器人具备鲁棒、低成本和多功能性等优势,近年来得到研究人员的广泛关注,并在多领域不断替代或拓展传统的单体机器人.随着模块化机器人技术的发展,以及其与泛在计算、群体智能等前沿技术的紧密融合,将不断拓展在太空探测、智能制造、灾难救援等领域的应用,成为人机物三元融合空间中无处不在的新型智能终端.本文基于泛在计算新视角,对近年来群智模块化机器人领域的工作进行了系统性研究,构建并拓展其概念空间体系,阐释其自重构、自组织、自适应、持续演化等六大关键技术及最新发展趋势,进而介绍其在典型领域的创新应用.最后,对群智模块化机器人的未来发展方向及开放性挑战进行了分析和展望.
关键词 模块化机器人; 群体智能; 泛在计算; 自重构; 自组织; modular robots; crowd intelligence; ubiquitous computing; self-reconfiguration; self-organizing
Lei WU, Bin GUO, Ruonan XU, et al. Emergence of crowd modular robotics: a ubiquitous computing perspective. Sci Sin Inform, 2023, 53(11): 2107-2151, doi: 10.1360/SSI-2022-0385
无人机系统自主安全: 定义、建模与分级
潘泉, 郭亚宁, 吕洋, 李扬, 谈政
中国科学: 信息科学, 2023, 53(8): 1608-1628
摘要 自主与安全平衡是无人机技术与产业健康、快速发展的战略需求和核心关键.在同时面对“不断提升的无人自主飞行性能”与“日趋严峻的物理、信息、智能等多域安全威胁”的挑战下,仅借鉴有人机安全体系,适度拓展适航飞行和感知规避为核心的安全架构已不能满足现在和未来无人机系统的安全需求,构建无人机自主安全新架构显得十分必要和迫切.本文从自主性这一无人机固有的本质属性出发,初步研究了无人机自主安全架构,重点定义和表征了“无人机自主安全”新概念、构建了面向多域安全威胁和系统高度自主的无人机系统自主安全新模型、提出了无人机系统自主安全能力分级,为我国无人机行业健康快速发展提供基础支撑,为其他无人系统安全体系建立提供借鉴.
关键词 无人机系统; 多域威胁; 自主安全; 资源配置; unmanned aerial system; multi-domain threat; autonomous safety and security; resource configuration;
Quan PAN, Yaning GUO, Yang LYU, et al. Autonomous safety and security of UAV systems: definition, modeling, and gradation. Sci Sin Inform, 2023, 53(8): 1608-1628, doi: 10.1360/SSI-2022-0338
无人机续航能力
李学龙
中国科学: 信息科学, 2023, 53(7): 1233-1261
摘要 无人机是多样化的民生应用及临地安防技术领域的重要成员,“无人机到底能飞多久?”这个疑问已经在行业内引起了广泛的思考.作为无人机的心脏,其动力系统与无人机的飞行性能有着重要的关系,已成为航空领域最重要的发展方向之一.根据无人机动力系统的分类,本文分析了油动无人机、电动无人机、光动无人机的研究现状以及需要解决的技术问题,并特别关注了如何通过信号处理的方式达到智能飞行器长航时的目标,为无人机的续航能力及其动力的发展提供参考.
关键词 无人机; 智能飞行器; 续航能力; 油动无人机; 电动无人机; 光动无人机; UAVs; intelligent aircraft; endurance; oil-powered UAVs; electric UAVs; optics-driven UAVs;
Xuelong LI. Endurance of unmanned aerial vehicles. Sci Sin Inform, 2023, 53(7): 1233-1261, doi: 10.1360/SSI-2023-0130
基于弹性分析与函数回归模型的示教轨迹学习与泛化方法
肖宏远, 刘成菊, 陈启军
中国科学: 信息科学, 2022, 52(10): 1822-1836
摘要 示教学习是解决仿人机器人动态轨迹规划问题的高效方法.示教轨迹作为一种函数型数据,天然地具有耦合的时空特征,需要在函数型数据分析的理论框架下进行研究.传统的示教学习成果以“预处理”的形式解决上述耦合问题,不能充分利用示教轨迹的函数型数据本质.为了充分利用这一本质,本文采用弹性分析方法,将示教轨迹视作函数型数据,解决它们的时–空特征解耦问题.基于解耦后的示教轨迹,本文建立函数型回归模型并将其应用于动态轨迹的生成,实现示教轨迹在不同任务参数下的泛化.在实验中, JACO-2机械臂学习形态各异的技能并在不同的任务参数下完成任务,验证了提出方法的有效性.本文在统一的数学框架下,基于函数型数据分析的数学方法,解决一类仿人机器人的示教轨迹学习与泛化问题,具有较好的理论统一性与可实践性.
关键词 示教学习; 轨迹生成; 函数型数据; 弹性分析; 函数回归模型; learning from demonstration; trajectory generation; functional data; elastic analysis; functional regression model;
Hongyuan XIAO, Chengju LIU, Qijun CHEN. Learning and generalizing demonstration trajectories based on elastic analysis and the functional regression model. Sci Sin Inform, 2022, 52(10): 1822-1836, doi: 10.1360/SSI-2021-0259
面向特殊应用场景的无人机智能决策与控制专刊
仿猎鹰扑翼飞行器自主飞行控制系统设计
孙永斌, 马宝忠, 贺威, 何修宇, 付强
中国科学: 信息科学, 2022, 52(9): 1656-1671
摘要 仿生扑翼飞行器作为一种新型的飞行器,具有噪声小、隐蔽性好、机动性强、能量利用效率高等优势,在民用和军用领域具有广阔的应用前景.仿生扑翼飞行器的自主飞行能力是高效执行飞行任务的关键.目前,国内外飞行器的自主飞行研究已经取得了一些成果,然而鲜有以仿生扑翼飞行器为载体的研究.仿生扑翼飞行器特有的驱动结构给自主飞行控制研究带来了较大的挑战.本文以仿猎鹰扑翼飞行器作为研究平台设计了自主飞行控制系统.由于仿猎鹰扑翼飞行器的负载较小,本文采用了重量较轻的STM32微型计算平台作为主控芯片设计了硬件系统.由于微型计算平台的算力有限,本文综合考虑制导精度和运算速度,提出了一种线性/非线性切换制导算法,并通过仿真实验与线性制导、非线性制导算法进行了对比,证明了其更加适合于仿猎鹰扑翼飞行器.考虑到仿猎鹰扑翼飞行器的机构滞后问题,对其滚转角和高度设计了一个串级PID控制器.结合面向仿猎鹰扑翼飞行器的地面站软件,最终实现了基于仿猎鹰扑翼飞行器的自主定高圆弧轨迹跟踪任务.
关键词 仿生扑翼飞行器; 自主飞行; 线性制导; 非线性制导; 轨迹跟踪; bionic flapping-wing aircraft; autonomous flight; linear guidance; nonlinear guidance; trajectory tracking;
Yongbin SUN, Baozhong MA, Wei HE, et al. Design of an autonomous flight control system for imitation falcon flapping-wing aircraft. Sci Sin Inform, 2022, 52(9): 1656-1671, doi: 10.1360/SSI-2022-0067
面向特殊应用场景的无人机智能决策与控制专刊
基于随机采样的高层消防无人机协同搜索规划
李鸿一, 陈锦涛, 任鸿儒, 鲁仁全
中国科学: 信息科学, 2022, 52(9): 1610-1626
摘要 本文面向高层消防救援提出一种基于随机采样的多无人机协同搜索规划方法.首先,受随机树状采样搜索算法启发,提出一种搜索点最优分布方法,利用其在复杂环境下对有限空间重复搜索的特性,同时解决多无人机的路径点分布问题和任务分配问题.其次,设计一种基于交易规则的搜索点优化方法,以进一步提升搜索覆盖范围.然后,利用改进的和声搜索算法得到每架无人机遍历节点的最优顺序,进而获得各无人机的规划路径.最后,采用多线程方法模拟实际任务中的分布式运算,验证所提出方法的可行性.
关键词 高层消防; 随机采样; 和声搜索算法; 多无人机协同; 路径规划; high-rise firefighting; random sampling; harmony search; multi-UAV cooperation; path planning;
Hongyi LI, Jintao CHEN, Hongru REN, et al. Random-sampling-based multi-UAV cooperative search planning for high-rise firefighting. Sci Sin Inform, 2022, 52(9): 1610-1626, doi: 10.1360/SSI-2022-0038
面向特殊应用场景的无人机智能决策与控制专刊
无人机污染源自主搜寻算法综述
李中国, 陈文华, 刘存佳
中国科学: 信息科学, 2022, 52(9): 1579-1597
摘要 自主搜寻在环境保护、灾后搜救和工业监控等方面有重要作用.无人机传感平台凭借其灵活的机动性成为实现自主搜寻的有效途径之一.针对自主搜寻中两个关键任务,即污染源定位和污染边界跟踪,本文分别梳理了相关算法体系,并揭示了其设计思想的本质.对于污染物溯源,控制驱动和信息驱动两类算法是目前的研究主流,但两者的结合却鲜有报道.在边界跟踪方面,本文从单平台和多平台协作两方面总结了现有文献的控制和估计方法.根据双重控制思想,本文分析了相关算法的设计思路,并展望了下一步的研究重点.
关键词 自主搜寻; 无人机; 污染源搜寻; 边界跟踪; 双重控制; 探索与利用; autonomous search; UAV; source seeking; boundary tracking; dual control; exploration and exploitation;
Zhongguo LI, Wen-Hua CHEN, Cunjia LIU. Review of UAV-based autonomous search algorithms for hazardous sources. Sci Sin Inform, 2022, 52(9): 1579-1597, doi: 10.1360/SSI-2022-0044
考虑状态约束的五自由度塔式吊车多目标最优轨迹规划
刘卓清, 孙宁, 吴易鸣, 杨桐, 梁潇, 方勇纯
中国科学: 信息科学, 2022, 52(3): 521-538
摘要 为了提高塔式吊车的实际工作效率,往往需要在驱动旋臂和台车的同时改变绳长,以同步实现负载的运输与起落吊运.然而,目前针对变绳长塔式吊车控制问题的研究非常有限,依然处于起步阶段.对于变绳长塔式吊车而言,如何在保证系统良好暂态性能的基础上,减少运输时间、降低系统能耗,并同时实现综合最优是一个亟待解决的实际问题.为此,本文提出了一种考虑状态约束的五自由度塔式吊车多目标最优轨迹规划方法,首次实现了运输时间和系统能耗的Pareto最优,并可从理论上保证状态变量及其对应速度满足物理约束.具体而言,本文通过微分平坦输出信号构造和B样条曲线设计,实现了目标轨迹的定位和防摆性能,并利用改进的非支配近邻免疫算法(nondominated neighbor immune algorithm, NNIA)解决了多目标优化问题.最后,通过多组实际实验验证了所提方法的有效性.
关键词 塔式吊车; 欠驱动系统; 多目标优化; 轨迹规划; 摆动抑制; tower cranes; underactuated systems; multi-objective optimization; trajectory planning; swing suppression;
Zhuoqing LIU, Ning SUN, Yiming WU, et al. Multi-objective trajectory planning for 5-DOF underactuated tower cranes with state constraints. Sci Sin Inform, 2022, 52(3): 521-538, doi: 10.1360/SSI-2021-0106
鲁棒控制与自适应控制(8)
高超声速飞行器鲁棒自适应控制专题
高超声速飞行器的通道耦合协调鲁棒自适应控制算法
寿莹鑫, 韩旭东
中国科学: 信息科学, 2024, 54(10): 2308-2325
摘要 考虑高超声速飞行器再入飞行的稳定姿态控制需求,本文围绕气动舵控制能力约束和不确定干扰的问题,利用通道耦合特性开展协调鲁棒自适应控制技术研究.基于副翼舵偏角和升降舵偏角协调的策略提出分层控制设计,实现通道耦合利用以弥补方向舵低舵效引起的操纵不足.针对动力学不确定估计和外界干扰观测的需求,采用模糊逻辑系统以及误差鲁棒积分技术建立平行估计模型,提出利用预测误差的复合估计自适应律.通过Lyapunov方法分析闭环系统稳定性,并保证闭环系统的误差信号一致终值有界.通过仿真测试验证了所提出算法的跟踪性能、学习准确性和鲁棒性.
关键词 高超声速飞行器; 通道耦合; 分层协调控制; 模糊逻辑系统; 误差鲁棒积分; hypersonic flight vehicle; channel coupling; hierarchical coordinated control; fuzzy logic system; robust integral of the sign of the error
Yingxin SHOU, Xudong HAN. Channel coupling coordinated robust adaptive control algorithm for hypersonic flight vehicles. Sci Sin Inform, 2024, 54(10): 2308-2325, doi: 10.1360/SSI-2024-0023
高超声速飞行器鲁棒自适应控制专题
面向动力学未知的高超声速飞行器过载跟踪鲁棒控制
郭雨岩, 刘源
中国科学: 信息科学, 2024, 54(10): 2281-2294
摘要 针对高超声速飞行器过载跟踪问题, 分析并给出了由过载和俯仰角速度组成的非线性系统动力学, 设计了有限时间预设性能控制策略以保证过载跟踪性能和精度. 考虑过载系统动力学中模型的不确定性, 利用神经网络估计系统未知非线性函数. 为改善神经网络学习性能, 采用平行估计模型构造表征学习性能的预测误差, 基于预测误差与跟踪误差设计了复合学习权重更新律, 通过李雅普诺夫 (Lyapunov) 函数分析证明了闭环系统学习与跟踪误差的有限时间稳定性. 仿真结果表明, 所设计的控制策略能够实现对动力学未知函数的在线估计与过载指令的准确跟踪.
关键词 高超声速飞行器; 过载跟踪控制; 有限时间控制; 复合学习; 预设性能控制; hypersonic flight vehicle; overload tracking control; finite-time control; composite learning; prescribed performance control
Yuyan GUO, Yuan LIU. Robust control for hypersonic flight vehicle overload tracking under dynamics uncertainties. Sci Sin Inform, 2024, 54(10): 2281-2294, doi: 10.1360/SSI-2023-0285
固定时间预设性能下涡扇发动机模糊自适应控制
刘凡, 陈谋
中国科学: 信息科学, 2024, 54(7): 1793-1806
摘要 为解决涡扇发动机大包线内多变量鲁棒控制问题,提出了一种基于干扰观测器的非线性涡扇发动机系统固定时间预设性能模糊自适应控制方法.首先,利用平衡流形建模方法构建了涡扇发动机的仿射非线性数学模型.借助反馈线性化技术,推导了受扰涡扇发动机系统的输出跟踪误差系统.然后利用模糊逻辑系统逼近系统不确定项,并设计非线性干扰观测器估计未知干扰和逼近误差组成的复合干扰.为保证控制系统的瞬态性能和稳态精度,引入固定时间预设性能函数,并通过误差转换函数将系统转化成无约束误差系统,进而设计涡扇发动机复合非线性鲁棒抗扰控制器.仿真结果表明,该控制方法能够使得涡扇发动机系统的转速和压比有效地跟踪参考指令并且跟踪误差始终限制在预设性能边界内.
关键词 涡扇发动机; 非线性干扰观测器; 模糊逻辑系统; 固定时间; 预设性能函数; turbofan engine; nonlinear disturbance observer; fuzzy logic system; fixed time; prescribed performance function
Fan LIU, Mou CHEN. Fuzzy adaptive control for turbofan engines with fixed-time prescribed performance. Sci Sin Inform, 2024, 54(7): 1793-1806, doi: 10.1360/SSI-2023-0329
变工况下不确定动态突变四旋翼飞行器系统的自适应湍流风扰动抑制技术
张雨杰, 文利燕, 姜斌, 齐瑞云
中国科学: 信息科学, 2024, 54(7): 1730-1751
摘要 本文考虑四旋翼飞行过程中湍流风扰动的影响,以及因变工况飞行而导致的不确定动态突变问题,提出了基于输入–扰动双补偿器设计的自适应湍流风扰动抑制方案,保证了四旋翼飞行器系统的稳定和输出渐近跟踪性能.首先对风场环境下的四旋翼进行建模,研究各不同工况下的动态特性,并分析研究了四旋翼飞行器变工况飞行时的动态特性突变的表现形式以及所带来的控制难题.进而设计了一种基于输入–扰动双补偿器的系统重构方案,实现了动态系统重构,解决了关联矩阵突变为非对角型时难以解耦控制,以及相对阶结构突变时控制器结构发生突变的问题.基于重构后的系统,设计自适应的湍流风扰动抑制方案,保证四旋翼飞行器的稳定、扰动抑制和渐近输出跟踪性能.最后,对所设计的控制器进行稳定性证明,并通过仿真验证所提出控制算法的有效性.
关键词 四旋翼; 风扰动抑制; 动态特性突变; 系统重构; 自适应控制; quadrotor; wind disturbance suppression; dynamic mutation; system reconstruction; adaptive control
Yujie ZHANG, Liyan WEN, Bin JIANG, et al. Adaptive wind disturbance rejection technique of a quadrotor with uncertain dynamic mutations under varying operating conditions. Sci Sin Inform, 2024, 54(7): 1730-1751, doi: 10.1360/SSI-2023-0251
不确定工时下多目标柔性作业车间调度问题的进化求解方法
钟小玉, 韩玉艳, 姚香娟, 巩敦卫, 孙永征
中国科学: 信息科学, 2023, 53(4): 737-757
摘要 在实际工业生产中,调度环境的复杂性与不确定性使得调度问题求解难度大大提高.针对加工时间不确定的柔性作业车间调度问题,采用不确定参数描述随机工时波动程度和约束条件允许违背程度,构建工时波动服从指数分布的多目标柔性车间调度模型.基于机会约束规划理论,将不确定调度问题转化为加工时间确定的柔性作业车间调度问题,求解得到一定程度上具有鲁棒性能的调度方案.在执行过程中,采用工序移动调整和重调度方法对作业排产方案进行动态调整.基于双链式编码以及贪婪插入法解码规则,提出了基于变邻域搜索的混合NSGA-Ⅱ算法.针对车间调度问题的多约束性和计算复杂度高等特点,设计了基于机器选择的复合启发式规则,包括依据概率的最小累计机器负载和最短工序加工时间规则,以获取更加接近Pareto前沿的均匀分布初始种群.采用改进工序和设备交叉策略以提高算法的全局搜索能力.此外,基于关键工序和机器选择的多种邻域结构,设计了变邻域搜索策略,以进一步提高算法的局部搜索能力.通过Kacem和Brandimarte标准算例的数值仿真以及与多种代表算法的统计比较,验证了所提算法的有效性.本文所提算法为不确定柔性作业车间调度问题提供了更优的调度方案.
关键词 多目标优化; 柔性作业车间调度; NSGA-II; 变邻域搜索; 不确定工时; 机会约束规划; multi-objective optimization; flexible job shop scheduling; variable neighborhood search; uncertain processing time; chance-constrained programming;
Xiaoyu ZHONG, Yuyan HAN, Xiangjuan YAO, et al. An evolutionary algorithm for the multi-objective flexible job shop scheduling problem with uncertain processing time. Sci Sin Inform, 2023, 53(4): 737-757, doi: 10.1360/SSI-2022-0017
具有高阶时延的离散非仿射非线性系统的自适应跟踪控制
张言军
中国科学: 信息科学, 2023, 53(3): 535-549
摘要 本文研究了一类具有高阶输入–输出时延的非仿射非线性离散不确定系统的自适应输出跟踪控制问题,提出了一种基于隐函数的自适应输出反馈输出跟踪控制方案.该方案主要解决了两个技术问题:一是构造了基于未知参数估计和未来时刻信号估计的隐函数方程解的自适应控制律,解决了因系统高阶时延导致的控制律因果矛盾问题并实现了闭环稳定和渐近输出跟踪;二是针对非仿射非线性控制律难求解问题,提出了基于迭代解的解析自适应控制律,实现了闭环稳定和实用输出跟踪.最后仿真研究证实了所提出控制方案的有效性.
关键词 自适应控制; 非仿射非线性; 闭环稳定; 输出跟踪; adaptive control; non-affine nonlinearity; closed-loop stability; output tracking;
Yanjun ZHANG. Adaptive tracking control of discrete-time non-affine nonlinear systems with high-order time delays. Sci Sin Inform, 2023, 53(3): 535-549, doi: 10.1360/SSI-2022-0007
面向特殊应用场景的无人机智能决策与控制专刊
基于安全自适应强化学习的自主避障控制方法
王珂, 穆朝絮, 蔡光斌, 汪韧, 孙长银
中国科学: 信息科学, 2022, 52(9): 1672-1686
摘要 障碍规避是无人机等自主无人系统运动规划的重要环节,其核心是设计有效的避障控制方法.为了进一步提高决策优化性和控制效果,本文在最优控制的设定下,提出一种基于强化学习的自主避障控制方法,以自适应方式在线生成安全运行轨迹.首先,利用障碍函数法在代价函数中设计了一个光滑的奖惩函数,从而将避障问题转换为一个无约束的最优控制问题.然后,利用行为–评价神经网络和策略迭代法实现了自适应强化学习,其中评价网络利用状态跟随核函数逼近代价函数,行为网络给出近似最优的控制策略;同时,通过状态外推法获得模拟经验,使得评价网络能利用经验回放实现可靠的局部探索.最后,在简化的无人机系统和非线性数值系统上进行了仿真实验与方法对比,结果表明,提出的避障控制方法能实时生成较优的安全运行轨迹.
关键词 自主无人系统; 避障控制; 强化学习; 神经网络; 经验回放; autonomous unmanned systems; obstacle avoidance control; reinforcement learning; neural networks; experience replay;
Ke WANG, Chaoxu MU, Guangbin CAI, et al. Autonomous obstacle avoidance control method based on safe adaptive reinforcement learning. Sci Sin Inform, 2022, 52(9): 1672-1686, doi: 10.1360/SSI-2022-0054
线性二次二人Stackelberg博弈均衡点求解: 一种Q学习方法
李曼, 秦家虎, 王龙
中国科学: 信息科学, 2022, 52(6): 1083-1097
摘要 近年来, Stackelberg博弈被广泛用于解决信息物理系统安全控制、智能电网能源管理等问题.已有的Stackelberg均衡点求解方法大多需要已知系统模型信息,而在实际应用中模型信息通常难以精确获取,这在一定程度上限制了相关理论研究成果的应用.鉴于此,本文研究了不基于系统模型的Stackelberg博弈均衡点的求解方法.具体地,本文考虑线性二次二人Stackelberg博弈,其中博弈状态演化满足线性方程,且成本函数为二次形式.博弈的两个参与者为能够预测另一个体可能响应的个体(即领导者),和根据领导者策略作出最优响应的个体(即跟随者).因为本文考虑线性形式的状态演化和二次形式的成本函数,且领导者先于跟随者采取行动,故领导者和跟随者的决策问题可建模为两层的线性二次型最优控制问题.本文按照从跟随者到领导者的原则,基于动态规划原理推导出最优控制策略.该策略被证明恰好为Stackelberg均衡策略,但其计算需使用系统模型信息.基于此策略,本文提出一种基于执行器–评价器(actor-critic)结构的Q学习算法,解决了系统动力学模型未知情况下线性二次二人Stackelberg博弈均衡点求解问题.此外,本文理论证明了所提算法能够保证系统状态、执行网络和评价网络权重估计误差一致最终有界,并通过数值仿真实验说明基于Q学习算法所得控制策略能够使系统状态稳定,且估计控制策略下的成本函数偏离均衡策略下的成本函数的幅度较小.
关键词 线性二次二人Stackelberg博弈; 最优控制; 模型未知; 执行器–评价器结构; Q学习; linear-quadratic two-player Stackelberg game; optimal control; model-free; actor-critic structure; Q-learning;
Man LI, Jiahu QIN, Long WANG. Seeking equilibrium for linear-quadratic two-player Stackelberg game: a Q-learning approach. Sci Sin Inform, 2022, 52(6): 1083-1097, doi: 10.1360/SSI-2021-0016
随机系统与控制(2)
随机复杂系统设计方案排序问题的动态计量预算分配策略
肖辉, 魏志宏, 寇纲, 顾先明
中国科学: 信息科学, 2024, 54(2): 373-393
摘要 仿真技术已被广泛地用于评估与优化随机复杂系统,例如生产制造、网络通信、医疗健康等信息物理融合系统.然而,将仿真优化方法用于方案排序问题的研究甚少.本文考虑只能通过系统仿真才能获取性能表现的k个备选方案排序问题,在贝叶斯(Bayes)框架下,构建以寻求最大化后验方案正确排序概率为目标的动态仿真预算优化分配模型.通过将仿真预算分配决策过程表述成一个随机动态规划问题,推导出一种动态计量预算分配策略,并证明了该分配策略的渐进最优性.数值实验以及案例分析的结果表明,本文提出的算法显著地提高了方案排序问题的仿真优化效率.
关键词 仿真优化; 排序选优; 信息物理融合系统; 马尔科夫决策过程; 贝叶斯估计; simulation optimization; ranking and selection; cyber-physical system; Markov decision process; Bayesian estimation
Hui XIAO, Zhihong WEI, Gang KOU, et al. Dynamic computing budget allocation for design ranking in stochastic complex systems. Sci Sin Inform, 2024, 54(2): 373-393, doi: 10.1360/SSI-2022-0451
基于大偏差技术的子集排序最优仿真预算分配方法
肖辉, 王子淳, 寇纲, 顾先明, Loo Hay LEE
中国科学: 信息科学, 2023, 53(6): 1147-1162
摘要 排序选优方法已广泛应用于求解离散事件动态系统中的仿真优化问题,但该类方法鲜有研究聚焦于子集排序问题的高效求解,而子集排序问题广泛存在于智能制造、电气工程、供应链管理等众多领域.本文针对k个备选方案的子集排序问题,构建了以最大化子集正确排序概率为目标的仿真预算优化分配模型,推导了该优化问题的渐进最优条件,并提出了相应的序贯仿真算法来实现仿真预算的渐进最优分配规则.数值实验结果表明,本文所提出的算法显著地提高了子集排序问题的仿真优化效率.
关键词 离散事件动态系统; 仿真优化; 最优计量分配方法; 大偏差技术; 排序选优; discrete event dynamic systems; simulation optimization; OCBA; large deviation technology; ranking and selection;
Hui XIAO, Zichun WANG, Gang KOU, et al. Optimal simulation budget allocation for subset ranking from a large deviation perspective. Sci Sin Inform, 2023, 53(6): 1147-1162, doi: 10.1360/SSI-2021-0440