控制 人工智能系统 论文 Website Google Scholar

非完全信息下人机合作对抗博弈专题

基于MASAC的无人机集群对抗博弈方法

MASAC-based confrontation game method of UAV clusters

王尔申, 刘帆, 宏晨, 郭靖, 何宁, 赵琳, 薛健
中国科学: 信息科学, 2022, 52(12): 2254-2269
摘要 随着无人机智能化水平的提高和集群控制技术的发展,无人机集群对抗智能决策方法将成为未来无人机作战的关键技术.无人机集群对抗学习环境具有维度高、非线性、信息有缺失、动作空间连续等复杂特点.近年来,以深度学习和强化学习为代表的人工智能技术取得了很大突破,深度强化学习在解决复杂环境下智能决策问题方面展现出了不俗能力.本文受多智能体集中式训练–分布式执行框架和最大化策略熵思想的启发,提出一种基于非完全信息的多智能体柔性行动器–评判器(multi-agent soft actor-critic, MASAC)深度强化学习方法,建立基于多智能体深度强化学习的无人机集群对抗博弈模型,构建连续空间多无人机作战环境,对红蓝双方无人机集群的非对称性对抗进行仿真实验,实验结果表明MASAC优于现有流行的多智能体深度强化学习方法,能使博弈双方收敛到收益更高的博弈均衡点.进一步对MASAC的收敛情况进行实验和分析,结果显示MASAC具有良好的收敛性和稳定性,能够保证MASAC在无人机集群对抗智能决策方面的实用性.
关键词 深度强化学习; 多智能体; 对抗博弈; MASAC; 无人机集群; deep reinforcement learning; multi-agent; confrontation game; MASAC; UAV clusters;

控制 人工智能系统 论文 Website Google Scholar

非完全信息下人机合作对抗博弈专题

非完备策略集下人机对抗空战决策方法

Human-computer gaming decision-making method in air combat under an incomplete strategy set

李守义, 陈谋, 王玉惠, 吴庆宪, 贺建良
中国科学: 信息科学, 2022, 52(12): 2239-2253
摘要 在真实的空战对抗环境中,不确定性广泛存在.本文考虑人机对抗场景中的空战决策问题,提出了一种非完备策略集下的博弈决策方法.首先,将对抗的无人机群和有人机群的动态博弈过程分解为不同的决策阶段,并将当前的决策阶段建模为一个零和博弈模型.所建模型考虑了有人机群的策略不完全可知的情形,并用一个不确定效用矩阵来描述这种非完备策略.随后,基于矩阵博弈中的最大最小策略概念,提出了非完备策略下博弈模型的求解方法,从而给出了无人机群的决策序列.最后通过仿真实验验证了所提方法的有效性.
关键词 无人机; 空战决策; 人机对抗; 非完备策略集; 博弈论; 最大最小策略; unmanned air vehicle(UAV); air combat decision-making; human-computer gaming; incomplete strategy set; game theory; maximum-minimum strategy;

控制 人工智能系统 论文 Website Google Scholar

非完全信息下人机合作对抗博弈专题

分层决策多机空战对抗方法

A hierarchical decision-making method for multi-aircraft air combat confrontation

王欢, 周旭, 邓亦敏, 刘小峰
中国科学: 信息科学, 2022, 52(12): 2225-2238
摘要 在空战研究领域,战术决策旨在提高博弈对抗收益,进而提升战机攻击效率.现有战术决策算法大多基于规则方法设计,当应用于多机空战的复杂环境时则存在设计难度大,难以求解最优解等问题.本文提出一种分层决策多机空战对抗方法,首先,在训练初始阶段借鉴已有人类专家经验,指导模型训练;其次,根据战术动作类型设计分层动作决策网络,降低动作决策空间维度;最后,将训练产生的对抗经验按阶段分解,降低策略学习难度.在多机空战仿真环境中进行了实验验证,相比于现有多机空战决策方法,本文提出的方法在训练收敛性和决策性能方面均具有更好的表现.
关键词 多机空战; 动作决策网络; 博弈; 分层强化学习; 决策收益; multi-aircraft air combat; action decision-making network; game; hierarchical reinforcement learning; decision gain;

控制 人工智能系统 论文 Website Google Scholar

非完全信息下人机合作对抗博弈专题

非完全信息下基于 PPO-CFR 的扩展式博弈决策

Extensive game decision based on the PPO-CFR algorithm under incomplete information

黄蕾, 朱进, 段福庆
中国科学: 信息科学, 2022, 52(12): 2178-2194
摘要 非完全信息下的人机对抗通常可以通过双人零和博弈模型加以描述,反事实后悔最小化(counterfactual regret minimization, CFR)是处理非完全信息双人零和博弈的一种流行算法.然而现有CFR及其变体算法在迭代过程中使用固定的后悔值计算和策略更新类型,在非完全信息扩展式博弈下表现各有优劣,泛化性能薄弱.针对这一问题,本文将强化学习近端策略优化(proximal policy optimization,PPO)算法与CFR算法相结合,提出一种PPO-CFR算法,通过训练出理性的智能体,从而实现CFR迭代过程后悔值计算和策略更新类型的自适应选择,以提高算法的泛化性能,并实现非完全信息扩展式博弈的策略优化.本文采用通用的扑克博弈实验验证所提算法,并制定逐步奖励函数训练智能体的动作策略,实验结果表明,与现有方法相比, PPO-CFR算法具有更好的泛化性能和更低的可利用度,迭代策略更为逼近纳什均衡策略.
关键词 非完全信息; 扩展式博弈; 反事实后悔最小化; 近端策略优化; 博弈决策; incomplete information; extensive game; counterfactual regret minimization; proximal policy optimization; game decision-making;

控制 人工智能系统 论文 Website Google Scholar

非完全信息下人机合作对抗博弈专题

非全时有效人类决策下的人机共享自主方法

Human-machine shared autonomy approach for non-full-time effective human decisions

游诗艺, 康宇, 赵云波, 张倩倩
中国科学: 信息科学, 2022, 52(12): 2165-2177
摘要 在人机共享自主中,人和智能机器以互补的能力共同完成实时控制任务,以实现双方单独控制无法达到的性能.现有的许多人机共享自主方法倾向于假设人的决策始终“有效”,即这些决策促进了任务的完成,且有效地反映了人类的真实意图.然而,在现实中,由于疲劳、分心等多种原因,人的决策会在一定程度上“无效”,不满足这些方法的基本假设,导致方法失效,进而导致任务失败.本文提出了一种新的基于深度强化学习的人机共享自主方法,使系统能够在人类决策长期无效的情况下完成正确的目标.具体来说,我们使用深度强化学习训练从系统状态和人类决策到决策价值的端到端映射,以显式判断人类决策是否无效.如果无效,机器将接管系统以获得更好的性能.我们将该方法应用于实时控制任务中,结果表明该方法能够及时、准确地判断人类决策的有效性,分配相应的控制权限,并最终提高了系统性能.
关键词 人机系统; 共享自主; 非全时有效决策; 深度强化学习; 仲裁; human-machine system; shared autonomy; non-full-time effective decision; deep reinforcement learning; arbitration;

控制 人工智能系统 论文 Website Google Scholar

具有学习和推理能力的空间无人系统智能架构

Intelligent architecture of space unmanned system with learning and reasoning capabilities

黄煌, 李谋, 刘磊, 汤亮, 刘昊, 谢心如, 刘乃龙, 魏春岭, 邢琰, 姜甜甜, 胡海东, 常亚菲, 胡勇, 杨孟飞
中国科学: 信息科学, 2022, 52(11): 2093-2105
摘要 以卫星、飞船、深空探测器为代表的航天器是一类典型的无人系统,经历了从自动化到自主化的不断发展.为提升航天器对未知空间环境和复杂空间任务的适应能力和智能自主水平,以空间无人系统为研究对象设计了具有学习和推理能力的无人系统智能架构,给出架构的组成及功能;接着分析该架构中学习和推理能力的运作机制,并针对架构所需的动作库和知识库的构建、更新与扩展方法等关键技术提出解决方案;最后通过地外星表巡视采样任务示例,具体说明在该智能架构下的新知识生成、基于知识的推理和自主执行任务的过程,以及过程中知识库、环境、任务和动作库之间的交互关系.
关键词 学习和推理能力; 空间无人系统; 智能架构; 动作库; 知识库; learning and reasoning capabilities; space unmanned system; intelligent architecture; action library; knowledge library;

控制 人工智能系统 论文 Website Google Scholar

基于强化学习的高速列车群运行调整方法

Rescheduling of high-speed trains: a reinforcement learning approach

代学武, 程丽娟, 崔东亮, 俞胜平, 袁志明, 应志鹏
中国科学: 信息科学, 2022, 52(5): 890-906
摘要 随着我国高速铁路建设成网,行车密度不断提高,在出现突发事件导致列车晚点时,行车调度的复杂性和难度急剧增加,如何动态调整列车群运行,以减少晚点,提高准点率是运行调整的核心.本文提出了一种适用于突发事件下高速列车群运行调整的无模型强化学习方法.首先将多个列车在多个车站和闭塞区间的运行调整建模为受约束的资源占用和配置的多阶段序贯决策过程,提出了基于动态时空拓扑矩阵的车站和区间统一化建模方法.针对高铁列车群时空关联强的特点,首次提出了一种包含车辆位置、路网资源等时空分布信息的强化学习状态空间、动作空间和回报函数,构建了有效的奖励反馈机制.然后,针对高铁运行系统搜索空间巨大的难点,提出了启发式动作子空间自适应生成方法,利用部分显式静态约束构建启发式规则减少搜索空间,有效减少了无模型强化学习的试错次数,提高了求解效率,也保留了无模型通用性好的优点.最后,基于京广高铁实际案例的仿真分析表明,在发生不同时空范围的大风限速,导致多车延误的事件下,所提出的算法均能较好收敛,明显减少列车群内晚点传播,与MILP, ACO, FCFS方法相比,列车群的平均晚点时间可减少2%~20%.
关键词 强化学习; 时空拓扑矩阵; 列车运行调整; FCFS算法; 优化; reinforcement learning; spatio-temporal topology matrix; train rescheduling; FCFS algorithm; optimization;

控制 人工智能系统 论文 Website Google Scholar

交互门控循环单元及其在到达时间估计中的应用

Interactive gated recurrent unit and its application for estimated time of arrival

孙翊文, 王宇璐, 傅昆, 王征, 张长水, 周东华, 叶杰平
中国科学: 信息科学, 2021, 51(5): 822-833
摘要 门控循环单元(gated recurrent unit, GRU)是一种有代表性的深度神经网络,它在众多序列学习任务中达到了国际领先的水平.然而,在门控循环单元的每个时间步之间,输入信息与隐含状态信息缺乏交互,这对更好地挖掘上下文语义信息带来了挑战.针对这个问题,本文提出了一个新颖的序列学习通用的语义特征提取模型:交互门控循环单元(interactive gated recurrent unit, InterGRU),可以让输入与隐含状态向量在各时间步间进行多轮充分的交互.并且,在到达时间估计(estimated time of arrival, ETA)这个有代表性、有挑战的时空序列预测任务上,本文提出了一套基于交互门控循环单元的深度学习框架(InterGRU-ETA).本文在来自滴滴出行平台真实场景下的海量数据集上充分地实验验证了InterGRU-ETA.结果表明,我们的框架在预测准确率上优于目前国际上最先进的方法.这反映了交互门控循环单元在捕获序列语义信息上的性能优势和广阔前景.
关键词 门控循环单元; 到达时间估计; 深度学习; 时空序列预测; 智能交通系统; gated recurrent unit; estimated time of arrival; deep learning; spatio-temporal forecasting; intelligent transportation systems;

控制 复杂网络与系统 论文 Website Google Scholar

基于半张量积的双合作博弈 Shapley 值计算

The Shapley value for bicooperative games based on the semi-tensor product

李志强, 李文鸽, 何秋锦, 宋金利, 杨俊起
中国科学: 信息科学, 2022, 52(7): 1302-1316
摘要 合作博弈中的参与人只将合作、不合作作为自己的策略,而双合作博弈是合作博弈的一般化,参与者以合作、不合作和弃权作为自己的策略,以获得自己所在的联盟利益的最大化,从而使自己的收益达到最优.与合作博弈一样,如何分配参与者联盟获得的总收益是双合作博弈的一个重要研究问题.本文利用矩阵半张量积工具,研究了双合作博弈的Shapley值计算问题.首先构造了双合作博弈的Shapley矩阵,然后将双合作博弈的Shapley值计算转化为双合作博弈的特征函数矩阵与Shapley矩阵乘积形式.本文得到的Shapley值矩阵计算公式形式简洁,不但简化了计算,而且为双合作博弈的研究提供了新的工具.
关键词 合作博弈; 双合作博弈; Shapley值; Shapley矩阵; 矩阵半张量积; cooperative game; bicooperative game; Shapley value; Shapley matrix; semi-tensor product of matrices;

控制 复杂网络与系统 论文 Website Google Scholar

基于生物网络的关系推断原理、方法与应用

Principle, method and application of relationship inference based on biological networks

李梢, 张鹏, 古槿, 江瑞, 李衍达
中国科学: 信息科学, 2022, 52(5): 856-869
摘要 在生物医学大数据时代,如何全面有效地发现致病基因、药物靶标等关键要素,从整体上理解宏观表型的微观本质,是目前信息科学与中西医学交叉研究面临的重大共性挑战之一.生物系统是典型的复杂系统,克服上述挑战的关键是:如何通过深入理解复杂生物系统的“关系”本质,解决复杂系统多层次信息融合难题以及生物医学大数据中广泛存在的维度高、噪声大、样本少等难点.“生物网络”是构成复杂生物系统的基础,反映人体内部基因和基因产物等各种生物分子的相互关系、生物分子与疾病和药物等不同层次的关系,生物网络已被广泛用于生物医学大数据的分析.李梢课题组从20余年前开始中西医药与生物网络的关联研究,率先提出“网络靶标”假说,并进行方法构建与应用.本文对基于生物网络的关系推断理论与方法进行总结与思考.首先,从原理上,发现疾病宏观表型与微观分子在复杂生物网络中存在“层次模块化关系”,即宏观层次的涌现在微观上具有局域模块性,宏观表型越相似,微观致病基因或药物靶标在网络上的模块性关联越强.其次,从方法上,给出基于生物网络从生物医学大数据、少量目标样本中推断关键生物要素的“关系推断”一般性方法框架:以层次模块化关系为基础,从全局角度进行关系网络构建、关系表示与建模、未知关系推断,实现关系的实体化、数学化、整体化.进而,从应用上,基于生物网络的关系推断方法在致病基因与药物靶标预测、疾病标志物识别、中医药机制解析等方面表现出很好的性能.综上,关系推断方法能够为从系统角度和分子水平揭示中西医药科学原理提供系统解决方案,也为网络药理学等新兴学科提供重要的原理和方法学支撑.
关键词 复杂生物网络; 模块化; 多层次关联; 关系推断; 小样本推断; 网络药理学; complex biological network; modularity; multilevel relationship; relationship inference; small-sample inference; network pharmacology;

控制 复杂网络与系统 论文 Website Google Scholar

两条层间连边下的双层链状网络同步能力分析

Analysis of the synchronizability of two-layer chain networks with two inter-layer edges

吴晓群, 孟涵怡, 陆君安, 胡捷, 韩秀萍
中国科学: 信息科学, 2021, 51(11): 1931-1945
摘要 多层网络的结构和动力学是目前网络科学研究中的前沿方向.在多层网络中单层之间的连接方式直接影响整个多层网络的动力学、传播、扩散和同步.对于多层网络的一般结构,目前还没有系统的理论和方法,人们只能从简单的多层网络结构入手,来探索层间连接如何影响多层整体动力学行为.本文的工作针对单层是链状结构的双层网络,通过图论理论和数值计算探讨这一问题,寻找层间连接的优化方式.首先,根据主稳定函数方法,在同步域无界的条件下证明了各层结构相同的多层网络在任意层间部分连边方式下,均存在层间耦合强度阈值,使得整个网络同步能力达到最大,且最大同步能力就是其单层网络的同步能力.其次,仿真得到双层链状网络在层间两条连边下的最优连边位置分别为各条链的1/4和3/4处;最差连边位置分别为其端点及相邻次端点处.本文还分别利用主稳定函数方法以及"网络最短距离"结构指标,细致地讨论了单层节点数分别为4N, 4N+1, 4N+2, 4N+3情况下的层间最优连边方式.结果表明:单层节点数4N对应有4种层间最优连边方式,其他3种情况下层间最优连边方式均唯一.最后,本文提出了最优层间耦合强度的表达式,并通过计算不同节点数情况下网络的最优层间耦合强度,验证了该表达式的正确性.
关键词 多层网络; 同步能力; 链状网络; 层间连边方式; 层间耦合强度; multi-layer networks; synchronizability; chain networks; inter-layer connection modes; inter-layer coupling strength;

控制 复杂网络与系统 论文 Website Google Scholar

基于动态客流的城市轨道交通关键站点识别

A novel method to identify influential stations based on dynamic passenger flows

高超, 蒋世洪, 王震, 邓越, 范懿, 李学龙
中国科学: 信息科学, 2021, 51(9): 1490-1506
摘要 定量评估城市轨道交通站点的重要性有助于优化城市轨道交通网络,提升针对突发事件的应急管理能力.现有工作常根据轨道拓扑结构或静态客流的分布来识别关键站点,然而,由于居民日常出行行为展现时空变化特征,它们对关键站点的识别也有重要影响.为此,本文提出一种结合轨道网络拓扑结构和动态客流的拓扑–客流中心性指标来动态识别轨道交通关键站点.首先,将轨道交通网络拓扑结构抽象为节点负载网络,利用节点负载刻画客流时变特征.其次,利用级联失效模型对比拓扑–客流中心性指标与其他中心性指标对网络平均效率、极大连通系数和损失客流的影响.大量实验表明所提指标能有效识别轨道交通网络中的关键站点.同时,关键站点会随客流演变展现出动态变化特征,特别是当客流量波动剧烈时最为显著.
关键词 交通网络; 关键站点; 中心性指标; 动态客流; 级联故障; traffic networks; influential station; centrality measures; dynamic passenger flows; cascading failure;

控制 复杂网络与系统 论文 Website Google Scholar

基于多目标强化学习的社区隐藏框架

A multi-objective reinforcement learning framework for community deception

陶海成, 卜湛, 曹杰
中国科学: 信息科学, 2021, 51(7): 1131-1145
摘要 在复杂网络研究领域,社区隐藏算法旨在破坏社区发现算法的有效性,从而隐藏用户之间的关系,达到保护用户隐私的目的.现有的社区隐藏算法寄希望于已有用户改变自己的社交关系实现该目标,这对用户影响较大,操作空间比较小.不同于此类算法,本文所提的算法从增加节点及其相应边的角度出发,即伪造用户及其关系,最大程度降低了对用户的影响,将社区隐藏问题转换为网络增长问题.首先基于ratio association和ratio cut,提出两种更适合社区隐藏的指标;然后基于强化学习框架,定义动作空间为不同的网络增长模型,将两个指标在l个阶段的一致性策略值作为网络的状态表示,并将指标值作为奖赏值;最后采用两种策略来对指标进行优化,即给每个Q函数赋予权重的标量化多目标Q-learning算法以及基于Pareto最优算法的多目标Q-learning算法.在真实数据集上的大量实验表明,相比于现有最新的社区隐藏算法,本文所提算法展现出更好的有效性.
关键词 社交网络分析, 社区发现, 社区隐藏, 多目标优化, 强化学习

控制 复杂网络与系统 论文 Website Google Scholar

Network-splitter: 一种基于重叠社区的网络特征提取算法及其在链路预测中的应用

Network-splitter: a network feature extraction algorithm based on overlapping community and its application in link prediction

廖好, 黄晓敏, 吴子强, 周明洋, 毛睿, 汪秉宏
中国科学: 信息科学, 2021, 51(7): 1116-1130
摘要 链路预测任务是根据已知的网络结构和节点属性等信息来预测网络中产生新链路的可能性.它是网络科学中的一个基础性问题,具有重要的理论研究和实际应用价值.近年来,网络表示学习领域的学者利用深度学习提取网络复杂特征,大幅度提高了链路预测效果.实际网络中节点具有局部聚类现象,然而,当前的网络表示学习侧重于提取网络全局特征,忽略了局部信息特征.针对这个问题,我们提出了能够学习网络中节点在不同社区中局部特征表示的模型network-splitter.该模型利用重叠社区思想,在每个社区中创建节点的一个角色副本,并学习该角色副本的特征表示.最后将节点在不同社区中对应的角色副本信息通过神经网络综合,得到的综合向量包含网络全局特征和节点局部特征,并可应用到链路预测任务中.本文的实验结果表明, network-splitter模型与最新的网络学习表示方法相比具有很强的竞争力.
关键词 链路预测, 复杂网络, 网络表示学习, 局部节点特征, 重叠社区

控制 复杂网络与系统 论文 Website Google Scholar

基于移动闭塞原理的区间中断下列车多策略优化调度方法

Moving block principle-based multi-strategy optimal scheduling method for trains in case of segment blockages

张俊杰, 胡文峰, 彭涛, 阳春华
中国科学: 信息科学, 2021, 51(3): 413-429
摘要 在高铁日常运营中,地质灾害或设备故障等突发事件导致铁路行车区间中断,长时间的区间中断通常会导致大面积的列车晚点,给旅客出行带来极大的延误,如何在区间中断下对列车进行实时调整是高速铁路调度运行的一项重要课题.本文针对固定时间的区间中断,构建了列车运行速度调整和运行图调整的混合整数非线性规划(mixed integer nonlinear programming, MINLP)模型.在该模型中,除了常见的取消车次和延迟发车调度策略,还将降速运行策略考虑在内,在满足行车安全和车站通行能力的约束条件下,以3种调度策略的加权延误影响最小化为目标.该模型基于列车运动学模型计算列车降速运行带来的延误时间,并通过移动闭塞原理控制列车运行安全间隔.本文建立的模型可由商业优化软件CPLEX直接求解,并保证运行调整方案的实时性.模型还讨论了取消车次、延迟发车和降速运行这3种调度策略对总延误时间的影响,最后以京沪高铁实例进行验证.验证结果表明该模型是合理有效的,通过模型求解能对实际问题给出合理的调度方案并提高列车终到正点率.
关键词 高速列车调度; 区间中断; 实时运行调整; 降速运行; 混合整数非线性规划; high-speed train scheduling; segment blockage; real-time operation adjustment; deceleration operation; mixed integer nonlinear programming;

控制 信息物理系统 刊讯 Website Google Scholar

信息物理系统专题简介

Shiyan HU, Changliu LIU, Vincenzo PIURI
中国科学: 信息科学, 2022, 52(2): 376-376

控制 分布式控制与优化 论文 Website Google Scholar

有向图中含弹性关节多机械臂系统的分布式一致性

Consensus of multiple manipulators with elastic joints under a directed graph

孟祥正, 吴爱国, 梅杰, 马广富
中国科学: 信息科学, 2023, 53(1): 81-96
摘要 本文主要研究有向图中含弹性关节多机械臂系统的一致性问题,利用模型参考自适应一致性方法,将含弹性关节多机械臂系统的一致性问题转化成参考模型的一致性和单个机械臂系统的轨迹跟踪问题两个子问题.考虑到机械臂的相对角速度信息难以获取的情况,提出了无需相对角速度信息的线性参考模型.在轨迹跟踪算法设计上,利用反步法对单个机械臂系统设计了跟踪控制算法,使得系统达到关节角度趋于一致的结果.
关键词 含弹性关节机械臂; 一致性; 分布式控制; 多智能体系统; 有向图; manipulator with elastic joints; consensus; distributed control; multi-agent systems; directed graph;

控制 分布式控制与优化 论文 Website Google Scholar

车站封锁下基于问题知识的高速铁路列车运行实时调整方法

Real-time rescheduling approach of train operation for high-speed railways using problem-specific knowledge under a station blockage

王荣笙, 张琦, 张涛, 林鹏, 丁舒忻, 袁志明
中国科学: 信息科学, 2022, 52(11): 2121-2140
摘要 针对突发事件导致的车站封锁情况,本文以列车运行图为问题对象,以进化计算框架为基础,提出基于问题知识的运行图实时调整方法,通过减小列车总晚点时间,保证高铁运营的安全高效和旅客的满意舒适.首先,基于调整列车发车次序的运行图调整策略提出排列编码方法,用于减少解空间的无效搜索.之后,根据“紧追踪”的列车运行追踪方式,设计启发式解码方法消除所有行车作业约束,提升算法求解效率.最后,将调度员调整运行图的经验作为问题知识,用于初始化进化计算的初始种群,由此提出基于问题知识的启发式种群初始化方法,加快算法前期的收敛速度并提高求解方案质量.以京津高速线为例,在北京南站设置车站封锁下20~150 min不同封锁时长的9个典型场景,选择加强精英保留遗传算法和差分进化算法,分别应用实整数编码和排列编码,与随机种群初始化和启发式种群初始化的不同组合进行仿真实验.仿真结果表明,相较于实整数编码难以获取可行解, 2种进化算法应用排列编码方法后,能在9 s的平均时间内给出列车总晚点时间最小的调整方案.在启发式种群初始化的改进下, 2种进化算法能更快地收敛于近似最优解.选取加强精英保留遗传算法应用排列编码和启发式种群初始化的改进变体,作为本文最优改进进化算法.针对CPLEX无法在10 min获得最优解的7个场景,该改进进化算法都能在20 s内给出近似最优解.
关键词 高速铁路; 列车运行调整; 车站封锁; 进化计算; 遗传算法; 排列编码优化; high-speed railway; train rescheduling; station blockage; evolutionary computing; genetic algorithm; permutation-based optimization;

控制 分布式控制与优化 论文 Website Google Scholar

考虑V2G背景下微电网的一致性能量管理策略

Consistency-based energy management strategy for microgrids with V2G

任丽娜, 武瀚, 焦晓红
中国科学: 信息科学, 2022, 52(6): 1098-1113
摘要 电动汽车具有移动储能器的特性,对其充放电行为进行合理调度可以对电网负荷起到削峰填谷作用,并提高电网对风光能源的吸纳能力,为此本文研究了含有电动汽车与电网交互(vehicle-to-grid,V2G)的孤岛微电网分布式能量管理策略.首先通过充放电电价诱导机制,提出一种包含电动汽车聚合商的多智能体微电网效益模型,进而考虑实际能源系统在发电损耗及功率平衡约束下的社会效益最大化问题.其次利用微电网内分布式能源之间信息交互,设计基于多智能体一致性理论的优化求解算法,并进一步考虑系统中存在通信随机时延的情况,最终实现社会效益最大化且系统电价达到一致,并对此研究背景下算法的收敛性进行分析,给出了收敛条件.最后采用标准IEEE-11总线结构对系统进行仿真验证,证明了所提控制策略的有效性.
关键词 V2G; 多智能体系统; 发电损耗; 通信时延; 分布式一致性; V2G; multi-agent system; power loss; time delay; distributed consistency;

控制 故障诊断与控制系统安全 论文 Website Google Scholar

旋转导向钻井工具装备的微小故障检测

Incipient fault detection of rotary steerable drilling tool equipment

盛立, 牛艺春, 刘诗洋, 王伟亮, 高明, 周东华
中国科学: 信息科学, 2022, 52(11): 2106-2120
摘要 旋转导向钻井系统是油气开发领域的高端装备,其核心部分——动态指向式旋转导向钻井工具的可靠运行是钻井系统正常工作的重要前提.本文基于模型的方法研究了导向钻井工具装备的微小故障检测,有望为系统的运行维护与健康管理提供重要保障.首先,基于机理建模方法得到了导向钻井工具装备的数学模型.然后,利用移动加权平均方法提高了残差对微小故障的敏感性.基于非中心χ~2分布的性质,实现了对微小故障在统计意义下的可检测性分析,得到了保证误报率与漏报率在允许范围内的窗口长度和权值.最后,在旋转导向钻井工具原理样机上进行实验,实验结果验证了所提方法的有效性.
关键词 旋转导向钻井工具装备; 微小故障检测; 故障可检测性分析; 误报率; 漏报率; rotary steerable drilling tool equipment; incipient fault detection; fault detectability analysis; false alarm rate; missed detection rate;

控制 故障诊断与控制系统安全 论文 Website Google Scholar

知识嵌入式图神经网络在风机多元状态预测中的应用

Application of knowledge-embedded graph neural network for multivariate state prediction of wind turbines

刘颖, 李阳光, 瞿树晖, 董纪昌, 王竞凡
中国科学: 信息科学, 2022, 52(10): 1870-1882
摘要 风机状态预测是风电数字化和智能运维的关键环节.深度学习由于在挖掘复杂高维数据隐藏关系上具有强大潜力,逐渐被应用于风机状态预测中.然而深度学习在实际运行中也存在着推理性和解释性差等局限性,如何将领域知识与智能算法有效结合是智能运维的一个重要方向.本文以多元时间序列图神经网络通用框架(multivariate time series graph neural network, MT-GNN)为基础,提出了一个知识嵌入式图神经网络模型(knowledge-embedded graph neural network, K-GNN),对风机多元时间序列状态数据进行预测.在该模型中,本文将知识嵌入模块与图学习模块相结合,通过嵌入相关、因果、专家经验3种知识矩阵,更好地刻画出状态变量之间的关联关系.结果显示,在3种知识嵌入式K-GNN模型中,嵌入了专家经验矩阵的图神经网络模型在预测上的表现更为出色,说明领域知识能够有效提升图神经网络模型的泛化性能和可解释性.本文的研究成果对于风电预测性维护技术的研发和推广具有参考意义.
关键词 风力发电机; 状态预测; 多元时间序列; 专家经验; 图神经网络; wind turbines; state prediction; multivariate time series; expert experience; graph neural network;

控制 故障诊断与控制系统安全 论文 Website Google Scholar

非正障碍函数: 面向非线性系统安全控制的一类新颖障碍函数

Non-positive barrier function: a new notion of barrier function for state-safety control of nonlinear dynamical systems

朱哲人, 张新民, 柴毅, 宋执环
中国科学: 信息科学, 2022, 52(10): 1853-1869
摘要 面向系统状态安全的分析与控制,是目前控制领域内的热点研究之一.针对一类具有可行状态集的动态系统,本文深入讨论障碍函数与状态安全判据之间的相关性,通过设计一种新颖的障碍函数,提出了基于障碍函数的状态安全判据,该状态安全判据可用于此类系统的安全分析、诊断与控制.受启发于倒数障碍函数与零障碍函数,本文设计了一类非正障碍函数,并在此基础上提出了面向可行状态集的动态系统状态安全判据,通过验证该可行状态集的前向不变性,从而保证系统的安全性;根据非正障碍函数,建立了控制障碍函数,以此设计面向动态控制系统的状态安全控制器,保障系统的运行安全.上述理论与方法在一类连续搅拌釜反应器的安全运行控制中得以应用,通过仿真验证,证明了理论与方法的有效性,实现了基于障碍函数的安全控制理论在过程控制中的首次尝试.
关键词 非正障碍函数; 动态系统; 状态安全控制; 安全性判据; 控制障碍函数; non-positive barrier function; dynamical systems; state-safety control; safety criteria; control barrier function;

控制 故障诊断与控制系统安全 评述 Website Google Scholar

电力系统安全仿真技术: 工程安全、网络安全与信息物理综合安全

Power system security simulation technologies: engineering safety, network security and cyber-physical integrated security

王子骏, 刘杨, 鲍远义, 管晓宏, 吴桐, 卢建刚, 余志文, 袁晓舒, 刘烃
中国科学: 信息科学, 2022, 52(3): 399-429
摘要 电力系统安全仿真是面向电力系统自身故障或外部攻击等安全威胁,通过仿真实验或借助数值计算研究系统行为的技术.随着自动控制、网络通信、人工智能等信息技术的广泛应用,电力系统已发展成为物理系统与信息系统深度耦合的信息物理融合系统.物理破坏或网络攻击产生的故障在电力系统中相互关联,可跨域传播,产生新的安全威胁形态.电力系统安全仿真正在面临新的挑战.本文回顾了历史上影响广泛的电力系统安全事件;从工程安全、网络安全、信息物理综合安全3个维度,分析电力系统安全仿真的需求和技术发展,对代表性的安全仿真平台进行分类和总结;探讨电力系统安全仿真技术面临的挑战和发展趋势.
关键词 信息物理融合系统; 工程安全; 网络安全; 信息物理综合安全; 电力系统安全仿真技术; cyber-physical system(CPS); engineering safety; network security; cyber-physical integrated security; power system security simulation technology;

控制 故障诊断与控制系统安全 论文 Website Google Scholar

基于改进LSTM的高速列车牵引系统微小渐变故障诊断

Incipient fault diagnosis for high-speed train traction systems via improved LSTM

冒泽慧, 顾彧行, 姜斌, 许德智, 孙秀文, 刘文静
中国科学: 信息科学, 2021, 51(6): 997-1012
摘要 高速列车牵引系统的微小渐变故障诊断是保障高速列车安全可靠运行的一项重要任务,传统的数据驱动方法通常难以在故障初期实现微小渐变故障的诊断.本文考虑到传感器时序信号的非平稳特性和微小渐变故障具有的慢时变特性,提出了一种基于改进长短期记忆网络(long short-term memory,LSTM)的微小渐变故障无监督诊断方法.首先,我们提出了一种基于LSTM的改进网络结构,并结合门控循环单元(gated recurrent unit, GRU)解码器,构造了一种对非平稳特性具有鲁棒性的自编码器模型以提取故障特征.进而,采用t-SNE (t-distributed stochastic neighbour embedding)对提取的故障特征向量进行降维,使用DBSCAN (density-based spatial clustering of applications with noise)进行故障聚类与识别,实现了对微小渐变故障的无监督诊断.最后,我们基于CRH_2牵引系统的半物理仿真平台数据对上述方案进行了验证.实验结果表明,该无监督诊断方法对同时包含已知和未知故障的情况能够达到95%以上的诊断准确率.
关键词 故障诊断, 微小渐变故障, 无监督学习, 改进的 LSTM 网络

控制 故障诊断与控制系统安全 论文 Website Google Scholar

基于最小特征值的挠性航天器执行器故障自适应补偿技术

Minimum eigenvalue-based adaptive compensation of actuator faults for flexible spacecraft

马亚杰, 姜斌, 任好
中国科学: 信息科学, 2021, 51(5): 834-850
摘要 本文针对挠性航天器执行器故障问题,提出了一种基于最小特征值的自适应故障补偿方法.首先,针对由故障和挠性模态引起的系统不确定性进行参数化;其次,为了解决由故障引起的控制增益矩阵的不确定性,构造了新的控制增益矩阵,并利用该矩阵的最小特征值设计标称控制信号;而后,设计自适应律对标称控制信号中的不确定参数进行估计,构成自适应控制信号,保证了系统稳定性和渐近跟踪性能;最后,仿真结果验证了本文提出的自适应控制方法的有效性.
关键词 执行器故障; 自适应补偿; 控制增益矩阵; 挠性航天器; 最小特征值; actuator faults; adaptive compensation; control gain matrix; flexible spacecraft; minimum eigenvalue;

控制 故障诊断与控制系统安全 论文 Website Google Scholar

存在环境干扰下航天继电器故障诊断与容错控制

A fault diagnosis and tolerant control method for aerospace relay with environmental disturbance

冯志超, 周志杰, 胡昌华, 班晓军, 张友民
中国科学: 信息科学, 2021, 51(4): 648-662
摘要 航天继电器作为液体运载火箭等大型结构件复杂电子系统中的关键部件之一,其工作状态直接决定整个系统能否正常工作.本文针对航天继电器使用过程中所面临的高价值样本缺乏、系统复杂、复杂环境干扰等难题,基于考虑属性可靠度的置信规则库(belief rule base with attribute reliability,BRB-r)专家系统提出了一种新的考虑环境干扰的航天继电器故障诊断与容错控制框架.在所提出的新框架中,对航天继电器输出监测指标进行分析,基于BRB-r建立航天继电器故障诊断模型,通过其工作状态评估结果,分为功能正常、功能缺陷和功能丧失3种;然后,针对3种状态分别设计3种控制策略:保持原控制输入、重构控制率和切换备份继电器.本文所提方法通过实验室所搭建的JRC-7M航天继电器测试系统进行了实验验证.
关键词 故障诊断; 容错控制; 航天继电器; 置信规则库; fault diagnosis; tolerance control; aerospace relay; belief rule base;

控制 故障诊断与控制系统安全 论文 Website Google Scholar

稀疏恶意攻击下的信息物理系统的“PID”型性能和安全控制

Secure control and proportional-integral-derivative performance of cyber-physical systems with sparse adversarial attacks

谢春华, 杨辉, 李哲
中国科学: 信息科学, 2021, 51(1): 89-103
摘要 针对遭受稀疏恶意攻击的离散时间线性系统,本文研究其安全控制问题.假设恶意攻击者受有限资源的约束,仅能操控远程控制器和执行器之间的若干通信通道.对于设计者来说,并不知道哪些通道受到攻击,哪些通道没有受到攻击.本文提出了一种新的安全的远程控制方法,它由控制律、切换函数和选择机制构成.选择机制为控制律提供合适的反馈增益,并产生一个切换函数,用以阻止攻击信号进入被控对象.理论分析表明,在基本的和必要的假设条件下,本文考虑的安全控制问题可转化为求解状态反馈镇定问题.本文所提控制方法,能保证闭环系统的稳定性且使其具有"PID"型性能的抗攻击能力.最后,通过对某无人地面车辆系统的仿真实验,验证了理论结果的正确性.
关键词 安全控制; 信息物理系统; 稀疏恶意攻击; 切换策略; 抗攻击性能; secure control; cyber-physical systems; sparse adversarial attacks; switching strategy; attack-resilient performance;

控制 滤波、估计与参数辨识 论文 Website Google Scholar

非线性递推辨识理论在量刑数据分析中的应用

Applications of nonlinear recursive identification theory in sentencing data analyses

王芳, 张蓝天, 郭雷
中国科学: 信息科学, 2022, 52(10): 1837-1852
摘要 司法大数据已成为法律实证研究和智慧司法工程建设的重要基础,相应地,数据计算结果的可解释性与可靠性等基础性问题愈加重要.为此,我们对非线性递推辨识理论进行了相应创新,并应用于量刑数据分析.具体来讲,依据相关法律建立了更加符合法逻辑的非线性随机量刑模型(S-模型),应用我们提出的非线性递推辨识算法和建立的关于有限数据样本下辨识精度的数学理论,对近20万故意伤害罪判决数据进行了计算分析.研究发现,与传统线性模型及最小二乘算法相比,基于我们的S-模型和非线性递推辨识算法所给出的计算结果,更符合量刑基本原则和具体规则,可以更准确地反映量刑要素的影响及变化,并具有更好的预测能力.
关键词 非线性模型; 递推辨识算法; 辨识精度保证; 量刑; 故意伤害罪; 司法判决数据; nonlinear model; recursive identification algorithm; identification accuracy guarantee; sentencing; crime of intentional injury; judicial documents data;

控制 导航、制导与控制 论文 Website Google Scholar

非完全信息下人机合作对抗博弈专题

障碍环境下基于生物捕食逃逸行为的多运动体边界防御博弈方法

Multi-agent border defense differential game based on biological predation and escape behavior in an obstacle environment

仝秉达, 段海滨, 夏洁, 刘小峰
中国科学: 信息科学, 2022, 52(12): 2213-2224
摘要 基于微分对策的追逃博弈和疆土防御问题是多智能体对抗博弈控制的关键问题之一.本文研究了含障碍物的有界区域中多运动体边界防御博弈方法.首先通过对自然界中生物的捕食逃逸行为进行分析,对多运动体边界防御博弈系统进行了建模,得到不同情况下博弈终止条件和价值函数.其次,本文对含障碍环境下博弈双方的主导区域和界栅面进行了分析,并与无障碍情况进行了对比.最后,数值仿真验证了本文提出的多运动体边界防御方法满足微分对策中的鞍点策略条件和有效性.
关键词 捕食逃逸; 协同控制; 边界防御; 微分对策; 鞍点策略; predation and escape; cooperative control; border defense; differential games; saddle point strategy;

控制 导航、制导与控制 论文 Website Google Scholar

面向特殊应用场景的无人机智能决策与控制专刊

基于干扰区间观测器的无人机预设性能着舰飞行控制

Disturbance interval observer-based carrier landing control of unmanned aerial vehicles using prescribed performance

胡伟, 雍可南, 陈谋
中国科学: 信息科学, 2022, 52(9): 1711-1726
摘要 无人机在现代战争中已发挥重要作用,为夺取海域制空权,航母配备无人机是必然趋势.面向无人机着舰的高精度控制要求,本文针对存在建模误差与外部干扰的无人机,在动态面控制框架下提出一种基于干扰区间观测器的无人机预设性能着舰飞行控制策略.该策略能够对未知项提供区间估计,在前馈补偿未知项的同时,控制律将根据区间估计的宽度动态调节控制器增益,从而保证无人机的轨迹始终处在着舰轨迹约束范围内.同时,在干扰区间观测器与飞行控制律设计过程中,引入非线性增益,有效地处理了着舰机动中的状态非线性耦合.最后,基于Lyapunov函数方法与不变集理论,给出着舰飞行控制策略的参数设计条件,数值仿真也进一步表明该策略的有效性.
关键词 无人机; 着舰控制; 预设性能控制; 干扰观测器; 区间观测器; unmanned aerial vehicle; carrier landing control; prescribed performance-based control; disturbance observer; interval observer;

控制 导航、制导与控制 论文 Website Google Scholar

面向特殊应用场景的无人机智能决策与控制专刊

面向宽域飞行的组合动力空天飞行器切换控制

Switching control of combined power aerospace vehicles for wide-area flight

程怡新, 许斌, 洪锐
中国科学: 信息科学, 2022, 52(9): 1687-1710
摘要 针对组合动力空天飞行器宽域爬升过程存在的模态转换、气动参数未知以及外界时变干扰等问题,研究了一种基于飞行包线模态划分的切换控制方案.对飞行器六自由度模型和发动机推力模型进行气动和推力特性分析,给出了模态划分结果和模态转换过渡过程.基于切换信号设计建立了空天飞行器切换系统,设计终端滑模软切换控制策略来保证模态的平稳转换,并利用神经网络和非线性扰动观测器协同处理系统不确定性和外界时变干扰.通过多Lyapunov函数方法对闭环切换系统的稳定性进行了分析,且仿真结果验证了所提方法的有效性.
关键词 空天飞行器; 组合动力; 模态转换; 切换控制; 鲁棒自适应控制; aerospace vehicle; combined power; modal transition; switching control; robust adaptive control;

控制 导航、制导与控制 论文 Website Google Scholar

面向特殊应用场景的无人机智能决策与控制专刊

基于动态目标概率分布的核电站无人机航路强化学习规划

Path reinforcement learning planning of nuclear power plant UAVs based on dynamic target probability distribution

周同乐, 陈谋
中国科学: 信息科学, 2022, 52(9): 1642-1655
摘要 针对核电站空中动态入侵目标,本文提出了一种基于动态目标概率分布的无人机航路强化学习规划算法,实现了对空中入侵目标的有效拦截.根据入侵目标的状态信息基于概率扩散原理计算目标的概率分布,推理目标可能出现的位置.在此基础上,设计了基于航路点转移规则的行动空间和基于目标概率分布的报酬函数动态更新机制,通过Q-学习不断优化路径,构建了基于目标概率分布和强化学习的无人机航路规划框架,实现了无人机航路强化学习规划.仿真结果表明,该方法能够针对核电站空中入侵目标,实现目标点变化情况下无人机的自主航路规划.
关键词 无人机; 核电站; 航路规划; 动态目标概率分布; 强化学习; UAV; nuclear power plant; path planning; dynamic target probability distribution; reinforcement learning;

控制 导航、制导与控制 论文 Website Google Scholar

面向特殊应用场景的无人机智能决策与控制专刊

面向复杂未知多障碍环境的多无人机分布式在线轨迹规划

Multi-UAV decentralized online trajectory planning in complex unknown obstacle-rich environments

张学伟, 田栢苓, 鲁瀚辰, 谌宏鸣, 宗群
中国科学: 信息科学, 2022, 52(9): 1627-1641
摘要 考虑复杂未知多障碍环境对无人机实时轨迹规划性能的影响,提出了基于Tube-MPC和模型预测路径积分(model predictive path integral, MPPI)控制相结合的多无人机分布式实时轨迹规划框架与方法.首先,考虑无人机在多障碍环境下的避碰避障需求,构造代价函数表征轨迹规划过程中的约束条件,将多无人机的轨迹规划问题转化为随机最优控制问题.其次,借鉴Tube-MPC思想,设计并实现了多无人机分布式轨迹规划框架,通过将低频标称控制器与高频辅助控制器串联保证了系统的实时性和鲁棒性.再次,为避免传统方法在求解过程中的维数灾难,提出基于MPPI的多无人机异步轨迹规划方法,该方法通过基于GPU的并行蒙特卡洛(Monte-Carlo)随机前向采样技术,将多无人机随机最优控制问题的求解转化为给定代价函数下对采样轨迹期望的求解,进而获得最优控制序列,其显著特点是求解速度快且避免了基于梯度求解方法对约束条件和代价函数连续性及凸特性的要求.最后,通过Gazebo虚拟仿真平台,在复杂未知多障碍环境下对算法的有效性进行了验证.
关键词 未知多障碍环境; 多无人机; 在线轨迹规划; 模型预测路径积分; GPU并行加速; unknown obstacle-rich environment; multi-UAV; online trajectory planning; model predictive path integral; GPU parallel acceleration;

控制 导航、制导与控制 论文 Website Google Scholar

面向特殊应用场景的无人机智能决策与控制专刊

基于合作竞争公共物品博弈的无人机集群动态资源分配

Dynamic resource allocation of UAV swarms based on cooperative and competitive public goods game

王浩淼, 段海滨, 魏晨
中国科学: 信息科学, 2022, 52(9): 1598-1609
摘要 无人机集群动态资源分配是其任务规划的挑战性关键技术难题.本文提出了一种基于合作竞争机制的动态资源分配方法,将无人机集群与网络进化博弈模型进行对应,建立了基于无人机拓扑网络的博弈模型,通过设计针对特殊个体的调控规则,达到提升系统平均收益的目的.最后,通过无人机博弈模型的仿真实验,根据网络结构、模型参数,以及不同激发机制下系统的稳态结果,验证了本文所提无人机动态资源分配方法的可行性和有效性.
关键词 无人机集群; 公共物品博弈; 动态资源分配; 合作机制; 竞争机制; UAV swarm; public goods game; dynamic resource allocation; cooperative mechanism; competition mechanism;

控制 导航、制导与控制 论文 Website Google Scholar

推力矢量极性错误下的飞行控制自主重构技术

Autonomous reconfiguration of flight control under thrust vector polarity errors

潘豪, 胡瑞光, 宋征宇, 邵梦晗
中国科学: 信息科学, 2022, 52(5): 870-889
摘要 飞行故障在线自主辨识与控制重构是实现航天智能飞行的一个重要标志.本文针对运载火箭飞行中的推力矢量极性错误,研究了基于人工神经网络的故障识别与自主重构方法.在明确故障模式基础上,结合扩张状态观测器(extended state observer, ESO)观测结果,提出了考虑模型偏差的仿真训练样本设计方法,并分别采用基于反向传播(back propagation, BP)神经网络和长短时记忆(long short term memory, LSTM)网络方法进行了故障辨识设计,仿真结果表明,两种方法均具有较高识别准确度,均可实现推力矢量极性错误下的平稳自主重构,相比而言,基于滑窗时间序列的LSTM网络方法更具优势,具有较高的识别准确度.
关键词 极性错误; 自主重构; 扩张状态观测器; 反向传播; 长短时记忆; polarity errors; autonomous reconstruction; extended state observer(ESO); back propagation(BP); long short term memory(LSTM);

控制 导航、制导与控制 论文 Website Google Scholar

角速度受限下航天器姿态机动事件触发控制

Event-triggered attitude maneuver control of spacecraft under angular velocity constraints

石永霞, 胡庆雷, 邵小东
中国科学: 信息科学, 2022, 52(3): 506-520
摘要 针对角速度受限和通信资源有限的航天器姿态系统,考虑转动惯量难以精确获得并且存在外部干扰的情况,提出一种基于神经网络的自适应事件触发姿态机动控制算法.该算法首先基于预设性能技术,将角速度受限约束转换为性能边界约束,进一步通过误差转换,建立姿态系统的等效误差模型,将存在角速度约束的航天器姿态系统机动控制问题巧妙地转化为无约束误差系统的状态有界稳定控制问题;然后,选用径向基神经网络设计自适应律,在线逼近系统中由未知转动惯量带来的不确定性项.与此同时,考虑到星载通信资源有限的问题,通过建立触发控制信号与实时控制信号之间的显式关系,设计一个统一的时变事件触发机制,当触发条件满足时同步更新控制器和自适应律,大大减少了控制器和执行器之间频繁的网络信号传输.此外,触发机制中时变项的引入严格保证了触发控制无Zeno现象发生.最后,仿真结果表明了所提出的姿态控制算法不但能够保证航天器高精度、高稳定度、高鲁棒性地完成指定姿态机动任务,而且可以减少大约97.50%的控制信号更新,这大大缓解了航天器的通信负担.
关键词 航天器; 角速度受限; 预设性能控制; 通信资源有限; 事件触发机制; spacecraft; angular velocity constraint; prescribed performance control; limited communication resources; event-triggered mechanism;

控制 导航、制导与控制 论文 Website Google Scholar

串联抑振轨迹规划方法及在FAST馈源支撑系统中的应用

A cascade vibration-free trajectory planning method and its application in the FAST feed support system

景奉水, 郑榕樟, 杨国栋, 邓赛, 谭民
中国科学: 信息科学, 2021, 51(11): 1914-1930
摘要 针对低阻尼柔性机构运动中的振动问题,本文提出了一种综合最优双S形轨迹规划法和输入整形法优点的串联抑振轨迹规划方法,其优势是可以有效抑制匀速运动时段的振动.论文从理论分析和数字仿真两个方面对该方法的正确性进行了证明.最后,对该方法在FAST馈源支撑系统的应用结果进行分析,表明其可有效提高并联柔索机构的运动精度,特别在匀速运动时可提高位置跟踪精度超过20%.
关键词 柔性机构; 五百米口径球面射电望远镜; 振动抑制; 轨迹跟踪; 运动规划; soft mechanism; five-hundred-meter aperture spherical telescope; vibration control; trajectory tracking; motion planning;

控制 导航、制导与控制 评述 Website Google Scholar

长征运载火箭上升段的自主制导方法及其研究进展

Review and progress of the autonomous guidance method for Long March launch vehicle ascent flight

宋征宇, 巩庆海, 王聪, 何勇, 施国兴
中国科学: 信息科学, 2021, 51(10): 1587-1608
摘要 本文综述了运载火箭上升段自主制导方法 (autonomous guidance method, AGM)的发展. AGM是指一类不依赖离线规划的参考轨迹,而是实时规划满足后续飞行复杂过程约束和终端条件的飞行轨迹,从而动态计算当前制导指令的方法.该方法结合了轨迹规划和传统制导方法的优点,具有在线、动态、全局和滚动的特点.分析了不同运动体在制导控制上面临的主要挑战,提出了长征运载火箭上升段自主制导方法的两大技术体系.一是针对确定目标轨道的制导方法,也称迭代制导(iterative guidance mode, IGM);介绍了迭代制导的基本理论、基础型及增强型算法,及其在型号中应用的飞行结果.二是目标轨道与飞行轨迹的联合优化方法,主要应对推力下降的典型故障;介绍了基于目标函数触发(state triggered indices, STI)的在线优化方法,以及以STI和IGM为基础进行自主任务重构的算法.论文还提出了未来的研究方向,包括多级分层优化,以及基于自主制导方法的新型闭环控制系统架构,以进一步增强上升段飞行的自主性和故障适应性.
关键词 迭代制导; 自主制导; 在线规划; 自主任务重构; 多级分层优化; iterative guidance mode(IGM); autonomous guidance method(AGM); online planning; autonomous mission reconstruction; multiple graded optimization(MGO);

控制 导航、制导与控制 论文 Website Google Scholar

基于高维多目标优化的多无人机协同航迹规划

Multi-UAV coordinated path planning based on many-objective optimization

蔡星娟, 胡钊鸣, 张志霞, 王茜, 崔志华, 张文生
中国科学: 信息科学, 2021, 51(6): 985-996
摘要 随着无人机应用领域的增多,多无人机协同航迹规划问题变得愈发重要.然而,现存的多无人机协同航迹规划问题大多将多个目标加权转换为单目标问题进行优化,为减少多目标加权的主观性,本文提出一种基于高维多目标优化的多无人机协同航迹规划模型,此模型可以同时优化多无人机航迹距离代价、多无人机航迹威胁代价、多无人机航迹能耗代价,以及多无人机协同性能.同时,为提高高维多目标优化算法在解决此模型时的性能,提出一种基于个体评估交叉策略的NSGA-Ⅲ算法(NSGAⅢ-ICO),可以根据算法运行代数综合评估个体优劣并指导种群交叉操作.仿真结果证明,此模型可以有效地提供多无人机协同航迹,且通过与其他高维多目标优化算法的比较,可以证明此改进算法可以有效地提高多无人机协同航迹规划的多种性能.
关键词 多无人机, 协同航迹规划, 高维多目标优化算法, 个体综合评估

控制 导航、制导与控制 论文 Website Google Scholar

基于TOA和TDTOA的增广状态脉冲星组合导航误差抑制方法

TOA and TDTOA-based augmented state pulsar integrated navigation error suppression method

宁晓琳, 桂明臻, 黄月清, 房建成, 吴伟仁
中国科学: 信息科学, 2021, 51(6): 971-984
摘要 脉冲星导航是一种极具潜力的深空自主导航技术,通常采用脉冲到达时间(time of arrival,TOA)作为量测信息.但脉冲星星历误差和星载原子钟误差等系统误差对导航性能有显著影响.为了解决上述问题,提出了一种基于TOA和时间差分TOA (TDTOA)的增广状态脉冲星组合导航误差抑制方法,通过将每个脉冲星的星历误差和时钟误差增加到状态向量,并利用TOA和TDTOA量测值对其进行估计和校正.仿真结果表明,该方法提高了脉冲星星历误差和时钟误差的可观测性,有效地消除了这些系统误差的影响,导航精度相比传统脉冲星导航提高了29%.
关键词 自主导航, 脉冲星导航, 系统误差, 时间差分, 可观测性分析

控制 导航、制导与控制 论文 Website Google Scholar

基于变权威胁评估的无人机安全飞行区域确定方法

Determining safe flight area of UAVs based on variable weight threat assessment

闫东, 陈谋, 吴庆宪, 袁梦顺
中国科学: 信息科学, 2021, 51(4): 663-677
摘要 针对复杂战场环境下确定无人机安全飞行区域的过程中面对的复杂性和不确定性问题,本文提出了一种基于变权理论和马尔可夫模型的无人机安全飞行区域确定方法.根据无人机相对于威胁区域距离的不同,引入变权理论对威胁指标权值进行调整,完成综合威胁大小计算.然后,利用马尔可夫模型对无人机飞行过程中受到的潜在威胁进行预测.接着,使用模糊评估方法评估无人机飞行区域的威胁等级,并引入云模型构建隶属度函数,以提高评估结果的可靠性.最后,根据威胁阈值确定无人机安全飞行区域.仿真结果表明所研究的无人机安全飞行区域确定方法在复杂战场环境下是有效的.
关键词 无人机; 威胁评估; 安全飞行区域; 变权理论; 马尔可夫模型; UAV; threat assessment; flight safety envelope; variable weight theory; Markov model;

控制 网络化控制系统 论文 Website Google Scholar

基于自适应动态时钟通信的二阶多智能体系统完全分布式一致性

Fully distributed consensus control for second-order multi-agent systems based on adaptive dynamic clock communication

邓甲, 王付永, 刘忠信, 陈增强
中国科学: 信息科学, 2023, 53(1): 97-110
摘要 针对无向通信拓扑下二阶多智能体系统的一致性问题,本文提出了一种基于自适应动态时钟的新型事件触发控制策略.智能体根据自身的动态时钟来确定触发时刻,在触发时刻向邻居广播自身的状态信息并自适应重置时钟.每个智能体只获取邻居在触发时刻的状态信息,且仅依赖自身的状态和邻居在触发时刻的状态来更新时钟和控制信号,无需使用邻居的实时状态信息,也无需使用通信拓扑的任何全局信息.所设计的控制策略有效避免了连续通信,并且是完全分布式的.利用代数图论以及Lyapunov稳定性分析方法证明了所提出的控制策略能保证系统是渐近稳定的并且不存在Zeno行为.仿真示例进一步验证了所提出控制策略的有效性.
关键词 完全分布式一致性; 多智能体系统; 事件触发控制; 自适应动态时钟; Zeno行为; fully distributed consensus; multi-agent systems; event-triggered control; adaptive dynamic clock; Zeno behavior;

控制 网络化控制系统 论文 Website Google Scholar

非完全信息下人机合作对抗博弈专题

基于虚拟排斥力的移动多智能体覆盖控制动态博弈算法

Dynamic game coverage control algorithms for multiple mobile agents through virtual repulsive force

宿浩, 张宝琳, 籍艳, 蔡智辉, 薛健, 马慧, 郑元世
中国科学: 信息科学, 2022, 52(12): 2195-2212
摘要 为提高移动多智能体系统的覆盖控制效率,通常要求移动智能体在覆盖控制过程中进行多信息甚至全信息交互.在此情形下,覆盖控制成本和能耗将大幅增加.如何在提高移动智能体覆盖效率的同时,尽可能降低控制成本一直是移动智能体覆盖控制领域的重要课题之一.本文研究非完全信息条件下的移动多智能体覆盖控制方法,提出了基于虚拟排斥力的移动多智能体覆盖控制合作博弈算法.首先,将移动多智能体集群分解为若干个子集群,群中每个智能体只能观测到各自周围一定范围内其他智能体的信息,将移动多智能体集群的覆盖控制问题转化为非完全信息条件下移动多智能体子群的合作博弈分布覆盖问题;其次,给出了各移动智能体子群的博弈规则,并提出了一种基于虚拟排斥力的智能体分布覆盖博弈决策策略,用以计算并确定集群中每个智能体在覆盖控制过程中的新候选位置;第三,将移动多智能体系统覆盖控制问题分解为以刚性虚拟结构为参照系的覆盖控制问题,简化了多智能体系统覆盖控制中位移路径的规划设计.仿真算例表明,本文提出的基于虚拟排斥力的覆盖控制合作博弈算法,可以实现不完全信息条件下移动多智能体系统的分布覆盖控制任务,有效节约移动智能体的覆盖控制成本;同时,和已有的覆盖控制算法相比,本文提出的动态合作博弈覆盖算法,覆盖控制过程中智能体移动次数更少,覆盖率更高.
关键词 动态博弈; 网络覆盖; 分布算法; 多智能体系统; 虚拟排斥力; dynamic game; network coverage; distributed algorithms; multi-agent systems; virtual repulsive force;

控制 网络化控制系统 论文 Website Google Scholar

通信距离受限下无人机集群轨迹分布式滚动规划

Trajectory distributed receding planning for UAV swarms subject to limited communication distance

徐广通, 孟子阳, 龙腾, 王祝, 孙景亮
中国科学: 信息科学, 2022, 52(8): 1527-1541
摘要 针对通信距离受限下无人机集群轨迹规划时效性与安全性问题,本文构建了分布式滚动规划框架,提出了局部优先级解耦的序列凸优化方法 (local-priority-decoupled sequential convex programming,LPD-SCP),将集群轨迹规划问题分解为一系列短时域单机凸优化子问题,在保证求解效率的基础上确保了轨迹的安全性.本文推导了确保飞行安全的可行规划时域长度,设计了通信距离受限的局部优先级解耦机制,根据通信状态动态调整邻域内无人机规避优先级,实现通信距离受限下的机间避撞.更进一步,定制了轨迹时间一致协调策略,通过更新飞行时间下边界约束,实现邻域内无人机飞行时间一致性.理论分析了所提LPD-SCP能够通过多次滚动规划获得满足约束的集群轨迹.数值仿真试验结果表明:LPD-SCP能够在通信距离受限条件下规划出满足飞行动力学、机间避碰与时间一致约束的协同轨迹,且15架无人机短时域集结轨迹生成时间不大于4 s.
关键词 集群轨迹规划; 通信距离受限; 滚动规划架构; 局部优先级解耦; 序列凸优化; trajectory planning of swarms; communication distance limitation; receding planning framework; local priority decoupling; sequential convex programming;

控制 网络化控制系统 论文 Website Google Scholar

网络化不确定非线性时滞系统的状态估计

State estimation for networked uncertain nonlinear systems with time-delays

徐雍, 饶红霞, 王卓, 鲁仁全, 李宗
中国科学: 信息科学, 2022, 52(8): 1513-1526
摘要 本文研究了离散不确定非线性时滞系统在网络传输不可靠情况下的状态估计问题.针对网络传输丢包问题,采用伯努利(Bernoulli)随机模型,建立了控制信号和输入信号的不可靠传输模型.本文通过状态扩展的方法处理不确定非线性项,得到了扩展状态系统.基于不可靠的控制和测量信息,设计了状态预测器和估计器,并给出相应的误差系统.通过设计最优估计器增益,本文给出了状态预测误差协方差的迭代公式.为了进一步提高状态估计器的精度,设计了一种新型的参数迭代优化方法.针对状态预测误差协方差,本文得到了其稳定性的判别准则.最后,通过一例数值仿真,验证了所得结论的有效性.
关键词 网络化控制系统; 扩展状态估计; 时滞; 不确定非线性; 丢包; networked control system; extended state estimation; time delay; nonlinear uncertainty; packet dropout;

控制 网络化控制系统 论文 Website Google Scholar

合作竞争网络下的多智能体系统链路故障检测

Link failure detection for multi-agent systems on cooperation-competition networks

邵晋梁, 石磊, 李彤, 张希琳
中国科学: 信息科学, 2022, 52(8): 1500-1512
摘要 本文提出分布式符号簇一致协议,研究合作竞争网络下的多智能体系统链路故障检测问题.首先,应用符号图理论和非负矩阵理论的相关知识分析智能体在符号簇一致性协议下的渐近收敛性和最终收敛状态.其次,通过观察链路发生故障前后智能体收敛状态的变化,给出精确判断故障链路的方法.该方法同时适用于单链路故障和多链路故障的情形.最后,通过数值模拟验证该方法的有效性.
关键词 多智能体系统; 合作竞争网络; 链路故障检测; 一致性; 分布式协议; multi-agent systems; cooperation-competition networks; link failure detection; consensus; distributed protocol;

控制 网络化控制系统 论文 Website Google Scholar

基于记忆型事件触发的信息物理系统的安全状态估计

Memory-based event-triggered secure state estimation of cyber-physical systems

严沈, 顾洲, 费树岷, Zhengtao DING
中国科学: 信息科学, 2021, 51(8): 1302-1315
摘要 本文针对一类时滞非线性信息物理系统,研究虚假数据注入攻击下基于记忆型事件触发的安全状态估计问题.不同于现有事件触发机制只考虑系统的瞬时信息,本文提出一种基于历史测量输出的记忆型事件触发机制.该机制可以有效减少输出信号随机波动导致的事件触发机制误触发次数,减少不必要的网络资源浪费.采用一个满足Bernoulli分布的随机变量来描述虚假数据注入攻击的随机过程.构造新的包含Legendre多项式的Lyapunov-Krasovskii泛函,采用Bessel-Legendre不等式技术,给出保证估计误差系统渐近稳定与状态估计器设计的充分条件.最后,通过仿真算例验证所提方法的有效性.
关键词 记忆型事件触发; 信息物理系统; 状态估计; 虚假数据注入攻击; memory-based event-triggering; cyber-physical systems; state estimation; false data injection attacks;

控制 非线性系统与控制 论文 Website Google Scholar

基于事件触发机制的多四旋翼无人机鲁棒自适应滑模姿态控制

Robust adaptive sliding mode attitude control of MQUAVs based on event-triggered mechanism

李鸿一, 王琰, 姚得银, 周琪, 鲁仁全
中国科学: 信息科学, 2023, 53(1): 66-80
摘要 针对一类具有外部干扰的多四旋翼无人机姿态系统,研究其在无向拓扑下的姿态跟踪问题,提出一种基于事件触发机制的鲁棒自适应滑模控制方法.首先,建立多四旋翼无人机的姿态动力学模型,并引入干扰观测器,对系统受到的未知外部干扰进行估计.其次,为了节约四旋翼无人机的网络传输资源,本文在传感器和控制器之间引入事件触发机制,并结合鲁棒滑模控制算法,设计基于事件触发的鲁棒自适应滑模控制器.此外,通过Lyapunov稳定性理论证明闭环系统中所有信号最终有界,并证明所设计的事件触发机制能够有效避免Zeno行为.最后,仿真结果验证所提控制方法的有效性.
关键词 滑模控制; 事件触发机制; 干扰观测器; 姿态跟踪; 多四旋翼无人机系统; sliding mode control; event-triggered mechanism; disturbance observer; attitude tracking; MQUAVs;

控制 非线性系统与控制 论文 Website Google Scholar

执行器故障和非对称误差约束下的时延多智能体系统自适应事件触发控制

Adaptive event-triggered control for time-delay multi-agent systems with actuator faults and asymmetric error constraints

范利蓉, 王芳, 周超, 王坤
中国科学: 信息科学, 2022, 52(7): 1287-1301
摘要 本文针对非线性多智能体系统一致性跟踪控制问题,设计自适应事件触发控制策略.首先,通过引入非对称障碍Lyapunov函数,使输出误差满足非对称约束条件.其次,采用Lyapunov-Krasovskii(L-K)泛函和Young不等式消除状态时延的影响.利用模糊逻辑系统逼近未知非线性函数.再次,结合有界估计法和光滑函数有效补偿执行器故障和网络引起的误差.基于Lyapunov稳定性理论证明闭环系统半全局有界稳定.最后,通过仿真验证所设计控制策略的有效性.
关键词 多智能体系统; 状态时延; 事件触发控制; 非对称误差约束; 执行器故障; multi-agent systems; state time-delays; event-triggered control; asymmetric error constraints; actuator faults;

控制 非线性系统与控制 论文 Website Google Scholar

非线性多输入多输出连续时间系统基于历史采样数据的不确定性因素补偿控制

Sampled-data-based uncertainty compensation control for a class of continuous-time nonlinear MIMO systems

姚慧颖, 赵志良, 陈森, 柴天佑
中国科学: 信息科学, 2022, 52(3): 483-505
摘要 本文针对一类具有强耦合不确定性因素的连续时间多输入多输出非线性系统,提出了基于历史采样数据的不确定性因素补偿控制策略(sampled-data-based compensation control, SDBCC).与基于观测器的不确定性因素补偿控制不同,本文首先利用当前以及历史采样数据计算出由系统非线性耦合未建模动态和外部扰动构成的总扰动在前一采样周期内某时刻的精确值,然后利用该精确值在反馈环节对总扰动进行补偿以消除它的不利影响.连续时间系统在数据驱动的反馈控制作用下构成了一个混杂闭环控制系统,这连同系统的强耦合非线性不确定性因素为控制闭环系统的稳定性收敛性分析带来了挑战.为克服这一难题,本文发展了基于特征值和迭代序列的分析方法,证明了当系统跟踪目标为有界函数时,跟踪误差可随采样周期的减小而任意小,进而当跟踪目标为常数,并且系统的非线性项为时不变连续可微函数时,跟踪误差随时间趋于无穷大而趋近于零.二自由度无人机姿态控制的仿真结果验证了本文所提出方法的有效性和优越性.
关键词 不确定性; 非线性; MIMO系统; PID控制; 数据驱动控制; uncertainty; nonlinearity; MIMO system; PID control; data-driven control;

控制 非线性系统与控制 论文 Website Google Scholar

虚拟未建模动态补偿与数据驱动的非线性广义预测控制

Virtual unmodeled dynamic compensation and data-driven nonlinear generalized predictive control

张亚军, 牛宏, 陶金梅, 李旭生
中国科学: 信息科学, 2021, 51(7): 1146-1155
摘要 针对一类离散时间非线性动态系统,把常规广义预测控制与数据驱动控制相结合、反馈控制与前馈补偿相结合、信号补偿与调节器原理相结合,提出了一种数据与虚拟未建模动态及其增量补偿的非线性广义预测控制方法.推导了闭环系统的输入输出动态方程,并分析了所提控制算法的性能.对比实验的研究体现出本文所提控制算法的优越性和有效性.
关键词 调节器, 数据, 虚拟未建模动态, 数据驱动, 广义预测控制

控制 非线性系统与控制 论文 Website Google Scholar

多约束纯反馈非线性系统鲁棒自适应抗干扰控制

Adaptive robust anti-disturbance control for pure feedback nonlinear systems with multiple constraints

陈龙胜, 杨辉
中国科学: 信息科学, 2021, 51(4): 633-647
摘要 针对一类具有未知干扰和多约束的不确定纯反馈非线性系统,提出一种基于干扰观测器的鲁棒自适应抗干扰控制方案.该方法首先基于Butterworth低通滤波器和径向基神经网络设计非线性干扰观测器以实现对系统未知非线性函数和复合扰动的在线精确逼近,并消除"代数环"问题.其次,为确保系统在状态受限、预设性能和输入饱和等多重约束的综合影响下能够对期望轨迹进行稳定跟踪,构造了一种新型的障碍Lyapunov函数,结合辅助有界函数、Nussbaum函数和一阶滑模微分器设计Backstepping控制器,并通过Lyapunov稳定理论分析闭环系统稳定性.最后,仿真结果验证了所提控制方法的有效性.
关键词 径向基神经网络; 非线性干扰观测器; 障碍Lyapunov函数; 多约束; 纯反馈非线性系统; radial basis function neural network; nonlinear disturbance observers; barrier Lyapunov function; multiple constraints; pure feedback nonlinear systems;

控制 非线性系统与控制 论文 Website Google Scholar

输入死区下的多输入多输出系统自适应神经网络容错控制

Adaptive neural network fault-tolerant control for MIMO systems with dead zone inputs

周琪, 林国怀, 马慧, 鲁仁全
中国科学: 信息科学, 2021, 51(4): 618-632
摘要 针对一类具有传感器故障和不对称输入死区的非线性多输入多输出非严格反馈系统,本文提出一种自适应神经网络容错控制方案.控制器的设计以反步法为框架,采用自适应神经网络控制方法处理传感器故障,利用死区斜率的有界性补偿输入死区对系统性能造成的影响,同时引入动态面控制技术克服"计算爆炸"的问题.该控制方法不仅能够保证闭环系统中所有信号半全局一致最终有界,而且能使跟踪误差收敛至原点附近的紧集内.最后通过两个仿真实验验证该控制方法的有效性.
关键词 非线性系统; 传感器故障; 容错控制; 动态面控制; 输入死区; nonlinear systems; sensor faults; fault-tolerant control; dynamic surface control; dead zone inputs;

控制 其他 编者按 Website Google Scholar

非完全信息下人机合作对抗博弈专题

编者按

康宇, 段海滨, 赵云波
中国科学: 信息科学, 2022, 52(12): 2163-2164

控制 机器人与无人系统 论文 Website Google Scholar

基于弹性分析与函数回归模型的示教轨迹学习与泛化方法

Learning and generalizing demonstration trajectories based on elastic analysis and the functional regression model

肖宏远, 刘成菊, 陈启军
中国科学: 信息科学, 2022, 52(10): 1822-1836
摘要 示教学习是解决仿人机器人动态轨迹规划问题的高效方法.示教轨迹作为一种函数型数据,天然地具有耦合的时空特征,需要在函数型数据分析的理论框架下进行研究.传统的示教学习成果以“预处理”的形式解决上述耦合问题,不能充分利用示教轨迹的函数型数据本质.为了充分利用这一本质,本文采用弹性分析方法,将示教轨迹视作函数型数据,解决它们的时–空特征解耦问题.基于解耦后的示教轨迹,本文建立函数型回归模型并将其应用于动态轨迹的生成,实现示教轨迹在不同任务参数下的泛化.在实验中, JACO-2机械臂学习形态各异的技能并在不同的任务参数下完成任务,验证了提出方法的有效性.本文在统一的数学框架下,基于函数型数据分析的数学方法,解决一类仿人机器人的示教轨迹学习与泛化问题,具有较好的理论统一性与可实践性.
关键词 示教学习; 轨迹生成; 函数型数据; 弹性分析; 函数回归模型; learning from demonstration; trajectory generation; functional data; elastic analysis; functional regression model;

控制 机器人与无人系统 论文 Website Google Scholar

面向特殊应用场景的无人机智能决策与控制专刊

仿猎鹰扑翼飞行器自主飞行控制系统设计

Design of an autonomous flight control system for imitation falcon flapping-wing aircraft

孙永斌, 马宝忠, 贺威, 何修宇, 付强
中国科学: 信息科学, 2022, 52(9): 1656-1671
摘要 仿生扑翼飞行器作为一种新型的飞行器,具有噪声小、隐蔽性好、机动性强、能量利用效率高等优势,在民用和军用领域具有广阔的应用前景.仿生扑翼飞行器的自主飞行能力是高效执行飞行任务的关键.目前,国内外飞行器的自主飞行研究已经取得了一些成果,然而鲜有以仿生扑翼飞行器为载体的研究.仿生扑翼飞行器特有的驱动结构给自主飞行控制研究带来了较大的挑战.本文以仿猎鹰扑翼飞行器作为研究平台设计了自主飞行控制系统.由于仿猎鹰扑翼飞行器的负载较小,本文采用了重量较轻的STM32微型计算平台作为主控芯片设计了硬件系统.由于微型计算平台的算力有限,本文综合考虑制导精度和运算速度,提出了一种线性/非线性切换制导算法,并通过仿真实验与线性制导、非线性制导算法进行了对比,证明了其更加适合于仿猎鹰扑翼飞行器.考虑到仿猎鹰扑翼飞行器的机构滞后问题,对其滚转角和高度设计了一个串级PID控制器.结合面向仿猎鹰扑翼飞行器的地面站软件,最终实现了基于仿猎鹰扑翼飞行器的自主定高圆弧轨迹跟踪任务.
关键词 仿生扑翼飞行器; 自主飞行; 线性制导; 非线性制导; 轨迹跟踪; bionic flapping-wing aircraft; autonomous flight; linear guidance; nonlinear guidance; trajectory tracking;

控制 机器人与无人系统 论文 Website Google Scholar

面向特殊应用场景的无人机智能决策与控制专刊

基于随机采样的高层消防无人机协同搜索规划

Random-sampling-based multi-UAV cooperative search planning for high-rise firefighting

李鸿一, 陈锦涛, 任鸿儒, 鲁仁全
中国科学: 信息科学, 2022, 52(9): 1610-1626
摘要 本文面向高层消防救援提出一种基于随机采样的多无人机协同搜索规划方法.首先,受随机树状采样搜索算法启发,提出一种搜索点最优分布方法,利用其在复杂环境下对有限空间重复搜索的特性,同时解决多无人机的路径点分布问题和任务分配问题.其次,设计一种基于交易规则的搜索点优化方法,以进一步提升搜索覆盖范围.然后,利用改进的和声搜索算法得到每架无人机遍历节点的最优顺序,进而获得各无人机的规划路径.最后,采用多线程方法模拟实际任务中的分布式运算,验证所提出方法的可行性.
关键词 高层消防; 随机采样; 和声搜索算法; 多无人机协同; 路径规划; high-rise firefighting; random sampling; harmony search; multi-UAV cooperation; path planning;

控制 机器人与无人系统 评述 Website Google Scholar

面向特殊应用场景的无人机智能决策与控制专刊

无人机污染源自主搜寻算法综述

Review of UAV-based autonomous search algorithms for hazardous sources

李中国, 陈文华, 刘存佳
中国科学: 信息科学, 2022, 52(9): 1579-1597
摘要 自主搜寻在环境保护、灾后搜救和工业监控等方面有重要作用.无人机传感平台凭借其灵活的机动性成为实现自主搜寻的有效途径之一.针对自主搜寻中两个关键任务,即污染源定位和污染边界跟踪,本文分别梳理了相关算法体系,并揭示了其设计思想的本质.对于污染物溯源,控制驱动和信息驱动两类算法是目前的研究主流,但两者的结合却鲜有报道.在边界跟踪方面,本文从单平台和多平台协作两方面总结了现有文献的控制和估计方法.根据双重控制思想,本文分析了相关算法的设计思路,并展望了下一步的研究重点.
关键词 自主搜寻; 无人机; 污染源搜寻; 边界跟踪; 双重控制; 探索与利用; autonomous search; UAV; source seeking; boundary tracking; dual control; exploration and exploitation;

控制 机器人与无人系统 论文 Website Google Scholar

考虑状态约束的五自由度塔式吊车多目标最优轨迹规划

Multi-objective trajectory planning for 5-DOF underactuated tower cranes with state constraints

刘卓清, 孙宁, 吴易鸣, 杨桐, 梁潇, 方勇纯
中国科学: 信息科学, 2022, 52(3): 521-538
摘要 为了提高塔式吊车的实际工作效率,往往需要在驱动旋臂和台车的同时改变绳长,以同步实现负载的运输与起落吊运.然而,目前针对变绳长塔式吊车控制问题的研究非常有限,依然处于起步阶段.对于变绳长塔式吊车而言,如何在保证系统良好暂态性能的基础上,减少运输时间、降低系统能耗,并同时实现综合最优是一个亟待解决的实际问题.为此,本文提出了一种考虑状态约束的五自由度塔式吊车多目标最优轨迹规划方法,首次实现了运输时间和系统能耗的Pareto最优,并可从理论上保证状态变量及其对应速度满足物理约束.具体而言,本文通过微分平坦输出信号构造和B样条曲线设计,实现了目标轨迹的定位和防摆性能,并利用改进的非支配近邻免疫算法(nondominated neighbor immune algorithm, NNIA)解决了多目标优化问题.最后,通过多组实际实验验证了所提方法的有效性.
关键词 塔式吊车; 欠驱动系统; 多目标优化; 轨迹规划; 摆动抑制; tower cranes; underactuated systems; multi-objective optimization; trajectory planning; swing suppression;

控制 机器人与无人系统 评述 Website Google Scholar

面向高危行业的无人平台智能化发展

On the intelligent development of unmanned platforms in high-risk industries

陈杰, 方浩, 曾宪琳
中国科学: 信息科学, 2021, 51(9): 1397-1410
摘要 在人工智能与"新基建"推动的技术变革背景下,面向灾害救援、突发公共事件、应急处理等高危行业,推进无人平台的智能化升级,对保障人民的健康安全,提升国家应急和治理能力具有重要的意义.本文对面向反恐、救灾、应急等高危行业的无人平台智能化发展的特点和现状进行分析,对基础理论、关键技术、重大装备和人才培养等4个方面的国内外现状和发展趋势进行总结,结合我国面向高危行业的无人平台智能化发展的现状、需求和不足,提出未来基础理论、关键技术、重大装备、人才培养等方面需要攻克和解决的挑战和问题,提出面向高危行业的无人平台智能化发展的战略规划与顶层设计的建议.
关键词 高危行业; 无人平台; 智能化发展; 人工智能; 对策建议; high-risk industry; unmanned platform; intelligent development; artificial intelligence; strategy and suggestion;

控制 机器人与无人系统 论文 Website Google Scholar

基于变分贝叶斯高斯混合噪声模型的机器人跨模态生成对抗网络

Robotic cross-modal generative adversarial network based on variational Bayesian Gaussian mixture noise model

熊鹏文, 童小宝, 宋爱国, 刘小平
中国科学: 信息科学, 2021, 51(1): 104-121
摘要 多模态融合对于机械手充分感知外界环境至关重要,单一模态信息会限制机械手对物体的识别、抓取能力,而传统的跨模态数据生成方法生成的图像效果较差,导致多模态融合效果并不理想.为了解决跨模态生成的图像效果差和多模态融合的数据缺乏等问题,本文提出变分贝叶斯高斯混合条件生成对抗网络(BGM-CGAN)的跨模态多样性噪声数据生成式方法.首先利用变分贝叶斯高斯混合算法将均匀分布的随机噪声组生成单一的混合变量;然后将生成的混合变量通过高斯混合模型生成一系列高斯混合噪声组;最后从生成的高斯混合噪声组中随机选取单一高斯噪声导入辅助模态图像中,并与辅助模态图像进行融合,成功生成了高清晰度的异域模态图像,真实还原了异构模态信息,解决了单一模态信息不足和生成图像质量差等问题.最后利用Inception Score (IS)、Frechet Inception Distance(FID)、结构相似性(SSIM)、峰值信噪比(PSNR)等评价体系,将BGM-CGAN算法与其他算法的跨模态生成图像能力进行对比,验证了所提出算法的有效性和可行性.此外, BGM-CGAN算法还可延伸应用于跨模态材料检索、跨模态纹理识别等领域,具有广泛应用前景.
关键词 跨模态; 变分贝叶斯高斯混合; 条件生成对抗网络; cross-modal; variational Bayesian Gaussian mixture; conditional generative adversarial networks;

控制 鲁棒控制与自适应控制 论文 Website Google Scholar

面向特殊应用场景的无人机智能决策与控制专刊

基于安全自适应强化学习的自主避障控制方法

Autonomous obstacle avoidance control method based on safe adaptive reinforcement learning

王珂, 穆朝絮, 蔡光斌, 汪韧, 孙长银
中国科学: 信息科学, 2022, 52(9): 1672-1686
摘要 障碍规避是无人机等自主无人系统运动规划的重要环节,其核心是设计有效的避障控制方法.为了进一步提高决策优化性和控制效果,本文在最优控制的设定下,提出一种基于强化学习的自主避障控制方法,以自适应方式在线生成安全运行轨迹.首先,利用障碍函数法在代价函数中设计了一个光滑的奖惩函数,从而将避障问题转换为一个无约束的最优控制问题.然后,利用行为–评价神经网络和策略迭代法实现了自适应强化学习,其中评价网络利用状态跟随核函数逼近代价函数,行为网络给出近似最优的控制策略;同时,通过状态外推法获得模拟经验,使得评价网络能利用经验回放实现可靠的局部探索.最后,在简化的无人机系统和非线性数值系统上进行了仿真实验与方法对比,结果表明,提出的避障控制方法能实时生成较优的安全运行轨迹.
关键词 自主无人系统; 避障控制; 强化学习; 神经网络; 经验回放; autonomous unmanned systems; obstacle avoidance control; reinforcement learning; neural networks; experience replay;

控制 鲁棒控制与自适应控制 论文 Website Google Scholar

线性二次二人Stackelberg博弈均衡点求解: 一种Q学习方法

Seeking equilibrium for linear-quadratic two-player Stackelberg game: a Q-learning approach

李曼, 秦家虎, 王龙
中国科学: 信息科学, 2022, 52(6): 1083-1097
摘要 近年来, Stackelberg博弈被广泛用于解决信息物理系统安全控制、智能电网能源管理等问题.已有的Stackelberg均衡点求解方法大多需要已知系统模型信息,而在实际应用中模型信息通常难以精确获取,这在一定程度上限制了相关理论研究成果的应用.鉴于此,本文研究了不基于系统模型的Stackelberg博弈均衡点的求解方法.具体地,本文考虑线性二次二人Stackelberg博弈,其中博弈状态演化满足线性方程,且成本函数为二次形式.博弈的两个参与者为能够预测另一个体可能响应的个体(即领导者),和根据领导者策略作出最优响应的个体(即跟随者).因为本文考虑线性形式的状态演化和二次形式的成本函数,且领导者先于跟随者采取行动,故领导者和跟随者的决策问题可建模为两层的线性二次型最优控制问题.本文按照从跟随者到领导者的原则,基于动态规划原理推导出最优控制策略.该策略被证明恰好为Stackelberg均衡策略,但其计算需使用系统模型信息.基于此策略,本文提出一种基于执行器–评价器(actor-critic)结构的Q学习算法,解决了系统动力学模型未知情况下线性二次二人Stackelberg博弈均衡点求解问题.此外,本文理论证明了所提算法能够保证系统状态、执行网络和评价网络权重估计误差一致最终有界,并通过数值仿真实验说明基于Q学习算法所得控制策略能够使系统状态稳定,且估计控制策略下的成本函数偏离均衡策略下的成本函数的幅度较小.
关键词 线性二次二人Stackelberg博弈; 最优控制; 模型未知; 执行器–评价器结构; Q学习; linear-quadratic two-player Stackelberg game; optimal control; model-free; actor-critic structure; Q-learning;

控制 鲁棒控制与自适应控制 论文 Website Google Scholar

多输入多输出非线性系统的受限滑模控制

Constrained sliding mode control of MIMO nonlinear systems

吴立刚, 王思怡, 高亚斌, 刘健行, 孙光辉
中国科学: 信息科学, 2021, 51(3): 430-448
摘要 本文针对一类具有执行器和状态约束的多输入多输出非线性系统,研究了基于高阶滑模观测器的滑模控制和稳定性分析问题.通过对该系统进行逆变换并考虑其控制输入系数矩阵的对合跨度分布,我们设计了一类高阶滑模观测器用于实现系统的状态估计,其中,采用鲁棒精确微分器分析了所得误差估计系统的收敛性.然后,利用原系统的部分状态变量设计了二阶滑模控制律,进而分别分析了在执行器/状态无约束和硬约束情形下的系统有限时间稳定性,同时,依据最大吸引域和几何分析法分析了系统状态在滑模阶段的运动轨迹.最后,通过两个仿真算例验证了本文所提出的控制方法的有效性.
关键词 滑模控制; 约束系统; 多输入多输出系统; 吸引域; 几何分析; sliding mode control; constrained system; MIMO system; attraction domain; geometric analysis;

控制 随机系统与控制 刊讯 Website Google Scholar

随机系统控制与分析专题简介

解学军, Hiroaki MUKAIDANI, 张维海
中国科学: 信息科学, 2021, 51(10): 1775-1776
关键词 随机系统; 线性参数变化系统; 控制与分析;