面向多源自主导航的智能学习方法研究
王巍, 陈巍, 孟凡琛
中国科学: 信息科学, 2024, 54(12): 2778-2793
摘要 智能多源自主导航系统以北斗导航为基石、以惯性导航为支撑,旨在提供高度智能化的定位导航与授时服务,通过实现即插即入、无缝衔接、无感切换、可信完备等功能,以满足复杂多变的场景需求.采用以深度学习、强化学习为代表的智能学习方法,从复杂性与多尺度视角出发,探索智能多源自主导航中的优化与协同理论,建立以精准稳定、可信安全、可泛化、可解释、内嵌动力学机理为关键要素的智能学习方法,推动构建弹性、健壮、动态、可控与可信的精准智能多源自主导航模型与方法体系,从而有力支撑国家综合定位导航与授时体系的创新发展和先进导航技术的规模化应用.
关键词 智能多源自主导航; 内嵌动力学机理; 可泛化; 可解释; 可信性; 完备性; intelligent multi-source autonomous navigation; embedded system dynamics; generalizability; interpretability; dependability; completeness
Wei WANG, Wei CHEN, Fanchen MENG. Study on intelligent learning methods for multi-source autonomous navigation. Sci Sin Inform, 2024, 54(12): 2778-2793, doi: 10.1360/SSI-2024-0192
具有输出边界保护的飞行器姿态控制律设计
杨庶, 杨婷, 王欣然
中国科学: 信息科学, 2024, 54(10): 2470-2486
摘要 针对飞行器姿态控制问题,综合反步法和自适应控制理论设计了飞行器姿态控制律,采用高通滤波器估计控制律中所需的控制信号时间导数,解决了常规反步法存在的需要解析或数值求导的问题.基于投影算子方法设计了输出边界保护控制律,使飞行器输出响应不超过由超椭圆曲线定义的控制边界,在多变量控制下使控制边界匹配实际边界.根据Lyapunov稳定性理论证明了完整控制律的闭环稳定性,解决了高通滤波器与闭环系统稳定性的耦合问题.通过数值仿真检验了姿态控制律的控制性能,仿真结果表明飞行器闭环系统具有良好的俯仰角指令跟踪和协调转弯指令跟踪性能,并实现了迎角和侧滑角的输出边界保护.
关键词 姿态控制; 输出边界保护; 反步法控制; 自适应控制; 投影算子; attitude control; output boundary protection; backstepping control; adaptive control; projection operator
Shu YANG, Ting YANG, Xinran WANG. Attitude control law design for a flight vehicle with output boundary protections. Sci Sin Inform, 2024, 54(10): 2470-2486, doi: 10.1360/SSI-2024-0141
高超声速飞行器鲁棒自适应控制专题
高超声速滑翔飞行器预定时间碰撞规避编队控制
王婕, 王鼎华, 王婷, 户艳鹏
中国科学: 信息科学, 2024, 54(10): 2326-2342
摘要 针对高超声速滑翔飞行器的编队控制问题,提出了基于预定时间稳定性理论的控制策略.首先,建立高超声速滑翔飞行器六自由度制导控制一体化模型,基于反演结构对模型进行简化处理,在此基础上,设计预定时间控制律,实现期望队形形成及编队保持;其次,利用人工势场理论,设计避碰/规避势场函数项,避免高超声速滑翔飞行器与其邻机之间的碰撞,并实现对威胁区的规避;再次,基于Lyapunov稳定理论对高声速滑翔飞行器在预定时间内的编队稳定性进行严格证明;最后,通过Matlab/Simulink进行仿真,仿真结果验证了本文所提的控制策略能够实现预定时间内高超声速滑翔飞行器的编队队形生成保持及碰撞规避.
关键词 高超声速滑翔飞行器; 预定时间控制; 人工势场算法; 编队控制; 制导控制一体化; hypersonic glide vehicle; predefined time control; artificial potential field method; formation control; integrated guidance and control
Jie WANG, Dinghua WANG, Ting WANG, et al. Collision avoidance and formation control of hypersonic glide vehicles within predefined time. Sci Sin Inform, 2024, 54(10): 2326-2342, doi: 10.1360/SSI-2024-0128
高超声速飞行器鲁棒自适应控制专题
高超声速飞行器主被动复合一体化容错控制方法
周大鹏, 富佳伟, 杨大鹏
中国科学: 信息科学, 2024, 54(10): 2295-2307
摘要 针对高超声速飞行环境力热载荷严酷,执行机构易发生脆化、热损伤、缺损等故障,进而导致姿态控制精度下降甚至失稳等问题,本文提出了主被动复合故障容错控制方法.该方法在舵面缺失故障发生初期,采用滑模控制策略满足鲁棒增稳控制需求,同时,采用在线气动辨识方法,估计故障引起的气动参数变化,在满足瞬时增稳需求后,结合气动参数辨识结果与飞发一体化自适应控制进行控制重构,提升故障后高超声速飞行器飞发一体化控制品质.通过数学仿真对比验证表明该方法的有效性,验证了该方法相对于单一容错控制策略具有更强的鲁棒性和更好的控制性能.
关键词 高超声速飞行器; 舵面缺失故障; 容错控制; 气动参数辨识; 飞发一体化; hypersonic vehicle; missing elevator failure; fault-tolerant control; aerodynamic parameter identification; integrated flight/propulsion
Dapeng ZHOU, Jiawei FU, Dapeng YANG. Fault-tolerant control method for airbreathing hypersonic vehicles based on an activepassive composite approach. Sci Sin Inform, 2024, 54(10): 2295-2307, doi: 10.1360/SSI-2023-0322
引入反事实基线的无人机集群对抗博弈方法
王尔申, 陈纪浩, 宏晨, 刘帆, 陈艾东, 景竑元
中国科学: 信息科学, 2024, 54(7): 1775-1792
摘要 无人机在协同对抗博弈上的应用越来越广泛和深入,尤其是无人机集群在协同探测、全域对抗、策略骗扰等对抗任务中,发挥着越来越重要作用,可靠高效的无人机集群博弈方法是当前的研究热点.本文将反事实基线思想引入到无人机集群对抗博弈环境,提出一种基于反事实多智能体策略梯度(counterfactual multi-agent policy gradients, COMA)的无人机集群对抗博弈方法;在具有无限连续状态、动作的无人机对抗环境中,基于无人机动力学模型,设置符合实际环境的击敌条件和奖励函数,构建基于多智能体深度强化学习的无人机集群对抗博弈模型.红蓝双方无人机集群采取不同的对抗博弈方法,利用多智能体粒子群环境(multi-agent particle environment, MPE)对红蓝双方无人机集群进行非对称性对抗实验,实验结果表明平均累积奖励能够收敛到纳什均衡,在解决4 vs. 8的对抗决策问题方面, COMA方法的平均命中率较DQN和MADDPG分别提升39%和17%,在平均胜率方面比DQN和MADDPG分别提升34%和17%.最后,通过对COMA方法的收敛性和稳定性的深入分析,保证了COMA方法在无人机集群对抗博弈任务上的实用性和鲁棒性.
关键词 无人机集群; 对抗博弈; 多智能体; 深度强化学习; 纳什均衡; UAV swarm; confrontation game; multi-agent; deep reinforcement learning; Nash equilibrium
Ershen WANG, Jihao CHEN, Chen HONG, et al. UAV swarm adversarial game method with a counterfactual baseline. Sci Sin Inform, 2024, 54(7): 1775-1792, doi: 10.1360/SSI-2023-0305
一种基于透射不变性原理的高机动编队控制方法
王常虹, 陈济泽
中国科学: 信息科学, 2023, 53(10): 1965-1981
摘要 本文给出了一种具有高机动性的透射编队控制方法,解决了经典的仿射编队控制受限于平行关系的常约束,无法直接实现战术攻防上常用的前后三角、前后梯形等队形的快速切换问题.该方法受启发于框架理论中的透射不变性原理,通过引入透射像和自应力矩阵来对编队构型进行定义,实现了在仅增加一个领航者且队形凹凸性不变的前提下,任意目标队形的保共线和交比的一致性跟踪,提高了队形的可操作性.所推导的透射可定位条件和队形连续变换条件为透射编队控制的应用提供了理论依据.此外,在攻防切换任务和联合切换任务两种情景下的仿真测试结果也进一步证明了该编队控制方法的可靠性.
关键词 透射变换; 编队控制; 战术任务; 多智能体系统; 自应力矩阵; projective transformation; formation control; tactical tasks; multiagent systems; self-stress matrix
Changhong WANG, Jize CHEN. A high-mobility formation control method based on the principle of projective invariance. Sci Sin Inform, 2023, 53(10): 1965-1981, doi: 10.1360/SSI-2022-0409
非完全信息下人机合作对抗博弈专题
障碍环境下基于生物捕食逃逸行为的多运动体边界防御博弈方法
仝秉达, 段海滨, 夏洁, 刘小峰
中国科学: 信息科学, 2022, 52(12): 2213-2224
摘要 基于微分对策的追逃博弈和疆土防御问题是多智能体对抗博弈控制的关键问题之一.本文研究了含障碍物的有界区域中多运动体边界防御博弈方法.首先通过对自然界中生物的捕食逃逸行为进行分析,对多运动体边界防御博弈系统进行了建模,得到不同情况下博弈终止条件和价值函数.其次,本文对含障碍环境下博弈双方的主导区域和界栅面进行了分析,并与无障碍情况进行了对比.最后,数值仿真验证了本文提出的多运动体边界防御方法满足微分对策中的鞍点策略条件和有效性.
关键词 捕食逃逸; 协同控制; 边界防御; 微分对策; 鞍点策略; predation and escape; cooperative control; border defense; differential games; saddle point strategy;
Bingda TONG, Haibin DUAN, Jie XIA, et al. Multi-agent border defense differential game based on biological predation and escape behavior in an obstacle environment. Sci Sin Inform, 2022, 52(12): 2213-2224, doi: 10.1360/SSI-2022-0211
面向特殊应用场景的无人机智能决策与控制专刊
基于干扰区间观测器的无人机预设性能着舰飞行控制
胡伟, 雍可南, 陈谋
中国科学: 信息科学, 2022, 52(9): 1711-1726
摘要 无人机在现代战争中已发挥重要作用,为夺取海域制空权,航母配备无人机是必然趋势.面向无人机着舰的高精度控制要求,本文针对存在建模误差与外部干扰的无人机,在动态面控制框架下提出一种基于干扰区间观测器的无人机预设性能着舰飞行控制策略.该策略能够对未知项提供区间估计,在前馈补偿未知项的同时,控制律将根据区间估计的宽度动态调节控制器增益,从而保证无人机的轨迹始终处在着舰轨迹约束范围内.同时,在干扰区间观测器与飞行控制律设计过程中,引入非线性增益,有效地处理了着舰机动中的状态非线性耦合.最后,基于Lyapunov函数方法与不变集理论,给出着舰飞行控制策略的参数设计条件,数值仿真也进一步表明该策略的有效性.
关键词 无人机; 着舰控制; 预设性能控制; 干扰观测器; 区间观测器; unmanned aerial vehicle; carrier landing control; prescribed performance-based control; disturbance observer; interval observer;
Wei HU, Kenan YONG, Mou CHEN. Disturbance interval observer-based carrier landing control of unmanned aerial vehicles using prescribed performance. Sci Sin Inform, 2022, 52(9): 1711-1726, doi: 10.1360/SSI-2022-0051
面向特殊应用场景的无人机智能决策与控制专刊
面向宽域飞行的组合动力空天飞行器切换控制
程怡新, 许斌, 洪锐
中国科学: 信息科学, 2022, 52(9): 1687-1710
摘要 针对组合动力空天飞行器宽域爬升过程存在的模态转换、气动参数未知以及外界时变干扰等问题,研究了一种基于飞行包线模态划分的切换控制方案.对飞行器六自由度模型和发动机推力模型进行气动和推力特性分析,给出了模态划分结果和模态转换过渡过程.基于切换信号设计建立了空天飞行器切换系统,设计终端滑模软切换控制策略来保证模态的平稳转换,并利用神经网络和非线性扰动观测器协同处理系统不确定性和外界时变干扰.通过多Lyapunov函数方法对闭环切换系统的稳定性进行了分析,且仿真结果验证了所提方法的有效性.
关键词 空天飞行器; 组合动力; 模态转换; 切换控制; 鲁棒自适应控制; aerospace vehicle; combined power; modal transition; switching control; robust adaptive control;
Yixin CHENG, Bin XU, Rui HONG. Switching control of combined power aerospace vehicles for wide-area flight. Sci Sin Inform, 2022, 52(9): 1687-1710, doi: 10.1360/SSI-2022-0055
面向特殊应用场景的无人机智能决策与控制专刊
基于动态目标概率分布的核电站无人机航路强化学习规划
周同乐, 陈谋
中国科学: 信息科学, 2022, 52(9): 1642-1655
摘要 针对核电站空中动态入侵目标,本文提出了一种基于动态目标概率分布的无人机航路强化学习规划算法,实现了对空中入侵目标的有效拦截.根据入侵目标的状态信息基于概率扩散原理计算目标的概率分布,推理目标可能出现的位置.在此基础上,设计了基于航路点转移规则的行动空间和基于目标概率分布的报酬函数动态更新机制,通过Q-学习不断优化路径,构建了基于目标概率分布和强化学习的无人机航路规划框架,实现了无人机航路强化学习规划.仿真结果表明,该方法能够针对核电站空中入侵目标,实现目标点变化情况下无人机的自主航路规划.
关键词 无人机; 核电站; 航路规划; 动态目标概率分布; 强化学习; UAV; nuclear power plant; path planning; dynamic target probability distribution; reinforcement learning;
Tongle ZHOU, Mou CHEN. Path reinforcement learning planning of nuclear power plant UAVs based on dynamic target probability distribution. Sci Sin Inform, 2022, 52(9): 1642-1655, doi: 10.1360/SSI-2022-0050
面向特殊应用场景的无人机智能决策与控制专刊
面向复杂未知多障碍环境的多无人机分布式在线轨迹规划
张学伟, 田栢苓, 鲁瀚辰, 谌宏鸣, 宗群
中国科学: 信息科学, 2022, 52(9): 1627-1641
摘要 考虑复杂未知多障碍环境对无人机实时轨迹规划性能的影响,提出了基于Tube-MPC和模型预测路径积分(model predictive path integral, MPPI)控制相结合的多无人机分布式实时轨迹规划框架与方法.首先,考虑无人机在多障碍环境下的避碰避障需求,构造代价函数表征轨迹规划过程中的约束条件,将多无人机的轨迹规划问题转化为随机最优控制问题.其次,借鉴Tube-MPC思想,设计并实现了多无人机分布式轨迹规划框架,通过将低频标称控制器与高频辅助控制器串联保证了系统的实时性和鲁棒性.再次,为避免传统方法在求解过程中的维数灾难,提出基于MPPI的多无人机异步轨迹规划方法,该方法通过基于GPU的并行蒙特卡洛(Monte-Carlo)随机前向采样技术,将多无人机随机最优控制问题的求解转化为给定代价函数下对采样轨迹期望的求解,进而获得最优控制序列,其显著特点是求解速度快且避免了基于梯度求解方法对约束条件和代价函数连续性及凸特性的要求.最后,通过Gazebo虚拟仿真平台,在复杂未知多障碍环境下对算法的有效性进行了验证.
关键词 未知多障碍环境; 多无人机; 在线轨迹规划; 模型预测路径积分; GPU并行加速; unknown obstacle-rich environment; multi-UAV; online trajectory planning; model predictive path integral; GPU parallel acceleration;
Xuewei ZHANG, Bailing TIAN, Hanchen LU, et al. Multi-UAV decentralized online trajectory planning in complex unknown obstacle-rich environments. Sci Sin Inform, 2022, 52(9): 1627-1641, doi: 10.1360/SSI-2022-0048
面向特殊应用场景的无人机智能决策与控制专刊
基于合作竞争公共物品博弈的无人机集群动态资源分配
王浩淼, 段海滨, 魏晨
中国科学: 信息科学, 2022, 52(9): 1598-1609
摘要 无人机集群动态资源分配是其任务规划的挑战性关键技术难题.本文提出了一种基于合作竞争机制的动态资源分配方法,将无人机集群与网络进化博弈模型进行对应,建立了基于无人机拓扑网络的博弈模型,通过设计针对特殊个体的调控规则,达到提升系统平均收益的目的.最后,通过无人机博弈模型的仿真实验,根据网络结构、模型参数,以及不同激发机制下系统的稳态结果,验证了本文所提无人机动态资源分配方法的可行性和有效性.
关键词 无人机集群; 公共物品博弈; 动态资源分配; 合作机制; 竞争机制; UAV swarm; public goods game; dynamic resource allocation; cooperative mechanism; competition mechanism;
Haomiao WANG, Haibin DUAN, Chen WEI. Dynamic resource allocation of UAV swarms based on cooperative and competitive public goods game. Sci Sin Inform, 2022, 52(9): 1598-1609, doi: 10.1360/SSI-2021-0416
推力矢量极性错误下的飞行控制自主重构技术
潘豪, 胡瑞光, 宋征宇, 邵梦晗
中国科学: 信息科学, 2022, 52(5): 870-889
摘要 飞行故障在线自主辨识与控制重构是实现航天智能飞行的一个重要标志.本文针对运载火箭飞行中的推力矢量极性错误,研究了基于人工神经网络的故障识别与自主重构方法.在明确故障模式基础上,结合扩张状态观测器(extended state observer, ESO)观测结果,提出了考虑模型偏差的仿真训练样本设计方法,并分别采用基于反向传播(back propagation, BP)神经网络和长短时记忆(long short term memory, LSTM)网络方法进行了故障辨识设计,仿真结果表明,两种方法均具有较高识别准确度,均可实现推力矢量极性错误下的平稳自主重构,相比而言,基于滑窗时间序列的LSTM网络方法更具优势,具有较高的识别准确度.
关键词 极性错误; 自主重构; 扩张状态观测器; 反向传播; 长短时记忆; polarity errors; autonomous reconstruction; extended state observer(ESO); back propagation(BP); long short term memory(LSTM);
Hao PAN, Ruiguang HU, Zhengyu SONG, et al. Autonomous reconfiguration of flight control under thrust vector polarity errors. Sci Sin Inform, 2022, 52(5): 870-889, doi: 10.1360/SSI-2021-0305
角速度受限下航天器姿态机动事件触发控制
石永霞, 胡庆雷, 邵小东
中国科学: 信息科学, 2022, 52(3): 506-520
摘要 针对角速度受限和通信资源有限的航天器姿态系统,考虑转动惯量难以精确获得并且存在外部干扰的情况,提出一种基于神经网络的自适应事件触发姿态机动控制算法.该算法首先基于预设性能技术,将角速度受限约束转换为性能边界约束,进一步通过误差转换,建立姿态系统的等效误差模型,将存在角速度约束的航天器姿态系统机动控制问题巧妙地转化为无约束误差系统的状态有界稳定控制问题;然后,选用径向基神经网络设计自适应律,在线逼近系统中由未知转动惯量带来的不确定性项.与此同时,考虑到星载通信资源有限的问题,通过建立触发控制信号与实时控制信号之间的显式关系,设计一个统一的时变事件触发机制,当触发条件满足时同步更新控制器和自适应律,大大减少了控制器和执行器之间频繁的网络信号传输.此外,触发机制中时变项的引入严格保证了触发控制无Zeno现象发生.最后,仿真结果表明了所提出的姿态控制算法不但能够保证航天器高精度、高稳定度、高鲁棒性地完成指定姿态机动任务,而且可以减少大约97.50%的控制信号更新,这大大缓解了航天器的通信负担.
关键词 航天器; 角速度受限; 预设性能控制; 通信资源有限; 事件触发机制; spacecraft; angular velocity constraint; prescribed performance control; limited communication resources; event-triggered mechanism;
Yongxia SHI, Qinglei HU, Xiaodong SHAO. Event-triggered attitude maneuver control of spacecraft under angular velocity constraints. Sci Sin Inform, 2022, 52(3): 506-520, doi: 10.1360/SSI-2021-0136