面向特殊应用场景的无人机智能决策与控制专刊
编者按
陈谋, 贺威
中国科学: 信息科学, 2022, 52(9): 1577-1578
面向特殊应用场景的无人机智能决策与控制专刊
无人机污染源自主搜寻算法综述
李中国, 陈文华, 刘存佳
中国科学: 信息科学, 2022, 52(9): 1579-1597
摘要 自主搜寻在环境保护、灾后搜救和工业监控等方面有重要作用.无人机传感平台凭借其灵活的机动性成为实现自主搜寻的有效途径之一.针对自主搜寻中两个关键任务,即污染源定位和污染边界跟踪,本文分别梳理了相关算法体系,并揭示了其设计思想的本质.对于污染物溯源,控制驱动和信息驱动两类算法是目前的研究主流,但两者的结合却鲜有报道.在边界跟踪方面,本文从单平台和多平台协作两方面总结了现有文献的控制和估计方法.根据双重控制思想,本文分析了相关算法的设计思路,并展望了下一步的研究重点.
关键词 自主搜寻; 无人机; 污染源搜寻; 边界跟踪; 双重控制; 探索与利用; autonomous search; UAV; source seeking; boundary tracking; dual control; exploration and exploitation;
Zhongguo LI, Wen-Hua CHEN, Cunjia LIU. Review of UAV-based autonomous search algorithms for hazardous sources. Sci Sin Inform, 2022, 52(9): 1579-1597, doi: 10.1360/SSI-2022-0044
面向特殊应用场景的无人机智能决策与控制专刊
基于合作竞争公共物品博弈的无人机集群动态资源分配
王浩淼, 段海滨, 魏晨
中国科学: 信息科学, 2022, 52(9): 1598-1609
摘要 无人机集群动态资源分配是其任务规划的挑战性关键技术难题.本文提出了一种基于合作竞争机制的动态资源分配方法,将无人机集群与网络进化博弈模型进行对应,建立了基于无人机拓扑网络的博弈模型,通过设计针对特殊个体的调控规则,达到提升系统平均收益的目的.最后,通过无人机博弈模型的仿真实验,根据网络结构、模型参数,以及不同激发机制下系统的稳态结果,验证了本文所提无人机动态资源分配方法的可行性和有效性.
关键词 无人机集群; 公共物品博弈; 动态资源分配; 合作机制; 竞争机制; UAV swarm; public goods game; dynamic resource allocation; cooperative mechanism; competition mechanism;
Haomiao WANG, Haibin DUAN, Chen WEI. Dynamic resource allocation of UAV swarms based on cooperative and competitive public goods game. Sci Sin Inform, 2022, 52(9): 1598-1609, doi: 10.1360/SSI-2021-0416
面向特殊应用场景的无人机智能决策与控制专刊
基于随机采样的高层消防无人机协同搜索规划
李鸿一, 陈锦涛, 任鸿儒, 鲁仁全
中国科学: 信息科学, 2022, 52(9): 1610-1626
摘要 本文面向高层消防救援提出一种基于随机采样的多无人机协同搜索规划方法.首先,受随机树状采样搜索算法启发,提出一种搜索点最优分布方法,利用其在复杂环境下对有限空间重复搜索的特性,同时解决多无人机的路径点分布问题和任务分配问题.其次,设计一种基于交易规则的搜索点优化方法,以进一步提升搜索覆盖范围.然后,利用改进的和声搜索算法得到每架无人机遍历节点的最优顺序,进而获得各无人机的规划路径.最后,采用多线程方法模拟实际任务中的分布式运算,验证所提出方法的可行性.
关键词 高层消防; 随机采样; 和声搜索算法; 多无人机协同; 路径规划; high-rise firefighting; random sampling; harmony search; multi-UAV cooperation; path planning;
Hongyi LI, Jintao CHEN, Hongru REN, et al. Random-sampling-based multi-UAV cooperative search planning for high-rise firefighting. Sci Sin Inform, 2022, 52(9): 1610-1626, doi: 10.1360/SSI-2022-0038
面向特殊应用场景的无人机智能决策与控制专刊
面向复杂未知多障碍环境的多无人机分布式在线轨迹规划
张学伟, 田栢苓, 鲁瀚辰, 谌宏鸣, 宗群
中国科学: 信息科学, 2022, 52(9): 1627-1641
摘要 考虑复杂未知多障碍环境对无人机实时轨迹规划性能的影响,提出了基于Tube-MPC和模型预测路径积分(model predictive path integral, MPPI)控制相结合的多无人机分布式实时轨迹规划框架与方法.首先,考虑无人机在多障碍环境下的避碰避障需求,构造代价函数表征轨迹规划过程中的约束条件,将多无人机的轨迹规划问题转化为随机最优控制问题.其次,借鉴Tube-MPC思想,设计并实现了多无人机分布式轨迹规划框架,通过将低频标称控制器与高频辅助控制器串联保证了系统的实时性和鲁棒性.再次,为避免传统方法在求解过程中的维数灾难,提出基于MPPI的多无人机异步轨迹规划方法,该方法通过基于GPU的并行蒙特卡洛(Monte-Carlo)随机前向采样技术,将多无人机随机最优控制问题的求解转化为给定代价函数下对采样轨迹期望的求解,进而获得最优控制序列,其显著特点是求解速度快且避免了基于梯度求解方法对约束条件和代价函数连续性及凸特性的要求.最后,通过Gazebo虚拟仿真平台,在复杂未知多障碍环境下对算法的有效性进行了验证.
关键词 未知多障碍环境; 多无人机; 在线轨迹规划; 模型预测路径积分; GPU并行加速; unknown obstacle-rich environment; multi-UAV; online trajectory planning; model predictive path integral; GPU parallel acceleration;
Xuewei ZHANG, Bailing TIAN, Hanchen LU, et al. Multi-UAV decentralized online trajectory planning in complex unknown obstacle-rich environments. Sci Sin Inform, 2022, 52(9): 1627-1641, doi: 10.1360/SSI-2022-0048
面向特殊应用场景的无人机智能决策与控制专刊
基于动态目标概率分布的核电站无人机航路强化学习规划
周同乐, 陈谋
中国科学: 信息科学, 2022, 52(9): 1642-1655
摘要 针对核电站空中动态入侵目标,本文提出了一种基于动态目标概率分布的无人机航路强化学习规划算法,实现了对空中入侵目标的有效拦截.根据入侵目标的状态信息基于概率扩散原理计算目标的概率分布,推理目标可能出现的位置.在此基础上,设计了基于航路点转移规则的行动空间和基于目标概率分布的报酬函数动态更新机制,通过Q-学习不断优化路径,构建了基于目标概率分布和强化学习的无人机航路规划框架,实现了无人机航路强化学习规划.仿真结果表明,该方法能够针对核电站空中入侵目标,实现目标点变化情况下无人机的自主航路规划.
关键词 无人机; 核电站; 航路规划; 动态目标概率分布; 强化学习; UAV; nuclear power plant; path planning; dynamic target probability distribution; reinforcement learning;
Tongle ZHOU, Mou CHEN. Path reinforcement learning planning of nuclear power plant UAVs based on dynamic target probability distribution. Sci Sin Inform, 2022, 52(9): 1642-1655, doi: 10.1360/SSI-2022-0050
面向特殊应用场景的无人机智能决策与控制专刊
仿猎鹰扑翼飞行器自主飞行控制系统设计
孙永斌, 马宝忠, 贺威, 何修宇, 付强
中国科学: 信息科学, 2022, 52(9): 1656-1671
摘要 仿生扑翼飞行器作为一种新型的飞行器,具有噪声小、隐蔽性好、机动性强、能量利用效率高等优势,在民用和军用领域具有广阔的应用前景.仿生扑翼飞行器的自主飞行能力是高效执行飞行任务的关键.目前,国内外飞行器的自主飞行研究已经取得了一些成果,然而鲜有以仿生扑翼飞行器为载体的研究.仿生扑翼飞行器特有的驱动结构给自主飞行控制研究带来了较大的挑战.本文以仿猎鹰扑翼飞行器作为研究平台设计了自主飞行控制系统.由于仿猎鹰扑翼飞行器的负载较小,本文采用了重量较轻的STM32微型计算平台作为主控芯片设计了硬件系统.由于微型计算平台的算力有限,本文综合考虑制导精度和运算速度,提出了一种线性/非线性切换制导算法,并通过仿真实验与线性制导、非线性制导算法进行了对比,证明了其更加适合于仿猎鹰扑翼飞行器.考虑到仿猎鹰扑翼飞行器的机构滞后问题,对其滚转角和高度设计了一个串级PID控制器.结合面向仿猎鹰扑翼飞行器的地面站软件,最终实现了基于仿猎鹰扑翼飞行器的自主定高圆弧轨迹跟踪任务.
关键词 仿生扑翼飞行器; 自主飞行; 线性制导; 非线性制导; 轨迹跟踪; bionic flapping-wing aircraft; autonomous flight; linear guidance; nonlinear guidance; trajectory tracking;
Yongbin SUN, Baozhong MA, Wei HE, et al. Design of an autonomous flight control system for imitation falcon flapping-wing aircraft. Sci Sin Inform, 2022, 52(9): 1656-1671, doi: 10.1360/SSI-2022-0067
面向特殊应用场景的无人机智能决策与控制专刊
基于安全自适应强化学习的自主避障控制方法
王珂, 穆朝絮, 蔡光斌, 汪韧, 孙长银
中国科学: 信息科学, 2022, 52(9): 1672-1686
摘要 障碍规避是无人机等自主无人系统运动规划的重要环节,其核心是设计有效的避障控制方法.为了进一步提高决策优化性和控制效果,本文在最优控制的设定下,提出一种基于强化学习的自主避障控制方法,以自适应方式在线生成安全运行轨迹.首先,利用障碍函数法在代价函数中设计了一个光滑的奖惩函数,从而将避障问题转换为一个无约束的最优控制问题.然后,利用行为–评价神经网络和策略迭代法实现了自适应强化学习,其中评价网络利用状态跟随核函数逼近代价函数,行为网络给出近似最优的控制策略;同时,通过状态外推法获得模拟经验,使得评价网络能利用经验回放实现可靠的局部探索.最后,在简化的无人机系统和非线性数值系统上进行了仿真实验与方法对比,结果表明,提出的避障控制方法能实时生成较优的安全运行轨迹.
关键词 自主无人系统; 避障控制; 强化学习; 神经网络; 经验回放; autonomous unmanned systems; obstacle avoidance control; reinforcement learning; neural networks; experience replay;
Ke WANG, Chaoxu MU, Guangbin CAI, et al. Autonomous obstacle avoidance control method based on safe adaptive reinforcement learning. Sci Sin Inform, 2022, 52(9): 1672-1686, doi: 10.1360/SSI-2022-0054
面向特殊应用场景的无人机智能决策与控制专刊
面向宽域飞行的组合动力空天飞行器切换控制
程怡新, 许斌, 洪锐
中国科学: 信息科学, 2022, 52(9): 1687-1710
摘要 针对组合动力空天飞行器宽域爬升过程存在的模态转换、气动参数未知以及外界时变干扰等问题,研究了一种基于飞行包线模态划分的切换控制方案.对飞行器六自由度模型和发动机推力模型进行气动和推力特性分析,给出了模态划分结果和模态转换过渡过程.基于切换信号设计建立了空天飞行器切换系统,设计终端滑模软切换控制策略来保证模态的平稳转换,并利用神经网络和非线性扰动观测器协同处理系统不确定性和外界时变干扰.通过多Lyapunov函数方法对闭环切换系统的稳定性进行了分析,且仿真结果验证了所提方法的有效性.
关键词 空天飞行器; 组合动力; 模态转换; 切换控制; 鲁棒自适应控制; aerospace vehicle; combined power; modal transition; switching control; robust adaptive control;
Yixin CHENG, Bin XU, Rui HONG. Switching control of combined power aerospace vehicles for wide-area flight. Sci Sin Inform, 2022, 52(9): 1687-1710, doi: 10.1360/SSI-2022-0055
面向特殊应用场景的无人机智能决策与控制专刊
基于干扰区间观测器的无人机预设性能着舰飞行控制
胡伟, 雍可南, 陈谋
中国科学: 信息科学, 2022, 52(9): 1711-1726
摘要 无人机在现代战争中已发挥重要作用,为夺取海域制空权,航母配备无人机是必然趋势.面向无人机着舰的高精度控制要求,本文针对存在建模误差与外部干扰的无人机,在动态面控制框架下提出一种基于干扰区间观测器的无人机预设性能着舰飞行控制策略.该策略能够对未知项提供区间估计,在前馈补偿未知项的同时,控制律将根据区间估计的宽度动态调节控制器增益,从而保证无人机的轨迹始终处在着舰轨迹约束范围内.同时,在干扰区间观测器与飞行控制律设计过程中,引入非线性增益,有效地处理了着舰机动中的状态非线性耦合.最后,基于Lyapunov函数方法与不变集理论,给出着舰飞行控制策略的参数设计条件,数值仿真也进一步表明该策略的有效性.
关键词 无人机; 着舰控制; 预设性能控制; 干扰观测器; 区间观测器; unmanned aerial vehicle; carrier landing control; prescribed performance-based control; disturbance observer; interval observer;
Wei HU, Kenan YONG, Mou CHEN. Disturbance interval observer-based carrier landing control of unmanned aerial vehicles using prescribed performance. Sci Sin Inform, 2022, 52(9): 1711-1726, doi: 10.1360/SSI-2022-0051