固定时间预设性能下涡扇发动机模糊自适应控制
刘凡, 陈谋
中国科学: 信息科学, 2024, 54(7): 1793-1806
摘要 为解决涡扇发动机大包线内多变量鲁棒控制问题,提出了一种基于干扰观测器的非线性涡扇发动机系统固定时间预设性能模糊自适应控制方法.首先,利用平衡流形建模方法构建了涡扇发动机的仿射非线性数学模型.借助反馈线性化技术,推导了受扰涡扇发动机系统的输出跟踪误差系统.然后利用模糊逻辑系统逼近系统不确定项,并设计非线性干扰观测器估计未知干扰和逼近误差组成的复合干扰.为保证控制系统的瞬态性能和稳态精度,引入固定时间预设性能函数,并通过误差转换函数将系统转化成无约束误差系统,进而设计涡扇发动机复合非线性鲁棒抗扰控制器.仿真结果表明,该控制方法能够使得涡扇发动机系统的转速和压比有效地跟踪参考指令并且跟踪误差始终限制在预设性能边界内.
关键词 涡扇发动机; 非线性干扰观测器; 模糊逻辑系统; 固定时间; 预设性能函数; turbofan engine; nonlinear disturbance observer; fuzzy logic system; fixed time; prescribed performance function
Fan LIU, Mou CHEN. Fuzzy adaptive control for turbofan engines with fixed-time prescribed performance. Sci Sin Inform, 2024, 54(7): 1793-1806, doi: 10.1360/SSI-2023-0329
变工况下不确定动态突变四旋翼飞行器系统的自适应湍流风扰动抑制技术
张雨杰, 文利燕, 姜斌, 齐瑞云
中国科学: 信息科学, 2024, 54(7): 1730-1751
摘要 本文考虑四旋翼飞行过程中湍流风扰动的影响,以及因变工况飞行而导致的不确定动态突变问题,提出了基于输入–扰动双补偿器设计的自适应湍流风扰动抑制方案,保证了四旋翼飞行器系统的稳定和输出渐近跟踪性能.首先对风场环境下的四旋翼进行建模,研究各不同工况下的动态特性,并分析研究了四旋翼飞行器变工况飞行时的动态特性突变的表现形式以及所带来的控制难题.进而设计了一种基于输入–扰动双补偿器的系统重构方案,实现了动态系统重构,解决了关联矩阵突变为非对角型时难以解耦控制,以及相对阶结构突变时控制器结构发生突变的问题.基于重构后的系统,设计自适应的湍流风扰动抑制方案,保证四旋翼飞行器的稳定、扰动抑制和渐近输出跟踪性能.最后,对所设计的控制器进行稳定性证明,并通过仿真验证所提出控制算法的有效性.
关键词 四旋翼; 风扰动抑制; 动态特性突变; 系统重构; 自适应控制; quadrotor; wind disturbance suppression; dynamic mutation; system reconstruction; adaptive control
Yujie ZHANG, Liyan WEN, Bin JIANG, et al. Adaptive wind disturbance rejection technique of a quadrotor with uncertain dynamic mutations under varying operating conditions. Sci Sin Inform, 2024, 54(7): 1730-1751, doi: 10.1360/SSI-2023-0251
不确定工时下多目标柔性作业车间调度问题的进化求解方法
钟小玉, 韩玉艳, 姚香娟, 巩敦卫, 孙永征
中国科学: 信息科学, 2023, 53(4): 737-757
摘要 在实际工业生产中,调度环境的复杂性与不确定性使得调度问题求解难度大大提高.针对加工时间不确定的柔性作业车间调度问题,采用不确定参数描述随机工时波动程度和约束条件允许违背程度,构建工时波动服从指数分布的多目标柔性车间调度模型.基于机会约束规划理论,将不确定调度问题转化为加工时间确定的柔性作业车间调度问题,求解得到一定程度上具有鲁棒性能的调度方案.在执行过程中,采用工序移动调整和重调度方法对作业排产方案进行动态调整.基于双链式编码以及贪婪插入法解码规则,提出了基于变邻域搜索的混合NSGA-Ⅱ算法.针对车间调度问题的多约束性和计算复杂度高等特点,设计了基于机器选择的复合启发式规则,包括依据概率的最小累计机器负载和最短工序加工时间规则,以获取更加接近Pareto前沿的均匀分布初始种群.采用改进工序和设备交叉策略以提高算法的全局搜索能力.此外,基于关键工序和机器选择的多种邻域结构,设计了变邻域搜索策略,以进一步提高算法的局部搜索能力.通过Kacem和Brandimarte标准算例的数值仿真以及与多种代表算法的统计比较,验证了所提算法的有效性.本文所提算法为不确定柔性作业车间调度问题提供了更优的调度方案.
关键词 多目标优化; 柔性作业车间调度; NSGA-II; 变邻域搜索; 不确定工时; 机会约束规划; multi-objective optimization; flexible job shop scheduling; variable neighborhood search; uncertain processing time; chance-constrained programming;
Xiaoyu ZHONG, Yuyan HAN, Xiangjuan YAO, et al. An evolutionary algorithm for the multi-objective flexible job shop scheduling problem with uncertain processing time. Sci Sin Inform, 2023, 53(4): 737-757, doi: 10.1360/SSI-2022-0017
具有高阶时延的离散非仿射非线性系统的自适应跟踪控制
张言军
中国科学: 信息科学, 2023, 53(3): 535-549
摘要 本文研究了一类具有高阶输入–输出时延的非仿射非线性离散不确定系统的自适应输出跟踪控制问题,提出了一种基于隐函数的自适应输出反馈输出跟踪控制方案.该方案主要解决了两个技术问题:一是构造了基于未知参数估计和未来时刻信号估计的隐函数方程解的自适应控制律,解决了因系统高阶时延导致的控制律因果矛盾问题并实现了闭环稳定和渐近输出跟踪;二是针对非仿射非线性控制律难求解问题,提出了基于迭代解的解析自适应控制律,实现了闭环稳定和实用输出跟踪.最后仿真研究证实了所提出控制方案的有效性.
关键词 自适应控制; 非仿射非线性; 闭环稳定; 输出跟踪; adaptive control; non-affine nonlinearity; closed-loop stability; output tracking;
Yanjun ZHANG. Adaptive tracking control of discrete-time non-affine nonlinear systems with high-order time delays. Sci Sin Inform, 2023, 53(3): 535-549, doi: 10.1360/SSI-2022-0007
面向特殊应用场景的无人机智能决策与控制专刊
基于安全自适应强化学习的自主避障控制方法
王珂, 穆朝絮, 蔡光斌, 汪韧, 孙长银
中国科学: 信息科学, 2022, 52(9): 1672-1686
摘要 障碍规避是无人机等自主无人系统运动规划的重要环节,其核心是设计有效的避障控制方法.为了进一步提高决策优化性和控制效果,本文在最优控制的设定下,提出一种基于强化学习的自主避障控制方法,以自适应方式在线生成安全运行轨迹.首先,利用障碍函数法在代价函数中设计了一个光滑的奖惩函数,从而将避障问题转换为一个无约束的最优控制问题.然后,利用行为–评价神经网络和策略迭代法实现了自适应强化学习,其中评价网络利用状态跟随核函数逼近代价函数,行为网络给出近似最优的控制策略;同时,通过状态外推法获得模拟经验,使得评价网络能利用经验回放实现可靠的局部探索.最后,在简化的无人机系统和非线性数值系统上进行了仿真实验与方法对比,结果表明,提出的避障控制方法能实时生成较优的安全运行轨迹.
关键词 自主无人系统; 避障控制; 强化学习; 神经网络; 经验回放; autonomous unmanned systems; obstacle avoidance control; reinforcement learning; neural networks; experience replay;
Ke WANG, Chaoxu MU, Guangbin CAI, et al. Autonomous obstacle avoidance control method based on safe adaptive reinforcement learning. Sci Sin Inform, 2022, 52(9): 1672-1686, doi: 10.1360/SSI-2022-0054
线性二次二人Stackelberg博弈均衡点求解: 一种Q学习方法
李曼, 秦家虎, 王龙
中国科学: 信息科学, 2022, 52(6): 1083-1097
摘要 近年来, Stackelberg博弈被广泛用于解决信息物理系统安全控制、智能电网能源管理等问题.已有的Stackelberg均衡点求解方法大多需要已知系统模型信息,而在实际应用中模型信息通常难以精确获取,这在一定程度上限制了相关理论研究成果的应用.鉴于此,本文研究了不基于系统模型的Stackelberg博弈均衡点的求解方法.具体地,本文考虑线性二次二人Stackelberg博弈,其中博弈状态演化满足线性方程,且成本函数为二次形式.博弈的两个参与者为能够预测另一个体可能响应的个体(即领导者),和根据领导者策略作出最优响应的个体(即跟随者).因为本文考虑线性形式的状态演化和二次形式的成本函数,且领导者先于跟随者采取行动,故领导者和跟随者的决策问题可建模为两层的线性二次型最优控制问题.本文按照从跟随者到领导者的原则,基于动态规划原理推导出最优控制策略.该策略被证明恰好为Stackelberg均衡策略,但其计算需使用系统模型信息.基于此策略,本文提出一种基于执行器–评价器(actor-critic)结构的Q学习算法,解决了系统动力学模型未知情况下线性二次二人Stackelberg博弈均衡点求解问题.此外,本文理论证明了所提算法能够保证系统状态、执行网络和评价网络权重估计误差一致最终有界,并通过数值仿真实验说明基于Q学习算法所得控制策略能够使系统状态稳定,且估计控制策略下的成本函数偏离均衡策略下的成本函数的幅度较小.
关键词 线性二次二人Stackelberg博弈; 最优控制; 模型未知; 执行器–评价器结构; Q学习; linear-quadratic two-player Stackelberg game; optimal control; model-free; actor-critic structure; Q-learning;
Man LI, Jiahu QIN, Long WANG. Seeking equilibrium for linear-quadratic two-player Stackelberg game: a Q-learning approach. Sci Sin Inform, 2022, 52(6): 1083-1097, doi: 10.1360/SSI-2021-0016