控制 鲁棒控制与自适应控制 论文 Website Google Scholar PDF SCOPUS引次: 1

不确定工时下多目标柔性作业车间调度问题的进化求解方法

钟小玉, 韩玉艳, 姚香娟, 巩敦卫, 孙永征
中国科学: 信息科学, 2023, 53(4): 737-757

摘要 在实际工业生产中,调度环境的复杂性与不确定性使得调度问题求解难度大大提高.针对加工时间不确定的柔性作业车间调度问题,采用不确定参数描述随机工时波动程度和约束条件允许违背程度,构建工时波动服从指数分布的多目标柔性车间调度模型.基于机会约束规划理论,将不确定调度问题转化为加工时间确定的柔性作业车间调度问题,求解得到一定程度上具有鲁棒性能的调度方案.在执行过程中,采用工序移动调整和重调度方法对作业排产方案进行动态调整.基于双链式编码以及贪婪插入法解码规则,提出了基于变邻域搜索的混合NSGA-Ⅱ算法.针对车间调度问题的多约束性和计算复杂度高等特点,设计了基于机器选择的复合启发式规则,包括依据概率的最小累计机器负载和最短工序加工时间规则,以获取更加接近Pareto前沿的均匀分布初始种群.采用改进工序和设备交叉策略以提高算法的全局搜索能力.此外,基于关键工序和机器选择的多种邻域结构,设计了变邻域搜索策略,以进一步提高算法的局部搜索能力.通过Kacem和Brandimarte标准算例的数值仿真以及与多种代表算法的统计比较,验证了所提算法的有效性.本文所提算法为不确定柔性作业车间调度问题提供了更优的调度方案.

关键词 多目标优化; 柔性作业车间调度; NSGA-II; 变邻域搜索; 不确定工时; 机会约束规划; multi-objective optimization; flexible job shop scheduling; variable neighborhood search; uncertain processing time; chance-constrained programming;

引用格式 钟小玉, 韩玉艳, 姚香娟, 等. 不确定工时下多目标柔性作业车间调度问题的进化求解方法. 中国科学: 信息科学, 2023, 53(4): 737-757, doi: 10.1360/SSI-2022-0017
Xiaoyu ZHONG, Yuyan HAN, Xiangjuan YAO, et al. An evolutionary algorithm for the multi-objective flexible job shop scheduling problem with uncertain processing time. Sci Sin Inform, 2023, 53(4): 737-757, doi: 10.1360/SSI-2022-0017

控制 鲁棒控制与自适应控制 论文 Website Google Scholar PDF SCOPUS引次: 0

具有高阶时延的离散非仿射非线性系统的自适应跟踪控制

张言军
中国科学: 信息科学, 2023, 53(3): 535-549

摘要 本文研究了一类具有高阶输入–输出时延的非仿射非线性离散不确定系统的自适应输出跟踪控制问题,提出了一种基于隐函数的自适应输出反馈输出跟踪控制方案.该方案主要解决了两个技术问题:一是构造了基于未知参数估计和未来时刻信号估计的隐函数方程解的自适应控制律,解决了因系统高阶时延导致的控制律因果矛盾问题并实现了闭环稳定和渐近输出跟踪;二是针对非仿射非线性控制律难求解问题,提出了基于迭代解的解析自适应控制律,实现了闭环稳定和实用输出跟踪.最后仿真研究证实了所提出控制方案的有效性.

关键词 自适应控制; 非仿射非线性; 闭环稳定; 输出跟踪; adaptive control; non-affine nonlinearity; closed-loop stability; output tracking;

引用格式 张言军. 具有高阶时延的离散非仿射非线性系统的自适应跟踪控制. 中国科学: 信息科学, 2023, 53(3): 535-549, doi: 10.1360/SSI-2022-0007
Yanjun ZHANG. Adaptive tracking control of discrete-time non-affine nonlinear systems with high-order time delays. Sci Sin Inform, 2023, 53(3): 535-549, doi: 10.1360/SSI-2022-0007

控制 鲁棒控制与自适应控制 论文 Website Google Scholar PDF SCOPUS引次: 1

面向特殊应用场景的无人机智能决策与控制专刊

基于安全自适应强化学习的自主避障控制方法

王珂, 穆朝絮, 蔡光斌, 汪韧, 孙长银
中国科学: 信息科学, 2022, 52(9): 1672-1686

摘要 障碍规避是无人机等自主无人系统运动规划的重要环节,其核心是设计有效的避障控制方法.为了进一步提高决策优化性和控制效果,本文在最优控制的设定下,提出一种基于强化学习的自主避障控制方法,以自适应方式在线生成安全运行轨迹.首先,利用障碍函数法在代价函数中设计了一个光滑的奖惩函数,从而将避障问题转换为一个无约束的最优控制问题.然后,利用行为–评价神经网络和策略迭代法实现了自适应强化学习,其中评价网络利用状态跟随核函数逼近代价函数,行为网络给出近似最优的控制策略;同时,通过状态外推法获得模拟经验,使得评价网络能利用经验回放实现可靠的局部探索.最后,在简化的无人机系统和非线性数值系统上进行了仿真实验与方法对比,结果表明,提出的避障控制方法能实时生成较优的安全运行轨迹.

关键词 自主无人系统; 避障控制; 强化学习; 神经网络; 经验回放; autonomous unmanned systems; obstacle avoidance control; reinforcement learning; neural networks; experience replay;

引用格式 王珂, 穆朝絮, 蔡光斌, 等. 基于安全自适应强化学习的自主避障控制方法. 中国科学: 信息科学, 2022, 52(9): 1672-1686, doi: 10.1360/SSI-2022-0054
Ke WANG, Chaoxu MU, Guangbin CAI, et al. Autonomous obstacle avoidance control method based on safe adaptive reinforcement learning. Sci Sin Inform, 2022, 52(9): 1672-1686, doi: 10.1360/SSI-2022-0054

控制 鲁棒控制与自适应控制 论文 Website Google Scholar PDF SCOPUS引次: 0

线性二次二人Stackelberg博弈均衡点求解: 一种Q学习方法

李曼, 秦家虎, 王龙
中国科学: 信息科学, 2022, 52(6): 1083-1097

摘要 近年来, Stackelberg博弈被广泛用于解决信息物理系统安全控制、智能电网能源管理等问题.已有的Stackelberg均衡点求解方法大多需要已知系统模型信息,而在实际应用中模型信息通常难以精确获取,这在一定程度上限制了相关理论研究成果的应用.鉴于此,本文研究了不基于系统模型的Stackelberg博弈均衡点的求解方法.具体地,本文考虑线性二次二人Stackelberg博弈,其中博弈状态演化满足线性方程,且成本函数为二次形式.博弈的两个参与者为能够预测另一个体可能响应的个体(即领导者),和根据领导者策略作出最优响应的个体(即跟随者).因为本文考虑线性形式的状态演化和二次形式的成本函数,且领导者先于跟随者采取行动,故领导者和跟随者的决策问题可建模为两层的线性二次型最优控制问题.本文按照从跟随者到领导者的原则,基于动态规划原理推导出最优控制策略.该策略被证明恰好为Stackelberg均衡策略,但其计算需使用系统模型信息.基于此策略,本文提出一种基于执行器–评价器(actor-critic)结构的Q学习算法,解决了系统动力学模型未知情况下线性二次二人Stackelberg博弈均衡点求解问题.此外,本文理论证明了所提算法能够保证系统状态、执行网络和评价网络权重估计误差一致最终有界,并通过数值仿真实验说明基于Q学习算法所得控制策略能够使系统状态稳定,且估计控制策略下的成本函数偏离均衡策略下的成本函数的幅度较小.

关键词 线性二次二人Stackelberg博弈; 最优控制; 模型未知; 执行器–评价器结构; Q学习; linear-quadratic two-player Stackelberg game; optimal control; model-free; actor-critic structure; Q-learning;

引用格式 李曼, 秦家虎, 王龙. 线性二次二人Stackelberg博弈均衡点求解: 一种Q学习方法. 中国科学: 信息科学, 2022, 52(6): 1083-1097, doi: 10.1360/SSI-2021-0016
Man LI, Jiahu QIN, Long WANG. Seeking equilibrium for linear-quadratic two-player Stackelberg game: a Q-learning approach. Sci Sin Inform, 2022, 52(6): 1083-1097, doi: 10.1360/SSI-2021-0016