首页>
根据【关键词:深度强化学习,近端策略优化算法,视情维修策略,马尔可夫决策过程】搜索到相关结果 7 条
-
基于掩码式PPO算法的航空发动机维修决策研究
-
作者:
陈保利
翟运开
房晓敏
付捧枝
蔚陶
林志龙
来源:
机械设计
年份:
2025
文献类型 :
期刊
关键词:
深度强化学习
近端策略优化算法
视情维修策略
马尔可夫决策过程
-
描述:
基于掩码式PPO算法的航空发动机维修决策研究
-
事件驱动的航空制造流水线预测性维护决策研究
-
作者:
张文沛
崔鹏浩
李洋
延爽
来源:
航空科学技术
年份:
2022
文献类型 :
期刊
关键词:
深度Q网络
流水线
决策优化
预测性维护
马尔可夫决策过程
-
描述:
。其次,考虑流水线产出损失和维护成本构建奖励函数,建立基于马尔可夫决策过程的流水线预测性维护决策模型,结合深度Q网络算法求解模型获得优化决策方案。最后,通过仿真试验对比其他三种维护方法,验证了所提出决策模型的有效性。
-
一种新的通用航空机载防撞逻辑设计方法
-
作者:
林云松
彭良福
傅勇
叶睿
来源:
电讯技术
年份:
2018
文献类型 :
期刊
关键词:
机载防撞系统
低空空域
通用航空
最优防撞逻辑
马尔可夫决策过程
-
描述:
由于机载防撞系统(TCAS)是针对具有较大垂直高度变化率的大型飞机设计的,系统设定条件和与之相关的解脱建议并不能适用于通航飞机。针对通用航空的防撞问题,提出了一种基于马尔可夫决策过程(MDP)的防撞
-
基于深度强化学习算法的终端区飞机着陆调度算法研究
-
作者:
卢锐轩
来源:
现代计算机
年份:
2020
文献类型 :
期刊
关键词:
空中交通
深度强化学习
机场终端区
航班着陆调度
-
描述:
针对当前机场终端区空中交通中存在的航班着陆成本过大,飞机延误率过高,调度成本过大等问题,提出利用深度强化学习算法结合终端区调度算法的一系列新调度算法,重点在于解决机场终端区空中交通中待着陆飞机的安全
-
基于深度强化学习算法的终端区飞机着陆调度算法研究
-
作者:
卢锐轩
来源:
现代计算机
年份:
2021
文献类型 :
期刊
关键词:
空中交通
深度强化学习
机场终端区
航班着陆调度
-
描述:
针对当前机场终端区空中交通中存在的航班着陆成本过大,飞机延误率过高,调度成本过大等问题,提出利用深度强化学习算法结合终端区调度算法的一系列新调度算法,重点在于解决机场终端区空中交通中待着陆飞机的安全
-
航空器智能引导机动决策奖励重塑方法
-
作者:
王壮
艾毅
文旭光
李辉
来源:
科学技术与工程
年份:
2023
文献类型 :
期刊
关键词:
航空器引导
深度强化学习
奖励重塑
机动决策
-
描述:
针对使用深度强化学习进行航空器智能引导研究中存在的飞行轨迹质量差、训练效率低等问题,对应用于机动决策生成的奖励重塑方法进行了研究。首先,构建了航空器引导机动决策生成的深度强化学习模型;其次,从指令
-
基于深度强化学习的航空发动机MPC控制研究
-
作者:
刘策
白杰
来源:
计算机仿真
年份:
2024
文献类型 :
期刊
关键词:
模型预测控制
模型失配
深度强化学习
航空发动机控制
-
描述:
基于深度强化学习的航空发动机MPC控制研究