航空文献资源库

全部图书期刊学位论文会议论文报纸图片视频新闻

首页> 根据【关键词:深度强化学习,近端策略优化算法,视情维修策略,马尔可夫决策过程】搜索到相关结果 7 条

按文献类别分组

按栏目分组

按年份分组

按来源分组

关键词

基于掩码式PPO算法的航空发动机维修决策研究: 作者： 陈保利翟运开房晓敏付捧枝蔚陶林志龙 来源： 机械设计 年份： 2025 文献类型： 期刊 关键词： 深度强化学习 近端策略优化算法 视情维修策略 马尔可夫决策过程; 描述： 基于掩码式PPO算法的航空发动机维修决策研究

事件驱动的航空制造流水线预测性维护决策研究: 作者： 张文沛崔鹏浩李洋延爽 来源： 航空科学技术 年份： 2022 文献类型： 期刊 关键词： 深度Q网络流水线决策优化预测性维护 马尔可夫决策过程; 描述： 。其次，考虑流水线产出损失和维护成本构建奖励函数，建立基于马尔可夫决策过程的流水线预测性维护决策模型，结合深度Q网络算法求解模型获得优化决策方案。最后，通过仿真试验对比其他三种维护方法，验证了所提出决策模型的有效性。

一种新的通用航空机载防撞逻辑设计方法: 作者： 林云松彭良福傅勇叶睿 来源： 电讯技术 年份： 2018 文献类型： 期刊 关键词： 机载防撞系统低空空域通用航空最优防撞逻辑 马尔可夫决策过程; 描述： 由于机载防撞系统(TCAS)是针对具有较大垂直高度变化率的大型飞机设计的,系统设定条件和与之相关的解脱建议并不能适用于通航飞机。针对通用航空的防撞问题,提出了一种基于马尔可夫决策过程(MDP)的防撞

基于深度强化学习算法的终端区飞机着陆调度算法研究: 作者： 卢锐轩 来源： 现代计算机 年份： 2020 文献类型： 期刊 关键词： 空中交通 深度强化学习 机场终端区航班着陆调度; 描述： 针对当前机场终端区空中交通中存在的航班着陆成本过大,飞机延误率过高,调度成本过大等问题,提出利用深度强化学习算法结合终端区调度算法的一系列新调度算法,重点在于解决机场终端区空中交通中待着陆飞机的安全

基于深度强化学习算法的终端区飞机着陆调度算法研究: 作者： 卢锐轩 来源： 现代计算机 年份： 2021 文献类型： 期刊 关键词： 空中交通 深度强化学习 机场终端区航班着陆调度; 描述： 针对当前机场终端区空中交通中存在的航班着陆成本过大,飞机延误率过高,调度成本过大等问题,提出利用深度强化学习算法结合终端区调度算法的一系列新调度算法,重点在于解决机场终端区空中交通中待着陆飞机的安全

航空器智能引导机动决策奖励重塑方法: 作者： 王壮艾毅文旭光李辉 来源： 科学技术与工程 年份： 2023 文献类型： 期刊 关键词： 航空器引导 深度强化学习 奖励重塑机动决策; 描述： 针对使用深度强化学习进行航空器智能引导研究中存在的飞行轨迹质量差、训练效率低等问题，对应用于机动决策生成的奖励重塑方法进行了研究。首先，构建了航空器引导机动决策生成的深度强化学习模型；其次，从指令

基于深度强化学习的航空发动机MPC控制研究: 作者： 刘策白杰 来源： 计算机仿真 年份： 2024 文献类型： 期刊 关键词： 模型预测控制模型失配 深度强化学习 航空发动机控制; 描述： 基于深度强化学习的航空发动机MPC控制研究

< 1 >

Rss订阅

订阅地址：