航空器智能引导机动决策奖励重塑方法
日期:2023.05.31 点击数:15
【类型】期刊
【刊名】科学技术与工程
【关键词】 航空器引导,深度强化学习,奖励重塑,机动决策
【资助项】四川省科技计划(2021JDRC0083);; 中央高校基本科研业务费基金(J2022-051);; 广西中国-东盟综合交通国际联合重点实验室资助课题(21-220-21-01)
【摘要】针对使用深度强化学习进行航空器智能引导研究中存在的飞行轨迹质量差、训练效率低等问题,对应用于机动决策生成的奖励重塑方法进行了研究。首先,构建了航空器引导机动决策生成的深度强化学习模型;其次,从指令连续性和相对姿态两个角度设计了奖励重塑函数,并证明了使用重塑函数前后的策略一致性;最后,在不同类型目的地场景中进行了仿真实验。仿真结果表明:奖励重塑方法对航空器飞行轨迹质量和智能体训练效率有明显的提升。使用本方法快速训练的智能体,可以准确、高效地生成机动决策,引导航空器完成任务。
【年份】2023
【作者单位】中国民用航空飞行学院空中交通管理学院;南宁学院广西中国-东盟综合交通国际联合重点实验室;四川大学计算机学院;
【期号】08
【页码】3535-3543
相关文章
- 1、基于深度强化学习算法的终端区飞机着陆调度算法研究 作者:卢锐轩, 年份:2021
- 2、基于深度强化学习算法的终端区飞机着陆调度算法研究 作者:卢锐轩, 年份:2020
- 3、基于深度强化学习的航空发动机管路敷设优化方法 作者:张乐 年份:2020
- 4、基于深度强化学习的三维超声标准面自动定位 作者:窦浩然 年份:2020
- 5、基于深度强化学习的飞行器自主机动决策方法研究 作者:吴昭欣 年份:2021
- 6、航空兵力CGF的行为建模 作者:王树新 年份:2016