航空器智能引导机动决策奖励重塑方法

日期:2023.05.31 点击数:15

【类型】期刊

【作者】王壮 艾毅 文旭光 李辉  

【刊名】科学技术与工程

【关键词】 航空器引导,深度强化学习,奖励重塑,机动决策

【资助项】四川省科技计划(2021JDRC0083);; 中央高校基本科研业务费基金(J2022-051);; 广西中国-东盟综合交通国际联合重点实验室资助课题(21-220-21-01)

【摘要】针对使用深度强化学习进行航空器智能引导研究中存在的飞行轨迹质量差、训练效率低等问题,对应用于机动决策生成的奖励重塑方法进行了研究。首先,构建了航空器引导机动决策生成的深度强化学习模型;其次,从指令连续性和相对姿态两个角度设计了奖励重塑函数,并证明了使用重塑函数前后的策略一致性;最后,在不同类型目的地场景中进行了仿真实验。仿真结果表明:奖励重塑方法对航空器飞行轨迹质量和智能体训练效率有明显的提升。使用本方法快速训练的智能体,可以准确、高效地生成机动决策,引导航空器完成任务。

【年份】2023

【作者单位】中国民用航空飞行学院空中交通管理学院;南宁学院广西中国-东盟综合交通国际联合重点实验室;四川大学计算机学院;

【期号】08

【页码】3535-3543

3 0
Rss订阅