关键词
面向航空目标检测的神经网络加速器设计
作者: 施立瑞   王帅帅   肖昊   来源: 航空科学技术 年份: 2022 文献类型 : 期刊 关键词: 卷积神经网络   FPGA   目标检测   Winograd算法   加速器  
描述: 卷积神经网络被广泛应用于航空图像目标检测领域。然而,由于航空图像成像背景环境复杂、目标尺寸小且方向任意,为了提取更高层次的特征信息,神经网络模型的结构复杂度不断提高,使得模型计算复杂度高、计算时间长,从而难以满足航空目标检测的实时性需求。本文提出了一种面向航空目标检测的基于Winograd算法的神经网络加速器,通过Winograd卷积算法可大幅减少卷积计算中的乘法数量,并针对Winograd卷积在神经网络计算中由于时域变换引入额外加法计算的问题,提出了一种深流水的矩阵变换计算结构,通过复用加法计算的中间结果以及调整运算顺序减少输入和输出变换的计算量。同时,针对加速器的现场可编程门阵列(FPGA)实现,提出了一种高效的数据流形式和DSP阵列结构。试验结果表明,本文提出的加速器相比CPU和GPU分别获得了32倍和2.6倍的速度提升。
面向航空目标检测的神经网络加速器设计
作者: 施立瑞   王帅帅   肖昊   来源: 航空科学技术 年份: 2022 文献类型 : 期刊 关键词: 卷积神经网络   FPGA   目标检测   Winograd算法   加速器  
描述: 卷积神经网络被广泛应用于航空图像目标检测领域。然而,由于航空图像成像背景环境复杂、目标尺寸小且方向任意,为了提取更高层次的特征信息,神经网络模型的结构复杂度不断提高,使得模型计算复杂度高、计算时间长,从而难以满足航空目标检测的实时性需求。本文提出了一种面向航空目标检测的基于Winograd算法的神经网络加速器,通过Winograd卷积算法可大幅减少卷积计算中的乘法数量,并针对Winograd卷积在神经网络计算中由于时域变换引入额外加法计算的问题,提出了一种深流水的矩阵变换计算结构,通过复用加法计算的中间结果以及调整运算顺序减少输入和输出变换的计算量。同时,针对加速器的现场可编程门阵列(FPGA)实现,提出了一种高效的数据流形式和DSP阵列结构。试验结果表明,本文提出的加速器相比CPU和GPU分别获得了32倍和2.6倍的速度提升。
< 1
Rss订阅