-
面向飞机故障文本的信息抽取
-
作者:
乔璐
孙有朝
吴红兰
来源:
计算机与现代化
年份:
2024
文献类型 :
期刊
关键词:
BiGRU
信息抽取
领域词典
CRF
命名实体识别
故障信息
-
描述:
针对人工提取飞机故障信息工作量大、效率低、成本高等问题,提出一种基于领域词典、规则和BiGRU-CRF模型的信息抽取方法。结合飞机领域知识的特点,基于飞机故障文本信息构建领域词典库和模板规则,并对故障信息进行语义标注。采用BiGRU-CRF深度学习模型进行命名实体识别,BiGRU获取上下文的语义关系,CRF解码生成实体标签序列。实验结果表明,基于领域词典、规则和BiGRU-CRF模型的信息抽取方法准确率高达95.2%,验证了该方法的有效性。本文方法能够准确识别出飞机故障文本中的关键词如时间、机型、故障件名称、故障件制造单位等信息,同时,根据领域词典和规则对识别结果进行修正,有效提高了信息抽取的效率和准确性,解决了传统实体抽取模型长期依赖人工特征的问题。