基于文本挖掘和K-means聚类的航空安全事故报告的可视化分析方法

日期:2022.12.30 点击数:6

【类型】期刊

【作者】马婷  

【刊名】电脑知识与技术

【关键词】 航空安全事故报告,文本挖掘,聚类,致险因素,分词

【摘要】航空事故对航空安全起到至关重要的作用,影响航空安全的因素是多重的。文章对航空安全事故报告采用文本挖掘和R语言,找出航空安全事故的致险因素,对航空安全提供参考,收集事故报告90例,首先采用了结巴分词对数据进行分词处理,其次是过滤分词结果中的停用词和无效词,然后进行关键字的提取,找出能够代表文本特征的词条,建立向量空间模型,最后采用K-means聚类算法,在K值为3时聚类效果达到最佳,将航空事故致险因素分为了人为-环境-设备三类,利用R语言的Word Cloud程序包将实验结果进行可视化处理,得出8项主要致险因素,17项一般致险因素。根据词云图中的致险因素,从人-环境-设备三个方面为以后的飞行安全提供了有价值的参考信息。

【年份】2022

【作者单位】中国民用航空飞行学院计算机学院;

【期号】35

【页码】56-59+72

3 0
Rss订阅