数据挖掘在航空安全自愿报告分析中的应用研究

日期:2016.12.22 点击数:9

【类型】学位论文

【作者】狄强 

【关键词】 航空安全自愿报告,关联规则挖掘,相似报告检索,聚类,飞行安全,关注词

【摘要】航空安全自愿报告是由民航从业人员自愿提供的一种信息报告,主要记录该报告人员经历的民航安全隐患事件过程,其形式包括结构化数据(事件发生地点、时间、航空器类型、航空公司类型、飞行过程等)和非结构化数据(事件经过的简要描述);数据挖掘旨在从大量的、不完全的、有噪声的数据中,自动提取隐含在其中的模式和知识。论文以"航空安全自愿报告系统"中收集的事件报告为数据源,主要研究数据挖掘在自愿报告分析中的应用,针对自愿报告特有的结构化数据和非结构化数据共存的现状,研究如何借助数据挖掘技术自动识别隐藏在数据中未知的、潜在的问题,揭示事故发展的趋势和关联,以期高效进行安全事件数据分析,控制和消除航空安全隐患,提高飞行安全性能。 论文在对数据挖掘技术(关联规则挖掘,文本检索,聚类等)及我国的航空安全自愿报告进行系统和深入探讨研究的基础上,主要做了以下工作:1.针对我国航空安全自愿报告的数据形式进行实验分析,采用数据清洗、数据集成、数据归约等技术对数据进行必要的预处理:2.采用哈希表及数据划分技术对Apriori算法进行改进,并对其进行多维关联规则挖掘适应性改进,最终采用此算法对航空安全自愿报告结构化部分进行关联分析,挖掘其中隐藏的关联规则;3.采用关注词集合技术表征自愿报告特征,分别采用欧氏距离和余弦距离两种方式度量报告相似度,实现了航空安全自愿报告的相似检索;4.采用模糊聚类方法对航空安全自愿报告非结构化部分进行报告的自动聚类;5.针对我国航空安全自愿报告专有数据形式,提出了不同数据挖掘技术在航空安全自愿报告分析中的综合应用策略,并给出了实验结果及分析。 论文分别给出了不同数据挖掘方法和技术在用于航空安全自愿报告分析时的实验结果。实验表明:从航空安全自愿报告中可以挖掘出隐含的有效航空安全关联规则;报告的聚类及相似报告检索有助于分析人员聚焦分析相关报告之间的实质联系,就所选数据源而言,采用余弦距离比欧氏距离聚类效果更好;多种数据挖掘技术在航空安全自愿报告的综合应用能更有效地挖掘安全信息,这将是航空安全自愿报告分析研究的一个趋势。

【学位名称】硕士

【学位授予单位】中国民航大学

【学位授予年度】2016

【导师姓名】冯霞

【读秀链接】读秀链接

3 0
Rss订阅