基于文本聚类的航空ATA智能编码系统研究

日期:2016.12.22 点击数:12

【类型】学位论文

【作者】郑春秋 

【关键词】 智能编码系统,文本聚类,ATA

【摘要】文本聚类方法是通过对文本进行分解和信息提取,在人工智能的指导下进行的自动聚类,能够利用计算机的高速处理功能处理大量的数据,提高效率和准确性,并且能通过对海量数据的分析提取出知识模式,帮助人们挖掘隐含于信息中的隐性知识。航空ATA智能编码系统是基于ATA编码规则的航空编码管理信息系统,是航空产品管理系统的重要组成部分,其智能性体现在能够将部件的描述文本与已有知识库进行自动聚类,从而根据文本的所属类别来判定部件的所属类别,为新的部件编码提供支持。本文基于文本挖掘的流程和文本聚类方法,设计了航空智能编码管理系统的核心算法。然后设计并开发了原型系统,所实现的算法被嵌入到该原型系统中作为智能编码辅助工具。通过一些产品的描述文本进行聚类算例试验,证明所设计的算法和原型系统是有效和适用的。本文的研究内容主要从以下几个方面展开:(1)文本聚类流程的具体实现。本文在对已有的文本聚类流程的学习和研究的基础上,论述文本聚类的实现流程,从可操作的角度对该流程进行了具体细化。(2)文本聚类过程中方法的选择。针对于航空ATA智能编码系统的具体情况,分析和比较各种方法和模型的优劣,选择合适的参数和方法。本文对通用分词和专用分词方法进行了比较和分析,提出了通用词库和专用词库相结合的分词和特征值提取方法。(3)设计并实现了航空ATA文本聚类模块,通过小规模算例试验验证了模型和方法的有效性。(4)对航空ATA智能编码原型系统进行设计和实现。

【学位名称】硕士

【学位授予单位】北京航空航天大学

【学位授予年度】2016

【导师姓名】张人千

【读秀链接】读秀链接

3 0
Rss订阅