基于订票行为的航空旅客划分方法研究

日期:2016.12.22 点击数:12

【类型】学位论文

【作者】杨倩倩 

【关键词】 prototypes 并行聚类,客户细分 航空旅客 客户行为 领域知识 k

【摘要】近年来,随着国内经济的高速发展,民航旅客的数量急剧增加,国内民航进入快速发展模式。各航空公司为了应对民航市场的激烈竞争,分析民航不同旅客群体的出行偏好,进而制定相应的竞争策略成为航空公司的迫切需求。为此,本文以航空旅客购票时记录的客户信息作为数据来源,采用聚类分析的方式,在对客户群体进行有效划分的基础上,分析航空旅客的出行偏好。与传统聚类算法分析的数值类型的数据不同,本文以记录航空客户订票行为的数据作为分析对象,其特殊性在于:首先,源数据为包含数值属性和分类属性的混合类型数据;其次,数据量庞大且分布存储于各航空公司。为此,本文通过改进现有聚类算法的方式使其适合于单一航空公司混合类型数据的聚类分析,从局部的角度分析单一航空公司的旅客出行偏好;进而设计分布式聚类算法,以同时利用不同航空的旅客信息,从全局的角度来分析民航旅客的出行偏好。因此,本文的研究工作主要包括以下两个方面:(1)本文以旅客订票过程中记录的相关信息为基础,将旅客群体划分归结为混合类型数据的聚类问题,采用k-prototypes算法来实现航空旅客群体的有效划分。同时,针对描述旅客购票信息的部分数据属性为离散值且类别众多、语义模糊的不足,借助于民航领域知识对属性数据进行转换表示,简化了属性数据的类别信息,显示表示属性数据中的隐含知识;同时通过构建旅客价值的定量计算模型,有效刻画旅客价值,从而在对航空旅客进行有效划分的基础上分析航空旅客的出行偏好。(2)为了有效处理大规模分布式混合数据集,本文通过扩展k-prototypes算法,以并行方式运行k-prototypes算法,结合领域知识,提出了面向领域的并行k-prototypes算法(Domain based Parallel K-prototypes,DPKP),使得各自航空公司的旅客划分和数据分析在各自站点完成,在提高算法运行效率的同时保护了航空公司的商业隐私。实验结果表明,本文提出的聚类算法适合对航空旅客数据的划分,不仅使得聚类结果的准确性有所提高,而且聚类的时间效率也有提升。最后本文利用国内航空公司提供的旅客数据集,结合本文提出的聚类算法,构建航空旅客细分模型,对旅客进行细分,同时根据细分结果分析不同旅客群体的出行需求,制定相应的营销策略,从而为航空公司提供了很好的战略建议。

【学位名称】硕士

【学位授予单位】江苏科技大学

【学位授予年度】2016

【导师姓名】生佳根

【读秀链接】读秀链接

3 0
Rss订阅