首页>
根据【作者:许奋旭】搜索到相关结果 1 条
-
基于遗传算法的K-means聚类算法在航空旅客细分中的运用
-
作者:
许奋旭
来源:
中山大学
年份:
2016
文献类型 :
学位论文
关键词:
means算法 遗传算法 GAK算法
客户细分 聚类 k
-
描述:
随着经济全球化的发展,企业之间的竞争日益激烈,而企业的经营模式也从原有的以产品为中心到以客户为中心转变,因而客户关系管理(CRM)成了各个企业研究的重点。客户细分是客户关系管理的一个重要组成部分,正确的客户细分能够使企业针对不同的客户提出不同的营销方式,有效地降低成本,同时获得更强、更有利可图的市场渗透。 目前我国航空业竞争激烈,保留旅客和发展新客户成了航空公司发展的战略重点。因此如何对航空客户进行划分,从而提供针对性的服务,成了航空公司一项重要的任务。本文的一个重要的工作就是根据航空旅客飞行记录的信息,利用k-means聚类方法对旅客进行分类。 k-means算法是最常用的聚类方法之一,但它存在容易陷入局部收敛和容易受初始值影响的缺点、,得到聚类的结果通常不是最优的,而遗传算法是模拟自然进化的一种随机搜索算法,它从总体上搜索假设空间,从而找到最优解。本文利用了遗传算法全局搜索的特点,提出了一种改进k-means的GAK算法,此算法由遗传算法的选择、交叉、变异算子和k-means操作步骤组成,遗传算子使得算法具有很强的并行搜索能力,而k-means操作提高了算法的搜索效率,该算法兼容了GA算法和k-means算法各自的优点。 为了验证GAK算法是否具有更好的聚类效果,本文考虑航空客户的消费额度、消费方式、消费习惯等因素,利用k-means算法和GAK算法分别对航空旅客进行分类。首先对旅客行为数据进行预处理,主要包括缺失值和异常值处理,属性子集选择。接着分别利用k-means算法和GAK算法对预处理的数据进行实验,通过实验结果得出两种算法的聚类评价指标值TWCV(总类内平方差在K确定的情况下其值越小聚类效果越好),发现在聚类数相同的情况下,GAK算法的TWCV值均优于k-means算法,从而验证了提出来的改进算法能够得到更好的聚类效果。