• 1.88 MB
  • 2022-05-17 10:55:04 发布

基于客户关系生命周期的顾客忠诚度研究——对移动通信行业的实证分析

  • 79页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
上海交通大学学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行分析工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的分析做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:方蕾日期:年月日2 上海交通大学学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权上海交通大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密□,在年解密后适用本授权书。本学位论文属于不保密□。(请在以上方框内打“√”)学位论文作者签名:方蕾指导教师签名:王金桃日期:年月日日期:年月日3 1绪论1.1论文分析的背景和意义随着消费市场竞争的日趋激烈与争夺顾客成本的提高,企业的经营目标已经由“产品质量”向“以顾客为中心”的战略转移,顾客忠诚管理应运而生。随着企业的市场营销模式已从注重交易向注重关系转变,对于顾客忠诚的分析不仅仅是顾客关系管理(CRM)理论界广泛关注的焦点问题,而且也是企业保持竞争优势的手段之一。1.1.1理论背景客户关系是公司最宝贵的资源,培育客户忠诚,与有价值的客户保持长期稳定的关系是公司获得持续竞争优势的关键。对于顾客忠诚的分析是从顾客满意的分析开始的。1965年,Cardozo首次将顾客满意的观点引入营销领域,提出了顾客满意会带动再购买行为。20世纪70年代初期,学术界开始对顾客满意开展了大量的分析。顾客满意理论分析的基本分析框架来自于Olshavsky和Miller(1972)等学者对以认知不协调理论为基础的期望不一致模型的分析,该模型认为:顾客在购买之前先根据过去经历、广告宣传等途径形成对产品或服务特征的期望,然后在随后的购买和使用中将感受到的产品和服务绩效同之前的期望进行比较,从而得出对该产品或服务的满意程度。顾客满意理论分析的兴起对企业市场行为产生了深远影响,进入80年代,顾客满意受到前所未有的重视,顾客满意成为了企业战略的一种重要手段。然而结果表明,在企业实践中,许多行业存在“顾客满意陷阱”现象,Reichheld(1996)的实证分析发现,在对公司产品满意甚至十分满意的顾客中有65%到85%的人会转向其他产品;汽车行业甚至高达85%-95%【1】,提高顾客满意并不能有效地维持顾客的重复购买行为。90年代后,学者们开始分析顾客满意和顾客忠诚的关系,一方面开始对顾客满意与顾客忠诚之间的关系展得出了一些结论,如Oliver,Bearden&Teel,Coyne等学者分析的结果证明客户满意与客户忠诚之间存在正向关系但并不存在线形关系:当客户满意上升到一定水平后,客户忠诚将急剧增加,而当客户满意下降到某点后,客户忠诚同样迅速下降。另一方面,关系营1 销理论的发展使学术界转向对客户关系价值、转换成本、客户生命周期的分析(Rust&Zahorik1993;Gremler&Brown1996),而对客户忠诚驱动因素及其作用机制的分析仍然很少,对客户忠诚策略的分析相对较多一些。与此同时,客户关系管理的另一个分析热点客户生命周期理论,也越来越引起学术界和企业的广泛关注。自20世纪50年代起,以生物进化论为基础的生命周期理论被用来解释一个主体从开始到消亡的发展过程,并被视为一种有效的理论工具,广泛应用于众多领域,尤其是在客户关系管理方面。它从动态的角度分析客户关系,将其引入客户关系的分析,可以清晰地洞察客户关系发展的时序特征,它是假设企业具备生产有市场潜力的产品和服务的能力的情况下,如何从广大的消费群体中甄别出目标客户,以及围绕着目标客户关系的建立、成熟和衰退这一生命过程。客户关系的发展是分阶段的,不同阶段驱动客户关系发展的因素不同,同一因素在不同的阶段其内涵不同;不同的阶段客户的行为特征和为公司创造的利润不同。因此客户生命周期理论的引入,对目标客户资源进行有针对性的动态管理,以期达到客户与企业的双赢。在我国,由于市场经济的发展,以市场为导向、以顾客为中心的营销理念成为主流,培育和维护忠诚的客户群体成为企业市场制胜的重要策略,准确划分客户不同生命周期阶段,对客户进行精确化营销,成为客户忠诚度管理的关键。对于顾客忠诚的分析,不仅需要借鉴西方学者的理论与实证结果,也要结合中国企业的实际情况,进行有益的探索和分析。1.1分析意义21世纪的企业必须意识到客户是企业所拥有的最宝贵的长期资产,能否有效留住客户关系到企业的生存和发展。企业面临的市场是瞬息万变的,这个变化首先来自客户的变化。在市场营销活动中,企业不可能将有限的的资源撒向所有客户,因此必须了解各种客户群在市场活动中的变化,对于客户进行越有价值的细分,就越能制定相应的营销策略,从而获得更大的盈利。这需要企业以首先必须以客户的需求为出发点,同时保证新增客户的质量与存量用户价值的最大化。考察生命周期不同阶段客户忠诚度的高低,不但丰富了客户忠诚的理论,也对于客户细分极具价值,因此深入的分析客户忠诚度及客户生命周期管理,具有重要的意义:1、提升客户忠诚是企业继续加快速度向前发展的必经之路。本文针对具体行业进行基于海2 量数据的数据挖掘,寻找到影响客户忠诚的因素,从而建立客户忠诚的度量模型,促进该领域在理论、方法和工具上的发展,为企业进一步提升客户的忠诚度,保持持续的竞争优势提供理论和方法上的支撑。2、有效识别生命周期不同阶段,客户忠诚的关键因素,实现客户关系管理差异化,精确化,为企业针对性开展营销活动提供理论支持。现代企业营销对差异化、精确化营销的要求越来越高,企业要争取的不再单单是数量上的增长,而是有价值、高价值客户等质量的增长。对于客户的获取也越来越追求利益与成本最优化平衡,针对不同因素、不同价值的、客户生命周期不同阶段的不同忠诚度级别的客户采取不同的忠诚度计划,正是对这一营销策略的有力支撑。3、通过对客户生命周期不同阶段客户忠诚的分析,将可以为企业带来更高的经济效益。研究表明:成功品牌的利润,有80%来自于20%的忠诚客户,而其他的80%只创造了20%的利润。基于客户生命周期理论的客户忠诚度分析不仅可以带来巨额利润,而且还可以降低营销成本,争取一个新客户比维持一个老客户要多花去20倍的成本。因此当前企业面临的一个迫切问题是提升客户忠诚度,吸引、维系、提升客户关系。1.1分析目标本文是基于上述的理论背景,在总结回顾国内外顾客忠诚理论发展和分析成果的基础上,以移动通信行业为具体的实证分析对象,采用数据挖掘技术,识别影响客户忠诚度的关键因素,结合生命周期理论,建立顾客的生命周期判定模型和忠诚度评分模型的问题。具体而言,本论文有如下分析目标:1、通过对国内外相关领域理论文献的梳理,了解关于顾客忠诚理论的有关概念,分类,进展等基本内容。2、选择移动通信行业为实证对象,通过深入了解行业背景和相关理论,构建客户忠诚度度量评分模型。3、对同批客户,应用决策树算法,构建顾客生命周期阶段判定模型。4、结合顾客所处生命周期的具体阶段和忠诚评分以及忠诚类型,提出有意义的顾客忠诚计划和建议。3 1.1分析方法和结构安排1.1.1分析方法如上文所述,客户忠诚管理是隶属于客户关系管理的一个分支。目前对客户关系的分析主要有两个视角:一是客户属性(特征)的分析,比如消费行为分析、消费心理分析,该视角是以客户自身为出发点的分析;二是客户分析对象的分析,是采用定性和定量的分析方法,以客户属性为基础和参照对分析对象的分析,比如客户满意度分析、利润率分析、客户忠诚分析、客户价值分析等。本文的分析过程中综合了这两种视角,采用了多种方法,可以概括为以下几类:1、综合运用多个学科知识深入理解并综合利用管理学、心理学和计算机科学及市场营销学等多学科知识,在文献研究基础上,明确分析方向,提出分析问题,从客户本身出发,把客户的心理、行为和营销理论有效的结合起来,并且吸收和借鉴国内外已有的分析成果,开展对客户忠诚度和客户关系生命周期的系统分析。2、定性与定量分析相结合在定量分析方面,本文采用客户的行为数据作为数据来源,采用因子分析的方法剥离对客户忠诚产生影响的重要因素,构建客户忠诚评分模型,运用数据挖掘中的决策树算法构建顾客生命周期阶段判定模型。1.1.2论文结构安排第一章绪论介绍了论文分析的理论背景和意义以及论文的相关分析方法和结构安排。第二章是对顾客忠诚及其相关理论的文献综述,这一部分主要介绍了顾客忠诚的内涵,分类,国内外关于顾客忠诚的相关理论介绍,顾客关系生命周期及关于顾客忠诚度的主要模型。第三章是模型构建的相关基础,介绍了实证分析的行业背景,调研方法,数据挖掘方法的介绍以及数据预处理部分。4 第四章是顾客忠诚度模型的构建部分,通过对于原始数据分析,构造有意义的变量,采用因子分析,从顾客忠诚的内涵入手,来构建顾客忠诚度模型。第五章是顾客关系生命周期判定模型部分,首先介绍了数据挖掘方法中的决策树算法,通过变量的构造及因子分析,应用决策树算法,来构建顾客关系生命周期判定模型。第六章是结果分析及相关应用,并指出了分析的不足和进一步的分析方向。1.1创新点本文以移动通信行业为实证分析对象,通过定量分析,将客户忠诚度和客户生命周期有机结合,来对客户进行更好的细分。本文的创新点如下:1、拓宽了顾客忠诚分析的视角,由于顾客忠诚是一个不可直接测量的客户属性,对客户行为数据的获得也往往是通过调查问卷进行调研。本文在界定客户忠诚内涵的基础上,采用系统记录的客户行为数据来构建模型,力争更准确的刻画顾客忠诚度。2、现有对于客户生命周期的分析大多数局限于定性分析,本文采用数据挖掘方法中的决策树算法来判定客户关系所处生命周期阶段,为客户生命周期管理,乃至于整个客户关系管理,提供了一种较有用的工具。5 2顾客忠诚及相关理论文献综述二十世纪九十年代以来,西方国家经济呈现出缓慢增长的趋势,企业面临的市场环境已经由卖方市场转向为买方市场,多数企业的市场竞争战略已经从产品转向服务,开始集中为对顾客的争夺,客户关系管理(CRM)成为了很多企业的基本商务战略。1.1顾客忠诚的内涵关于顾客忠诚的分析是客户关系管理中一个很重要的分析方向。对于顾客忠诚的分析是从服务经济领域开始兴起的,早期对顾客忠诚的概念理解主要集中在顾客的重复购买行为上(如Jacoby&Chestnut,1978),后来一些分析人员(如Dick&Basu,1994)认为,单单从行为上的定义无法有效区分顾客的真实忠诚和虚假忠诚,虚假的顾客忠诚可能由于顾客缺乏替代品,转换成本太高等而产生,因此他们主张结合顾客态度和顾客行为两个维度来综合评价顾客忠诚度。总结起来,关于顾客忠诚的内涵主要有以下几种理解:表2.1顾客忠诚内涵代表学者对客户忠诚的理解Jacoby,1978客户的一种行为偏好,这种行为偏好是由客户的心理或态度导致的Engel,J.F.,R.D.Blackwell在一段时间内,客户对某种产品表现出来的个人态度和行为andKollat,D.T.,1982上的优先反应Assael,1990;Keller,1993客户认同某种品牌所导致的,在很长一段时间内对该品牌的持久性购买Dick&Basu,1994伴随较高重复购买率的一种客户态度取向Wellington,1995经常向当前供应商重复购买产品,并较多发生重复购买Oliver,1997高度承诺在未来一贯地重复购买偏好的产品或服务,并因此产生对同一品牌或同一品牌系列产品或服务的重复购买行为,而且不会因为(市场)态势的变化和(竞争性产品)营销努力的吸引而产生转移行为资料来源:分析整理随着众多学者对于顾客忠诚分析的深入,可以看出,忠诚是消费者打算或倾向于对于同一家公司的再购买行为【2】,因此,它包含情感维度和行为维度。6 对于情感维度,忠诚代表了心里反应和对于某一产品或服务体验的确信,是指对产品或服务的一种偏好或依恋,是基于顾客的智力,知识结构等方面。行为维度是这一情感的表达,有时等同于客户保留。行为忠诚是指对产品或服务所承诺的重复购买行为,一般有三种测量维度,购买比例,购买频度,购买收益。就是说,忠诚包含潜在的行为和这种潜在的行为是否发生【3】,是指对企业的产品及其服务表现出高强度的信赖,并且不受市场及其他竞争者的影响经常性的重复购买某一产品的行为【4】。1.1顾客忠诚的分类目前学术界关于顾客忠诚的分类,主要有两种:一类是依据态度倾向的强弱和行为取向的高低两个维度的结合进行划分,另一类是依据顾客忠诚程度的深浅来划分,总结众学者对于顾客忠诚的分类分析中,大概存在如下几种划分方式:1、Dick&Basu的分类Dick&Basu把态度取向与行为取向结合起来分析,依据顾客重复购买的频度和积极态度的强度,把顾客忠诚分为四种状态【5】(如图2.1):态度取向忠诚者潜在忠诚者 高留恋虚假忠诚不忠诚者 低留恋高重复低重复行为取向图2.1顾客忠诚态度-行为矩阵其中每一种顾客类型的特征如下:忠诚者:意味着消费者对供应商的产品或服务具有高的再购率的同时,伴随着强烈的相对态度,忠诚强调这两种条件的同时实现。潜在忠诚:指消费者对某一品牌表现出强烈的相对态度,而购买很少或根本没有购买,这种情况的原因多来之消费者财力、时间等因素的短缺,也可能是供应商设置的障碍所致。7 伪装忠诚:被刻画为顾客虽有高的再购率,但对该产品或服务的态度却很弱,伪装忠诚有多种情况,可能是习惯性购买、价格诱人、或是垄断性产品等,这种情况下消费者对特定的供应商没有特别的偏爱。不忠诚:消费者对供应商的产品或服务既不偏爱,也很少购买。Dick&Basu认为真正的忠诚是顾客积极情感和重复购买行为的统一,因此企业在决策时,不仅仅要考虑如何吸引新客户,也要考虑如何挖掘潜在忠诚客户的价值以及通过挽留伪装忠诚的客户,使之转变为真正忠诚的客户。2、Jones&Sasser的分类Jones&Sasser从客户满意与客户忠诚的关系角度出发把客户忠诚分为忠诚者/传道者(高满意度,高忠诚度),背叛者/恐怖分子(低满意度,低忠诚度),惟利是图者(高满意度,低忠诚度)和人质客户(低满意度,高忠诚度)四个类别【6】。顾客满意度高惟利是图者忠诚者低背叛者人质客户低高顾客忠诚度图2.2顾客忠诚-满意矩阵传道者:是指对产品和服务非常满意的人,会向其他人推荐产品和服务。唯利是图者:尽管满意度很高,但为了谋求低价格而转换服务提供商的人。人质客户:指对产品或服务极不满意但是很少有其他选择的人。背叛者:有选择余地并利用每一次机会来表达对以前服务供应商的不满情绪,且转向其他供应商。Jones&Sasser的顾客忠诚分类法表明在实践中,顾客满意和顾客忠诚并不一致,因此企业可以根据顾客满意度和顾客忠诚度的实际高低状况,制定与实施相应的关系营销策略来管理顾8 客忠诚。3、SimonKnox的“忠诚度钻石”分类SimonKnox根据顾客购买的产品和服务的品牌数量和顾客的投入程度将顾客划分为忠诚者、习惯性购买者、多品牌购买者和品牌改换者【7】(图2.3)。高少忠诚者 的数量习惯性购买者多品牌购买者低多品牌改换者图2.3忠诚度钻石忠诚者和习惯性购买者往往只购买少数几个品牌的产品和服务,表现出较高的行为忠诚。因此,企业为这两类顾客服务往往最能获利。但是,忠诚者和习惯性购买者的购买方式不同。忠诚者的投入程度较高,愿意花费时间和精力与企业保持关系,甚至可能因为企业暂时没有他们需要的产品和服务而推迟购买;而习惯性购买者每次购买的产品和服务基本上没什么区别,他们之所以购买某个企业的产品和服务,是因为该企业能提供他们需要的产品和服务,而不是因为他们对该企业有深厚的感情。因此,忠诚者体现了情感和行为两方面的忠诚,而习惯性购买者只是行为上的忠诚。多品牌购买者和品牌改换者的购买行为比较相似,他们都购买多种品牌的产品和服务。企业为这两类顾客服务往往获利不多,但这两类顾客的购买动机很不相同。多品牌购买者积极寻找各种品牌的产品和服务,并且因在不同的消费场合而购买不同品牌的产品和服务。品牌改换者一般对价格优惠比较感兴趣,他们的购买策略是以最低的价格购买自己需要的产品和服务,会为了一点点的优惠价格而改购其他企业的产品和服务。4、KathleeenSindel的分类根据忠诚情感的来源,KathleenSindel把客户忠诚分为七类【8】(如表2.2所示):9 表2.2Sindell对客户忠诚的分类与举例类型特征案例垄断忠诚或者政府规定,或者产品特性决定客户别无选择微软公司的多数产品惰性忠诚客户由于惰性而不愿意去寻找其他供应商制造商总是从同一家供应商那里定购某一专门部件客户希望不断购买,但被公司的一些内部客户本希望再来购买,但是商家潜在忠诚规定或其他环境因素所限制只对消费额超过150$的客户提供免费送货方便忠诚仅仅由于方便而经常购买,类似于惰性忠诚地理位置的方便导致的客户重复购买价格忠诚价格敏感的客户对提供最低价的商家忠诚那些看不出面巾纸区别的客户总是购买最便宜的低巾激励忠诚公司为经常光顾的客户提供一些忠诚奖励。经常选择美国航空公司的旅客是为获得其所提供的免费飞行里程超值忠诚最有价值的感情或品牌忠诚,容易产生口碑效应客户不顾路途遥远也要到专卖店去购买“耐克”运动鞋资料来源:凯瑟琳.辛德尔著《忠诚营销》,北京:中国三峡出版社,2001年9月第1版1.1顾客忠诚相关理论1.1.1顾客满意根据科特勒的定义,顾客满意指客户通过对一个产品或服务的感知效果(或结果)与其期望值相比较后,所形成的愉悦或失望的感觉状态。如果可感知效果低于期望值,客户就会不满意;如果可感知效果与期望值相匹配的话,客户就满意;如果可感知效果超过期望,客户就会高度满意。顾客满意通常引起三种行为结果:口碑宣传,重复购买和品牌承诺。顾客满意度指数的分析是顾客满意理论中的热点,顾客满意度指数在很大程度上反映各行业的市场发展状况,并对企业确定未来发展方向具有决定性的参考价值。1989年,瑞典依据美国的顾客满意度理论和方法建立了顾客满意度指数测评体系SCSB(SwedishConsumerSatisfactionBarometer)。1994年,美国在基于SCSB的基础上也启动了一项全国性计划--美国顾客满意度指数ACSI(AmericanCustomerSatisfactionIndex)。随后,欧洲一些国家及部分亚洲国家也参照美国的方法相继建立了国家或地区顾客满意度指数测评体系,如ESCI(EuropeanCustomerSatisfaction10 Index)【9】。在我国,顾客满意度已经被列入为我国宏观质量指标体系中的一项指标,2005年5月,中国标准化分析院成立了“顾客满意度测评中心”,该测评中心的学术支持机构是清华大学,他们自主开发处中国顾客满意指数(CCSI)模型,该模型由顾客对产品的预期质量、感知质量、感知价值和顾客满意程度、忠诚度(顾客保持率)和顾客抱怨(投诉)等6个结构变量及相应的指标构成,这套体系对于该领域的分析有一定的借鉴意义【10】。因为客户满意和客户忠诚对于公司的长期生存和成长很重要,有许多分析已将注意力放在考察它们之间的概念和它们在客户保留及最终公司的绩效的影响上。顾客满意是顾客忠诚的必要条件,但是并不能导致重复购买或品牌忠诚(BloemerandKasper,1995【11】),也有一些分析表明质量,满意和基于意图的忠诚之间的关系(Dabholkaretal.,2000【12】;Olsen,2003【13】)认为它们之间的关系是正相关的,但是也会因为产品,行业竞争状况和情景因素而不同(Johnsonetal.,2001【14】;MittalandKamakura,2001【15】)。Martensen等人从交叉行业的角度(软饮料,银行和移动通信)检验了丹麦的ECSI模型,他们发现公司形象对于顾客满意和忠诚是一个重要的推动力,同时认识到质量是相对较弱的影响因素,在同一篇文章中他们讨论了客户满意和客户忠诚的关系,并且认为满意能引起忠诚【16】。Cassel在不同的欧洲国家和行业(包括移动通信,银行和零售业)检验了ECSI模型,也表明该模型在不同的条件下也是非常适用的【17】。Edvardsson检验了客户满意和忠诚对公司绩效(主要是利润)的影响,使用了SCS指数。他们的结论是在制造业,忠诚对于公司利润有着负影响,而在服务业,包括移动通信业,却有着正的影响【2】。1.1转换成本转换成本是指顾客在改变服务供应商时对所需时间,货币和精力的感知,它可以被视为维系顾客关系的重要保障,是保持顾客忠诚的重要因素(Fornell,1992)。消费者行为的经济模型指出顾客一般会对特定购买决策的成本和收益进行衡量比较,当某种行为的转换成本增加时,顾客从事该行为的可能性将减小。转换成本作为顾客忠诚的重要影响因素,分析的中心主要集中在转换成本对顾客满意和顾客忠诚调节作用上。Gremler和Brown(1996)分析指出服务产品的转换成本要高于有形产品 11 的转换成本。因此对于不同的行业转换成本是不同的,Yang&Peterson(2004)通过对电子业的实证分析中指出:顾客忠诚主要取决于顾客满意和感知价值,转换成本只在顾客满意和感知价值在平均水平以上才影响顾客忠诚【18】。因此,从顾客角度看,转换成本的大小取决于两个方面:一方面是顾客对当前企业的依赖程度;另一方面是顾客在当前关系中的已经发生的特定投资有多少,如果顾客对企业的依赖程度较大,顾客就会维持当前与企业之间的关系;而如果顾客对当前关系的特定投资较多,顾客也会倾向于维持当前的关系。因此,在企业实践中,通过管理顾客对转换成本的感知来培育顾客忠诚可以为企业制定和实施顾客忠诚计划提供一种较好的管理策略。1.1顾客忠诚的其他影响因素关于顾客忠诚的分析,目前主要有几个方面,一是继续深入各个行业的顾客忠诚实证分析,如MarcinPont,LisaMcQuilken分析了银行业中顾客群体,退休人员和大学学生这两个截然不同的细分市场中顾客满意与顾客忠诚的关系【19】,DavidW.Wallace分析了多渠道零售策略下的客户忠诚度【20】,近年来,电子商务的蓬勃发展创造了新的商业行为及经济模式,对于虚拟环境下的顾客忠诚的实证分析也成为一大热点【21-23】,二是关于影响顾客忠诚的驱动因素的分析,Ford(2003)分析了专业服务提供商的宣传行为对于客户满意和忠诚的影响,服务领域与医师,牙医,汽车机械和美容师不同,她发现消费者对宣传行为的感知对客户忠诚是有很大作用的【24】。Michael(2001)认为企业形象直接作用于顾客忠诚,有助于顾客简化购买决策,激励顾客重复购买【25】。JSingh,DSirdeshmukh讨论了信任机制和代理机制是如何在竞争和合作中长期影响顾客【28】忠诚的【26】。三是围绕顾客忠诚的一些相关概念的不断提出,持续顾客忠诚【27】,客户抱怨等。表2.3为对顾客忠诚的分析起了推动作用的学者的分析成果列表。对于客户忠诚方面的分析,国内学者更多的集中在客户满意与客户忠诚之间的关系分析。另一方面对客户忠诚的分析较为集中的是对客户忠诚影响因素的分析(韩经纶,2001;陈明亮,【29-32】),比较一致的结论是:客户感知价值,客户满意是推动客户忠诚的 2003;李怀祖2002等态度层面的驱动因素;品牌,认知风险,价格和社会规范等因素促进了客户行为层面上的忠诚;还有一些学者结合西方学者的分析成果,提出了各种忠诚模型及其内部结构变量之间的关系假设,同时结合具体行业展开了富有成效的实证分析【33-35】。 12 表2.3关于顾客忠诚的发展作者(年份)主要贡献JacobyandChesnut(1978)通过测量品牌忠诚的过程分为3类:行为,感知责任,二者综合DickandBasu(1994)分析集中于在社会规范和情景因素的条件下,相对态度和相对态度中的潜在购买者的重复购买。相对态度是消费者对于选择某种品牌而不选择另外一种的度量。真正的忠诚是具有高的相对态度的重复购买行为,将客户忠诚分为伪装忠诚,潜在忠诚,不忠诚和忠诚Christopheretal.(1993)对忠诚梯度的分析。从期待者、消费者、客户、支持者和拥护者这五个梯度来测量忠诚过程,这一过程需要在有交流的团体,责任和信任中的不断谈论,因而发展了消费者基于包括对话在内的经验的态度BaldingerandRuben(1996)认为顾客忠诚是一个复合过程。通过行为和态度数据来预测客户忠诚Hallowell(1996)考察收益,客户满意和客户忠诚之间的联系O’Malley(1998)忠诚计划的效用Raju(1980)在消费者行为范围探索趋势中扩大了测量忠诚的范围Beattyetal.(1988)在假设承诺与忠诚相似的基础上,扩大了测量承诺这一范围,包括能反映出自我,购买和品牌承诺Pritchardetal.(1999)运用心理责任方法将顾客忠诚定义为承诺忠诚GremlerandBrown(1999)将顾客忠诚概念扩大为对无形产品的服务忠诚。对他们做了十二维度测量,用七个分值来描述完全同意和完全不同意之间的范围Oliver(1999)强调了情景因素的影响。在前人分析基础上提出顾客忠四阶段模型,特别加上了第四个行动阶段Jonesetal.(2000)进一步将顾客忠诚确定为认知忠诚,包括在购买发生之前,消费者意识中选择某一品牌的做决定过程,可以认为是更高维度的忠诚。认知忠诚中转换/再购买意图,认为忠诚不仅是满意,更是预期目的的行为分析KnoxandWalker(2001)对于零售业品牌的实证分析,提出顾客忠诚的测量方法。认为品牌承诺和品牌支持对于顾客忠诚是非常必要的。将忠诚分为忠诚者,习惯者,不断寻找者和转换者。对于成熟品牌而不是新兴品牌提出了指导资料来源:RosalindMcMullanAmultiple-itemscaleformeasuringcustomerloyaltydevelopment.TheJournalofServicesMarketing;2005;19,6/7p470-48113 1.1顾客忠诚价值忠诚的客户带给企业的价值有可能是有形状的,也可能是无形的。有形的利益是因为将产品与服务销售给顾客所产生的,也就是实际销售获得的金钱价值。无形的利益包括在实际交易之外与客户互动所带来的信息和口碑效应。在不同的企业中,忠诚客户的价值也不同。但是总体来说忠诚客户可以带来以下的价值【37】:1、节约客户成本客户忠诚可以减少客户成本的支出,这主要表现在两方面:其一,当客户逐渐熟悉一个企业后,就会学着充分利用它,之后,就不会因为要求企业提供原本不提供的服务而浪费时间。其二,客户忠诚的成本效益还反映在长期客户和长期员工之间的相互交往及互相学习上。如果双方都对自己得到的价值很满意,必然会促进更进一步的关系,使公司的效益提高。2、基本利润企业通过客户的购买活动可以获得利润,这些利润反映在会计记录中就是收入与成本之差。除了少数情况外,客户支付的价格要高于公司的成本,其差额就是基本利润,而这一利润并不受时间、忠诚、效率或任何其他因素的影响。因此,如果客户留住时间越长,赢得这个基本经济利润的时间也越长。3、忠诚客户的附加利润忠诚客户的附加利润反映在交叉销售和向上销售方面,交叉销售是指向一位客户销售多种相关度的产品或服务。这位客户必须是可以追踪了解的客户,这又与销售场地、品牌、服务提供商等有很大关系。向上销售是基于客户忠诚的基础进一步挖掘每一位客户的价值,从长远来看,一位客户的价值是终身购买量的折现价值,因此企业应当尽量挽留客户,并不断实现客户的产品购买。4、口碑效应忠诚客户会向其他人推荐企业的产品,在这样的基础上,新客户往往与老客户的需求特点相似,使的企业不需要通过复杂的细分技术就可以轻易地获取合适的目标客户。5、战略价值战略价值代表的是客户可能与企业进行的潜在业务,如果企业的战略调整能使客户改变行为14 方式,企业就可能获得更高的利润,也可以使竞争对手的业务转变为本企业的业务,在企业发展壮大后,客户有贡献更多价值的潜力。1.1顾客关系生命周期在管理中,生命周期被广泛用于解释一个主体从开始到结束的发展过程,如组织生命周期、产品生命周期等,一个生命周期通常包括诞生、生长、成熟、衰退或死亡等阶段。客户关系生命周期是指当一个客户开始对企业进行了解或企业欲对某一客户进行开发开始,知道客户与企业的业务关系完全终止且与之相关的事宜完全处理完毕的这段时间。目前这方面分析中,Dwyer和Schurr的分析最具代表性,他们提出了买卖关系发展的一个五阶段模型,首次强调,买卖关系的发展是一个具有明显阶段特征的过程。这一观点被广泛接受,取代了当时盛行的把交易完全看做离散事件的观点。为了揭示客户利润的变化趋势,需要考察客户关系发展的动态特征,因为客户关系的发展是分阶段的,不同阶段客户的行为特征是不同的,因而为公司创造的利润也是不同的。生命周期理论是一个可以清晰地洞察客户关系发展的动态特征的有用工具。这里以Dwyer等人的五阶段模型为基础,将客户关系的发展分为考察期,形成期,稳定期和退化期四个阶段,各个阶段具有相应的特征【38】。1、考察期,关系的探索和试验阶段。信息的不对称或者信息匮乏是这个时期的主要特征。企业要主动地寻求客户信息并且为客户提供企业的信息,保证信息渠道的通畅,在这一阶段客户会下一些尝试性的订单,企业与客户开始交流并建立联系。因客户对企业的业务进行了解,企业要对期进行相应的解答,某一特定区域内的所有客户均是潜在客户,企业投入是对所有客户进行调研,以便确定出可开发的目标客户。此时企业只能获得一些基本的收益。2、形成期,关系快速发展阶段。双方关系进入这一阶段,表明在考察期双方相互满意,企业与客户之间的了解和信任不断加深。在这一阶段,双方从关系中获得的收益日益增多,相互依赖的范围和深度也日益增加,逐渐认识到对方有能力提供令自己满意的价值和深度也日益增加,逐渐认识到对方有能力提供自己满意的价值和履行其在关系中担负的职责,因此,愿意承诺一种长期关系。在这一阶段,15 随着双方了解和信任的加深,关系日趋成熟,双方的风险承受意愿增加,由此双方交易不断增加。当企业对目标客户开发成功后,客户已经与企业发生业务往来,且业务在逐渐扩大,此时已进入客户成长期。企业的投入与开发期相比要小的多,主要是发展投入,目的是进一步融洽与客户的关系,提高客户的满意度、忠诚度,进一步扩大交易量。此时客户已经开始为企业做贡献,企业从客户交易中获得的首日已经大于投入,开始赢利。但客户尚未产生交叉购买意图及推荐倾向,所以企业获得的是基本购买收益和增加购买收益。3、稳定期,关系发展的最高阶段。双方对对方提供的价值高度满意,企业与客户的关系处于一种相对稳定的状态,交易数量变动较为温和。在这一阶段,双方或含蓄或明确地对持续长期关系做了保证。这一阶段有如下明显特征:大量的交易;双方对对方提供的价值高度满意,为能长期维持稳定的关系,双方都做了大量有形和无形投入。因此,在这一时期双方的交互依赖水平达到整个关系发展过程中的最高点,双方关系处于一种相对稳定的状态。此时,企业的投入较少,客户为企业作出较大的贡献。在这一阶段,客户忠诚度增加,开始出现交叉购买及推荐行为,除了获得基本购买收益和增加购买收益外,企业还可以获得交叉销售收益及推荐收益,其中推荐收益表现为新客户开发成本节约。客户影响越大,推荐收益越多。4、退化期,关系发展过程中关系水平逆转的阶段。关系的退化并不总是发生在稳定期后的第四个阶段,实际上,在任何一阶段关系都可能退化。引起关系退化的可能原因很多,如一方或双方经历了一些不满意、需求发生变化等。退化期的主要特征有:客户关系的边际收益呈现下降趋势,甚至将为0.企业维系客户的成本明显增大,伴随着很大的内耗。企业与客户之间的满意度降低直至出现不满意,需求弱化,交易量降低。此时,企业有两种选择:一种是企业加大对客户的投入,重新恢复与客户的关系,进行客户的二次开发;另一种做法便是不再与企业发生过多的投入,渐渐的放弃这些客户。当企业的客户不再与企业发生业务关系,且企业与客户之间的债权债务已经理清时,意味着客户生命周期完全终止。16 生命周期阶段A阶段B阶段C阶段D阶段名称考察期形成期稳定期退化期图2.4典型客户关系生命周期在这四个阶段中,考察期是客户关系的孕育期,形成期是客户关系的快速发展期,稳定期是客户关系的成熟期,退化期是客户关系水平发生逆转的时期。考察期、形成期、稳定期客户关系水平依次增高,稳定期是供应商期望达到的理想阶段,但客户关系的发展具有不可跳跃性,客户关系必须经过考察期、形成期才能进入稳定期。退化期是客户关系的逆转阶段,关系退化并不总是发生在稳定期,而是可能发生在考察期、形成期、稳定期三个阶段的任一时点。1.1顾客忠诚度的主要模型随着学术界对顾客忠诚理论的不断深入以及对不同行业实证的分析,产生了许多顾客忠诚的实证分析模型。下面介绍几种比较经典的顾客忠诚理论模型,对本文观测变量的选取及模型构建都有十分重要的借鉴意义。1、欧洲顾客满意指数(ESCI)模型ESCI是包含多个潜变量的结构方程模型,在该模型中,顾客的感知质量被划分为两个结构变量:“硬件要素”主要指产品或服务属性的质量构成,“人性要素”指企业在服务中与顾客的互动要素,通常指个人行为和服务环境的氛围。从该模型可以看出,企业形象,顾客满意,感知质量(人性要素)是顾客忠诚的决定因素。ESCI模型中的7个潜变量分别被2至5个观测变量解释。17 企业形象顾客期望感知价值顾客满意顾客忠诚感知质量:硬件要素感知质量:人性要素图2.5ESCI模型【39】,模型对不同产业具有较强的适应性,因此在1999 从实践来看,ECSI的应用情况比较好年以后,ECSI模型在电信服务、金融服务、超市和食品加工等其它产业得到了广泛的应用。2、网络环境下的“信任-态度-忠诚”模型【40】等人建立了网络环境下的“信任-态度-忠诚”理论模型,并且验证 HsipengLu(2002)了内容、情境和基础设施在决定网络环境下顾客忠诚的重要性。他们的分析是在大样本调查的基础上得出,该模型表明,顾客对于网站的内容,情景和基础设施的信任不但会直接影响顾客忠诚,还会通过顾客态度来影响顾客忠诚。内容-信任情景-信任顾客态度顾客忠诚基础设施-信任图2.6信任-态度-忠诚”模型18 3、客户忠诚动态模型陈明亮(2003)认为客户忠诚的培育需要经历一个从低级向高级不断发展的过程,并且这一过程具有明显的生命周期特征【41】。可持续忠诚完全满意与信任价值的公平性比较 稳定期高度满意高度信任精神忠诚价值的外部比较行为忠诚 形成期一系列重复购买一系列满意信任基本信任一系列满意一系列重复购买满意考察期期望价值购买价值的内部比较图2.7客户忠诚动态模型该模型是一个描述性的模型,认为客户忠诚是不断驱动的动态过程,客户价值是客户保持的决定因素,客户满意和客户信任是派生因素,客户满意的基础是客户价值,持续的客户满意产生客户信任,客户满意和客户信任是客户价值迈向客户忠诚途中的两个重要里程碑,并且在客户关系生命周期的不同阶段,客户表现出不同的忠诚水平:考察期表现为基本信任、形成期表现为行为忠诚、稳定期表现为精神忠诚和可持续忠诚。可持续忠诚是客户忠诚的最高形态,但是是在低级客户忠诚的基础上逐渐发展起来的,是客户关系发展到高级阶段的产物。19 3模型构建相关基础1.1行业背景所谓移动通信【42】,是指在移动中或停留在非特定位置的移动用户与固定用户(包括市话用户和长途用户)或移动用户与移动用户之间进行的信息交换。移动用户是指在车、船上等装有无线设备或拥有便携式(或手持式)无线设备可在行进中或停留在非特定位置时进行通信的用户。移动通信是当前全球发展最快的领域之一,创造了庞大的用户数、惊人的产业规模和丰厚的利润。在我国,信息经济和互联网产业的迅猛发展,为通信设备制造业提供了难得的发展机遇和巨大的发展空间,使其成为目前发展速度最快的行业之一。从2005年开始,移动的用户总数已经开始超过固定网,而且这个差距越来越大。中国电信市场2007年第2季度移动用户和宽带用户持续快速增长分别至4.84亿和4931万;电信和网通和固定电话用户数缓慢增长至3.396亿;在整个中国电信市场依然旺盛增长的情况下,中国移动电话普及率刚刚达到37%,移动电话新增用户量依然在持续走高,并且这种高速的发展趋势还至少可以持续两年【43】。2007年第2季度除固定语音业务收入外,所有中国电信业的各项收入都持续在上升,尤其是固网增值业务和移动分组数据业务的同比增长率分别为34%和55%。从数据可以看出,由于语音业务资费的不断下降,运营商不断加强对于增值业务的发展,以维持和提高现有用户的ARPU值,其中,移动运营商特别重视可平滑过渡到3G业务的移动分组数据业务的发展。伴随3G牌照发放的移动通信业重组、运营商由传统移动通信服务向综合信息提供的战略转型,将打破中国移动通信业近几年来相对稳定的市场格局。随着用户数量的大幅增长,在今后一段时间内新增用户市场将逐渐减小。移动通信业正处于一个发展速度和经济效益慢慢协调发展的阶段。转型过程中运营商将不可避免地遇到收入下滑的情况。首先,固网新增用户逐年下降,已经有负增长的趋势出现;其次,移动网用户的高速增加也导致大量低ARPU用户涌入【44】。目前我国移动通信服务行业的市场格局是双寡头(中国移动与中国联通)垄断,也由于我国移动通信行业较早时期一直处于垄断状态,所以那时的移动通信行业并不担心客户会流失,那是20 一种单纯的卖方市场的买卖关系。因此市场份额是决定企业盈利能力的最重要因素之一。移动通信企业更是长期将市场占有率作为考核企业绩效的重要标准。但随着技术的进步及独家垄断的市场格局被打破,移动通信企业单纯依靠“量的扩张”已经不能再获得高额的垄断利润,近年来,随着全国移动用户的迅猛增长,两家运营商的市场用户数均呈上升态势,但两家运营商的ARPU值(每月每户平均话费)却全都呈现出下降的趋势。这表明,移动通信服务行业的盈利空间已出现缩小迹象。大量非移动运营商通过颠覆性的互联网业务模式准备进入市场,并可能成为对目前移动客户有吸引力的替代选择【45】。提高创新和产品开发周期的速度,加之研发投资向非传统厂商倾斜的趋势,可能使现有运营商发展势头减弱并进一步对现状造成挑战。由于竞争激烈,获得新客户的成本也越来越高。加入WTO以后,国内移动运营商与外资等相比,最大的优势是原本已经拥有的客户。因此如何保留住既有客户,促进客户资产的最大化就成为企业的基本战略目标,有针对的进行用户维持可以大大增加用户的忠诚度和购买率,促进企业利润的提升,以及如何由这些客户获得最大的收益,成为移动通信企业重要的课题。1.1调研方法关于顾客忠诚的调研方法,是需要运用科学的测量方法和技术手段,广泛调查汇集有关顾客忠诚的信息资料,并加以定性和定量的分析。为使结果具有高信度和高效度,在调研过程中必须遵循客观性、代表性、时效性、广泛性等基本要求。主要的方法有态度测量法,自由反应法,现场观察法等【46】。1、态度测量法又称问卷法,即通过被测者对预先拟定问卷的回答,了解顾客对某一类商品或服务的态度。运用态度量表的关键是合理设计问卷。问卷一般由反应测量内容的若干条陈述性题目构成,个体按照被测量者的反应范围或程度以分数或量值,最后根据得分设计情况来得出最后结论。问卷的具体设计方法又分两种。(1)瑟斯通(L.I.Thurstone)量表法该方法的特点是以等间隔方式拟定有关事务的题目,使问题按照强弱程度成为一个均衡分布的连续系统,并分别予以赋值。然后让被测者任意选择自己所统一的题目。主测者根据被测者所21 选题目的量值,来确定其态度的倾向及强弱程度。得分越高表明态度的强度越高。(2)利克特(R.A.Likert)量表法利克特量表法是美国心理学家利克特在瑟斯通量表的基础上,设计出的一种更为简便的态度测量表。该表同意使用陈述性语句提出有关态度的问题,但不将题目按内容强弱程度均衡分解为若干个连续系列,而是仅采用肯定或否定两种陈述方式。然后要求被测者按照同意或不同意的程度作出明确回答,供选择的态度在量表用定性词给出,并分别标出不同的量值。程度的差异一般可作5级-7级划分。以上两种方法各有优缺点。瑟斯通量表法可以比较详尽地给出供选择题目,准确反映态度倾向的细微差异,因而对于复杂态度的测量具有良好效果。但是该表的测量程序比较复杂,对陈述项目的分类标准难以把握,因而在一定程度上削弱了其实用价值。相比之下,利克特量表法较为简单明确,易于得到被测者的配合,且包容量大,可以同时测量顾客对多方面问题的态度,因而在实际测量中得到了广泛的认可和应用。2、自由反应法自由反应法是通过自由反应方式了解顾客态度中认知成分的一种方法。一般可采取访谈,投射等方式进行。访谈即测量者与被测量者面对面的交谈。交谈形式可以是问答式的,也可以是谈论式的。无论采取何种形式,主测者都应注意不给被测者提供任何可能的答案,也不进行任何提示或暗示,而让被测者在完全松弛和无约束状态下自由的回答问题,表达自己的想法和意见。通过被测者的自由问答,往往可以了解到他们的认识水平和真实态度。投射是设置一些没有明确指向的刺激物,任被测者自由推测和联想,以便从中发现他们的态度倾向。常用的刺激物有无主题的图画,物结尾的故事,未完成的句子等。利用看图说话,语句完成等方式,往往可以发现被测者自然流露的真实态度倾向。运用投射法要求主测者具有一定的专业技能,否则难于对测量结果作出正确分析,因而在应用范围上受到一定限制。3、现场观察法在一定意义上,顾客的态度是其行为的心理准备状态,行为则是顾客态度的外在表现。现场观察法就是利用态度和行为的这种相关关系,通过各种场合直接观察顾客的行为表现,用以判断顾客态度的一种测量方法。现场观察的场合可以在集体场所,也可以深入到个人生活环境中。为22 使顾客的行为不受干扰,观察者应尽量避免暴露身份或给以环境刺激,如显示测量者身份,进行现场拍摄等。关于顾客忠诚的调研方法,前两种方法更偏向于反映顾客在态度上的倾向,并不能观察到客观的顾客行为,事实上,在顾客关系管理实践中,经常出现这样的情况:顾客可以高度评价某种产品的质量或服务,但是在行为上却并没有观察到对该产品的消费行为,而且前两种方法对于问卷的设计或访谈的客观性有较高要求,在实践中有一定难度。本文所采取的方法是基于顾客行为的数据,在此基础上通过因子分析来构建顾客在情感和行为两个维度的变量,试图更加客观的来构建顾客忠诚度模型及顾客关系生命周期判定模型。1.1数据挖掘概述本文在定量分析建模过程中大量运用了数据挖掘技术,数据挖掘是一门上世纪末刚刚兴起的前沿交叉学科,从数据库中发现知识(KDD,KnowledgeDiscoveryinDatabase)首次出现在1989年举行的第十一届国际联合人工智能学术会议上。到目前为止,由美国人工智能协会主办的KDD国际研讨会已经召开了8次,规模由原来的专题讨论会发展到国际学术大会,分析重点也逐渐从发现方法转向系统应用,注重多种发现策略和技术的集成,以及多种学科之间的相互渗透。由于数据挖掘是KDD过程中最为关键的步骤,在实际应用中对数据挖掘和KDD这两个术语的应用往往不加区别【47】。1.1.1数据挖掘定义数据挖掘(DataMining)在学术界和商业界应用中有不同的定义。从学术上定义就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,或者称为KDD。从商业角度而言,数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。简而言之,数据挖掘其实是一类深层次的数据分析方法。数据分析本身已经有很多年的历史,只不过在过去数据收集和分析的目的是用于科学分析,另外,由于当时计算能力的限制,对大数据量进行分析的复杂数据分23 析方法受到很大限制。现在,由于各行业业务自动化的实现,商业领域产生了大量的业务数据,这些数据不再是为了分析的目的而收集的,而是由于纯机会的(Opportunistic)商业运作而产生。分析这些数据也不再是单纯为了分析的需要,更主要是为商业决策提供真正有价值的信息,进而获得利润。但所有企业面临的一个共同问题是:企业数据量非常大,而其中真正有价值的信息却很少,因此从大量的数据中经过深层分析,获得有利于商业运作、提高竞争力的信息,就像从矿石中淘金一样,数据挖掘也因此而得名。因此,数据挖掘可以描述为:按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法【48】。1.1数据挖掘与传统数据分析的区别将数据挖掘与传统的数据分析的进行比较(见表3.1),可以发现传统数据分析工具的分析重点在于向管理人员提供过去已经发生了什么,描述过去的事实。而数据挖掘最吸引人的地方是能够建立预测型而不是回顾型的模型。从两者进行分析时所需要的数据量来看,传统的数据分析需要的数据量并不大,而数据挖掘则需要海量数据才能运行。两者的启动方式也有较大的差别,前者主要依靠各种人员启动,后者则依靠数据本身和系统来启动。数据挖掘所得到的信息应具有先未知,有效和实用三个特征。表3.1传统数据分析工具与数据挖掘工具的比较传统数据分析工具数据挖掘工具工具特点回顾型的、验证型的预测型的、发现型的分析重点已经发生了什么预测未来的情况、解释发生的原因分析目的从最近的销售文件中列出最大客户锁定未来的可能客户,以减少未来的销售成本数据集大数据维、维中属性数、维中数据均数据维、维中属性数、维中数据均是小是少量的庞大的启动方式企业管理人员、系统分析员、管理数据与系统启动,少量的人员指导顾问启动与控制技术状况成熟统计分析工具已经成熟,其他工具正在发展中资料来源:数据仓库与数据挖掘技术陈京民等编著电子工业出版社2002.524 这两种数据分析工具的差别,根源在于探索数据关系时所采用的方法不同。传统的数据分析工具是对过去情况的验证,而数据挖掘技术则是基于发现型的、预测型的,运用模式匹配等各种算法对数据之间的关系进行挖掘。1.1数据挖掘分析的内容数据挖掘所发现的知识,最常见的有以下四类【48】:1、广义知识(Generalization):广义知识指类别特征的概括性描述知识。根据数据的微观特性发现其表征的、带有普遍性的、较高层次概念的、中观和宏观的知识,反映同类事物共同性质,是对数据的概括、精炼和抽象。2、关联知识(Association):它反映一个事件和其他事件之间依赖或关联的知识。如果两项或多项属性之间存在关联,那么其中一项的属性值就可以依据其他属性值进行预测。最为著名的关联规则发现方法是R.Agrawal提出的Apriori算法。关联规则的发现可分为两步。第一步是迭代识别所有的频繁项目集,要求频繁项目集的支持率不低于用户设定的最低值;第二步是从频繁项目集中构造可信度不低于用户设定的最低值的规则。识别或发现所有频繁项目集是关联规则发现算法的核心,也是计算量最大的部分。3、分类知识(Classification&Clustering):它反映同类事物共同性质的特征型知识和不同事物之间的差异型特征知识。最为典型的分类方法是基于决策树的分类方法。它是从实例集中构造决策树,是一种有指导的学习方法。该方法先根据训练子集形成决策树,如果该树不能对所有对象给出正确的分类,那么选择一些例外加入到窗口中,重复该过程一直到形成正确的决策集。最终结果是一棵树,其叶结点是类名,中间结点是带有分枝的属性,该分枝对应该属性的某一可能值。最为典型的决策树学习系统是ID3,它采用自顶向下不回溯策略,能保证找到一个简单的树。算法C4.5和C5.0都是ID3的扩展,它们将分类领域从类别属性扩展到数值型属性。本文在构建判定客户生命周期阶段的模型过程中,使用了决策树算法。4、预测型知识(Prediction):它根据时间序列型数据,由历史的和当前的数据去推测未来的数据,也可以认为是以时间为关键属性的关联知识。目前,时间序列预测方法有经典的统计方法、神经网络和机器学习等。1968年Box和Jenkins提出了一套比较完善的时间序列建模理25 论和分析方法,这些经典的数学方法通过建立随机模型,如自回归模型、自回归滑动平均模型、求和自回归滑动平均模型和季节调整模型等,进行时间序列的预测。由于大量的时间序列是非平稳的,其特征参数和数据分布随着时间的推移而发生变化。因此,仅仅通过对某段历史数据的训练,建立单一的神经网络预测模型,还无法完成准确的预测任务。为此,人们提出了基于统计学和基于精确性的再训练方法,当发现现存预测模型不再适用于当前数据时,对模型重新训练,获得新的权重参数,建立新的模型,也有许多系统借助并行算法的计算优势进行时间序列预测。1.1数据挖掘过程数据挖掘是一个交互与反复的过程,设计客户决策的许多步骤,开始于问题定义,终止于结果分析,并利用结果进行策略规划获得竞争优势,具体过程如下【49】:1、理解和发展客户的应用区域、目标以及相关知识。2、创建目标数据合集,挑选一个数据合集,或者集中于数据样本或变量样本的自己,在此基础上进行后续流程。3、数据预处理和清洗,涉及基本的操作,如隔离噪声、收集必要信息来建模或解释噪声、处理丢失信息领域的策略制定、解释信息以及已知变化的时间序列。4、数据转换和归纳,包括数据归纳和数据映射。依靠任务目标来寻找有用特征表示数据。利用多维归纳或转换方法来减少变量的有效数目。5、选择数据挖掘任务,包括数据挖掘目标的确定:寻找相关规则,聚类(clustering)、分类(Classification)、排序(Sequencing)和预测(Forecasting)。6、挑选数据挖掘算法:选择方法来搜索数据模式,或者寻找适合数据的模型,包括确定合适的模式与参数。7、数据挖掘,通过应用一个或多个数据挖掘算法来创建表示数据的最佳模型。8、解释和评估。查看第7步的输出结果来确定发现的知识是否有用,并决定是否用新的属性或实例重复前面步骤。9、知识表示:使用可视化知识表示技术,向用户提供挖掘知识。26 1.1数据挖掘工具—SAS简介1、数据挖掘工具介绍由于数据挖掘在各个领域的卓越表现,许多公司已经推出了专门的数据挖掘工具,如IBM的IntelligentMiner,ThinkingMachines的Darwin,NeoVistaSolution的DecisionSeries,等;另外,很多数据库管理系统或者统计软件也增加了支持数据挖掘的功能,如SQLServer2000,Oracle,SPSS/Clementine及SAS/EnterpriseMiner等。【50】2、SAS软件的主要数据挖掘模块在数据处理与统计分析领域,SAS系统己成为国际上的标准软件,它在数据挖掘领域的成就是有目共睹的,公司将数据挖掘定义为“数据挖掘是按照既定的业务目标,对大量的企业数据进行探索、揭示隐藏在其中的规律性并进一步将之模型化的先进、有效的方法”。它的主要数据挖掘模块如下:(1)SAS/BASESAS/BASE模块是SAS系统的核心,承担着主要的数据管理任务,并管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。也就是说,SAS系统的运行,首先必须启动BASESAS模块,它除了本身所具有数据管理、程序设计及描述统计计算功能以外,还是SAS系统的中央调度室。它除可单独存在外,也可与其他产品或模块共同构成一个完整的系统。各模块的安装及更新都可通过其安装程序非常方便地进行。(2)SAS/STATSAS/STAT提供的统计分析功能包括:方差分析;一般线性模型(包括因素分析,方差分量模型,混合模型等);回归分析(包括一般回归,Logistic回归等)多变量分析(包括主成分分析、因子分析和典型相关分析等);判别分析;聚类分析;生存分析等共四十多个过程。(3)SAS/EnterpriseMinerSAS/EM提供全面的数据挖掘算法:聚类分析、SOM/KOHONEN神经网络分类算法、关联模式/序列模式分析、多元回归模型、决策树模型(C4.5,CHAID,CART)、神经网络模型(MLP,RBF)等。SAS/EM是一个自动化程度很高的挖掘工具,它提供“抽样-探索-转换-建模-评估”27 (SEMMA)的方法论,方便的处理流程组织、完美的报表和图形分析结果,以引导用户的全过程。SAS/EM的图形化用户接口和自动化的流程,使得用户不一定要深入了解这些算法。统计背景较少的业务人员,经过短期培训,就可以按照SEMMA的流程进行分析挖掘,分析专家也可以使用图形化界面,深入细致地调整分析过程,获得更好的效果。3.4数据准备1.1.1数据来源及规模在模型构建的过程中,数据样本规模对最终模型的结果会有较大的影响,样本量过少,会使模型分析结果的信度降低。本文抽取了x省x地区移动X品牌2005年7月10%的在网用户(共计77972条记录)作为建模对象,连续18个月(2004年1月—2005年7月)至少有一个月有消费的行为数据,包括账单、话单、客户属性等基本信息,根据业务问题分析,与挖掘任务相关的因素主要包括客户的行为因素和人口统计因素两大方面,具体如下:1、人口统计信息基于客户人口统计学等社会学属性的分析,对企业营销决策很有价值。但由于基础数据缺乏,决策分析所需要的客户社会学属性包括地理因素、人口因素、心理因素等很难取得,因而需要通过各种方式和渠道收集这些数据。目前,主要有两种方法解决这个问题:一是对客户进行普查,其工作量和难度相当大;二是通过积分奖励等措施搜集部分高消费客户的社会属性资料。人口统计资料主要包括姓名、年龄、性别、职业、用户归属地、是否具有固定电话等。2、客户的行为因素客户行为是与销售策略的制定和实施密切相关的。在建模时主要分析的客户行为特征包括基本信息、支付信息、呼叫特征、投诉信息、产品组合特征、财务信息、移动性等几大类的数据信息。(1)基本信息包括:用户标识、姓名、电话号码、客户支付方式、号码使用时长、当前资费套餐、入网时的资费套餐、用户曾经拥有的资费套餐、用户等级类型、上次更换套餐时间距28 离现在的天数、最近一次停机时间、过去是否升降级套餐等。(2)支付信息包括:预付金额、预付次数、是否曾达到0金额、付费的间隔天数、付费方式、查询话费次数、拖欠天数、呼叫限制次数、被停机次数及原因、是否被停机、是否被限制呼出、欠费金额等。(3)产品组合信息包括:使用的服务数量、弃用的服务数量、是否激活漫游或长途、是否激活彩铃功能、使用增值业务的数量、是否激活了亲友优惠、是否激活了小秘书功能、是否为IP优惠套餐、资费套餐的月租类型等。(4)投诉信息包括:投诉次数、解决的投诉次数、关于服务投诉次数、关于技术的投诉次数、投诉帐单的问题次数、关于增值业务的投诉次数、最近一次投诉时间等。(5)财务信息包括:收入(ARPU)、月租、非语音业务收入、拨打收费特殊电话号码的收入、语音业务的收入、短信收入、主叫收入、被叫收入等。(6)语音呼入特征:呼入次数、呼入时长、国内外长途次数、时长、被叫固话用户次数和时长、被叫移动用户次数和时长、被叫网通用户次数和时长、被叫CDMA次数和时长、工作日通话次数和时长、忙闲时通话次数和时长等。(7)语音呼出特征:呼出次数、呼出时长、呼叫其他网络的次数和时长、本地呼叫次数和时长、网内通话次数和时长、拨打长途的次数和时长、主叫收费特服号码的次数和时长、IP呼叫次数和时长、漫游使用次数和时长等。(8)非语音呼叫特征:发送短信条数、接收短信条数、发送彩信条数、接收短信条数、是否使用彩铃、是否使用GPRS、使用短信特服号码的个数等。1.1数据预处理和清洗由于数据来源、规模、采集手段等多种原因,使得积累和收集的数据可能会偏离数据本身具有的真实特性,即数据噪音。因此,如果要在建模中有效地使用这些数据,就必须要预先对所获得的数据进行预处理及清洗,以保证数据的准确性和样本的有效性。一般数据预处理及清洗主要包含以下两部分的内容:1、缺失值的处理29 在提取的数据中,很多客户数据都存在属性缺失的现象,由于本文的分析需要对所有的客户进行总体考虑,所以不能简单地采取排除法,而是要用一个合适的值来填充缺失值,同时要保证变量的整体特性和分布,通常采用单值替换的方法来替换缺失值,单值替换有三个常用的选择:均值、中位值和模值,本文采用的是均值。2、异常数据的处理在此次的分析中,年龄、行业、性别等属性都有许多的异常数据,这些数据明显违背常规,对它们的处理方式通常有以下几种处理方式:(1)单变量清洗:对所提取的数据中每一个变量进行清洗,检查全部记录是否均在合理的值区间范围内(例如客户的语音通话时长不应为负值)。(2)变量间逻辑关系判断:当所提取变量之间存在包含、互斥等逻辑关系时,应对其逻辑关系进行判断(例如客户的语音主叫通话时长+被叫通话时长不应大于客户的总通话时长)。(3)极值替换:每个变量的极值(包含极大值、极小值以及空值)可能会对模型的分析结果带来偏差,因此,一般会在数据预处理过程中进行替换(例如将极大值用99分位数进行替换)。进行了上述的数据清洗及与预处理过程后,剔除了部分的异常数据,保留下来的有效样本数量为70956条记录,大约占原始数据量的91%。3.5构建顾客忠诚度模型的方法因子分析是利用降维的思想,由分析原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因素的一种多变量统计方法。因子分析的思想源于1904年CharlesSpearman对学生考试成绩的分析。近年来,随着计算机的高速发展,因子分析方法更广泛地应用到心理学、医学、气象学、经济学和管理学等领域。因子分析的基本思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组的变量间的相关性则较低。每组变量代表一个基本结构,并用一个不可观测的综合变量表示,这个基本结构就称为公共因素。对于所分析的某一具体问题,原始变量就可以分解为两部分之和的形式,一部分是少数几个不可观测的所谓公共因子的线性函数,另一部分则是与公共因子无关的特殊因子【51】。30 1.1因子分析的基本模型1、因子分析模型假设有n个样本,每个样本有p个观测变量,用X(i=1,2,...p)表示,公共因子用F表ii示,它们是在各个原观测变量的表达式中都出现的因子,是相互独立的不可观测的理论变量。公共因子的含义,必须结合具体问题的实际意义而定。特殊因子用U表示,是向量X的分量iXi所特有的因子,各特殊因子之间以及特殊因子与所有公共因子之间都是相互独立的。因子分析的数学模型就是把p个观测变量分别表示为m(m0.5,球形检验卡方统计量=117.508,单侧P=0.000<0.01,适于因子分析。(注:KMO是用于比较变量间简单相关系数与偏相关系数的一个统计量,其值愈接近1,表明愈适合作因子分析;巴特利特球形检验(BartlettTestofSphericity)是判断变量的相关系数矩阵是否为单位阵的一个统计量,其相伴概率(sig.)小于显著性水平(0.05或0.1),表明相关系数矩阵不为单位矩阵,适合因子分析,反之亦然。40 表4.3KMOandBartlett’sTestKaiser-Meyer-OlkinMeasureofSamplingAdequacy..704Bartlett’sTestofSphericityApprox.Chi-Square118.504df34Sig..0002、因子分析本文按特征值大于1的标准,采用主成分法提取因子(Principalcomponents),采用极大方差法进行因子旋转。在结果中,特征值>1的因子有2个,因此共提取出2个因子来描述移动顾客忠诚变量的特征,其中,行为忠诚因子的方差解释率为48.947%,情感忠诚因子的方差解释率为32.312%,Cumulative%(累积)贡献率为81.259%>80%,因此可以看出,对于顾客的实际行为数据,顾客忠诚可以由行为忠诚和态度忠诚两个因子构成。结果如表4.4所示:表4.4顾客忠诚因子分析结果变量变量解释行为忠情感忠诚诚change_yy_bd_count语音本地通话次数的变化率0.8210.238change_yy_sjmy_time省内漫游语音通话时长变化率0.8040.264change_yy_sjmy_time省际漫游语音通话时长变化率0.6720.124change_sms_count发送短信次数变化率0.7430.217change_yy_ip_time语音IP时长的变化率0.7960.136change_yy_fmy_sj_time非漫游状态下省际长途时长的变化率0.8230.325change_arpu客户ARPU的变化率0.9140.472lianghao该号码是否靓号0.2540.719onmonth客户在网时长0.413-0.678mean_yy_liantong_count语音拨打联通客服的次数均值-0.156-0.873mean_yy_1860_count语音拨打移动客服1860的次数均值0.327-0.942mean_yy_1861_count语音拨打移动客服1861的次数均值0.2890.724bangding客户是否绑定套餐0.4620.707mean_yy_bt_total与客户通话的不同电话号码个数的均值0.2350.843mean_sms_bt_count与客户短信通信的不同号码个数0.1240.635ratio_ww_hc_bt客户主叫网外不同电话号码个数所占比例0.3610.864ratio_ww_hr_bt客户被叫网外不同电话号码个数所占比例0.2940.796方差解释率(%)48.94732.312累计方差解释率(%)81.25941 从表中可以看出,根据假设,上述因子中的Onmonth(在网时间)应该是正影响。但忠诚度模型却显示,在网时间越长,对客户忠诚度反而有负影响,分析其中原因,认为可能有两个方面的原因:一是数据的原因,即数据在该维度的表现确实是这样,尽管这可能是个特例;另一个方面,可能随着客户在网时间越来越长,有利于忠诚的因素在积累(情感依赖、转网惰性),不利于忠诚的因素也在提升(套餐老化、资费偏高),后者速度略大于前者,会出现这种情况。3、因子得分在因子旋转的基础上,利用SAS中的scoring命令,计算因子得分矩阵如下表4.5所示:表4.5因子得分矩阵StandardizedScoringCoefficients变量行为忠诚情感忠诚change_yy_bd_count0.2090.124change_yy_snmy_time0.1920.137change_yy_sjmy_time0.1730.086change_sms_count0.1810.113change_yy_ip_time0.2040.092change_yy_fmy_sj_time0.2130.206change_arpu0.2750.239lianghao0.0830.312onmonth0.136-0.276mean_yy_liantong_count-0.128-0.327mean_yy_1860_count0.141-0.371mean_yy_1861_count0.1390.348bangding0.1620.352mean_yy_bt_total0.1270.361mean_sms_bt_count0.0730.254ratio_ww_hc_bt0.1840.367ratio_ww_hr_bt0.1750.332用各个主因子在每个指标上的得分做权重,可得出两个主因子的表达式,再根据方差解释表中2个综合因子方差的贡献率,构造出顾客忠诚度模型:顾客忠诚度=0.489*行为忠诚+0.323*情感忠诚42 为了更好的描述模型的结果,将因子评分结果转换到0-100的区间上。方法为:首先将标准化后的变量加上它的最小值(如果最小值为负),于是所有变量置换到>=0的区间内;其次,求出所得分数中的最大值,将所有客户的分数除以最大值,再乘以100,就将客户的分数置换到[0,100]的区间上。1.1模型验证本文在进行模型验证时,采用对顾客离网进行反向验证。模型采用所取数据截止月份后2月的离网用户号码,在当月的忠诚度得分的基础上进行验证,验证思路如下:考察当月在网而后2月离网的客户,其当月的忠诚度高低,如果总体较低,则模型是合理的。表4.7离网人数分布<1010-2020-3030-4040-5050-6060-7070-8080-100离网人数277186514459684452510顾客忠诚人数分布298224753531613122253194915229152离网人数占比10.790.830.270.060.020.00130.00020由表4.7可知,所有离网客户中,模型评分在50分以下的用户(满分为100分)占比达到了91.2%,其中评分在10-20与20-30的客户离网占比都在75%以上,模型是有可信度的。43 5顾客生命周期阶段判定模型本文在构建顾客生命周期判定模型时,根据建模的需要,在数据预处理的基础上,进行了数据整合与衍生变量构建,利用数据挖掘方法中的决策树算法,最终得出顾客所处的生命周期阶段。1.1客户生命周期阶段的定义移动通信业的客户生命周期是指客户从开始进入移动通信运营网络、享受通信服务到退出该网络所经历的时间过程。在该过程,客户通信的消费量和给移动通信企业带来的利润都会发生一定的规律性变化。根据一般客户生命周期的理论,把移动通信企业的客户的生命周期分成以下四个阶段。考察期:关系孕育期。双方相互了解不足,不确定性大,可能随时离网。这一阶段目标是发现和获取潜在客户,并通过有效渠道提供合适的价值定位以获取客户。形成期:关系快速发展阶段。这一阶段建立了一定的相互信任和交互依赖,如开始选用一种主要套餐,双方交易不断增加,例如涉及增值业务等。这一阶段可通过刺激需求的产品组合或服务组合把客户培养成高价值客户。稳定期:关系发展最高阶段。这一阶段双方对对方提供的价值高度满意,为能长期维持稳定关系,双方都做了大量有形和无形投入,如稳定的使用数据业务,IP电话等。衰退期:关系水平逆转阶段。这一阶段一方或者双方正在考虑结束关系甚至物色候选关系伙伴并且交流结束关系的意向,如营业厅电话通知停机等,交易量也出现下降。1.2顾客生命周期判定建模过程1.1.1模型构建思路由于考察期用户尚未入网,因此数据较难获得,无法进行判定,因此构建模型对生命周期44 的后三个阶段进行判定。由于客户的行为,如语音通话、短信等,最终影响的都是客户的ARPU(用户每月为移动带来的贡献),因此客户的ARPU是最具代表性的变量。所以模型的构建思路是结合用户的历史价值的趋势,以及预测出的未来价值的变化趋势(利用决策树算法来预测),综合进行判断客户当前生命周期阶段的归属,图5.2为模型构建思路的说明图。图5.2模型构建过程图基于这一思路,客户关系生命周期判定模型过程如下:首先是变量选取,获得原始数据,然后是在原始数据的基础上进行数据变量构造,并且通过arpu变化趋势构造决策树模型的目标变量,这里又分成两部分:1、通过计算,得出客户的历史ARPU值的变化趋势。首先将客户的入网时长,经过转化成为三个点,例如客户入网时长为6个月,就以每2个月为一个点,计算这两个月的arpu的均值,按入网时长顺序排列这三个点,并将其放入坐标轴中,显然,两点之间的连线可以和x轴构成一个角度,当这个角度为正时,定义一个“+”,表示第2个点的指标值高于第一个点,反之,当这个角度为负时,定义一个“-”,表示第2个点的指标值低于第一个点。45 y+-123x图5.3arpu趋势示意图2、利用决策树算法,预测客户下一阶段ARPU变化趋势,并且得出分类规则。通过客户历史消费行为和客户下一阶段的消费行为趋势两者结合,利用判定矩阵,对当前电信客户进行分类,判断客户当前所处的生命周期具体阶段。利用历史数据,从不同的时间点,重复上述步骤,进行合理有效的模型验证,以确保模型效果。最后通过模型实现过程的尝试和思考,提出模型的改进意见。1.1变量选取与构造由于本文所选取的数据节点是2005年7月的客户数据,在这个节点上的客户数据可以依据入网时长进行分组,将客户每半年分一组,可分为12组。46 表5.1入网时长人数统计入网时长人数所占比例0---3个月,新入网用户34274.83%3个月--6个月724510.21%6个月—1年803911.33%1年—1年半1099115.49%1年半—2年966413.62%2年—2年半69259.76%2年半—3年59188.34%3年—3年半48116.78%3年半—4年52937.46%4年—4年半30094.24%4年半—5年26893.79%5年以上29094.10%合计70956100%针对每一个客户,都会有与之相对应的每月消费行为数据,如同构建顾客忠诚度模型一样,为了更清楚的描述客户生命周期,需要在前面的数据预处理的基础上,构造一些新的具有意义的变量,以2005年1月入网----2005年6月间至少有一个月有消费行为的客户为例,以便于进一步的分析。目前移动通信行业的收入,主要由语音业务(语音通话)收入和数据业务(短信、彩信、彩铃等)收入两部分组成,因此在选取变量时必须将数据业务与语音业务区分开,选取其中的重要变量。新变量主要分成两类,一类是比例类的,构造ratio这个变量更多的是表现不同人群间消费特征的差异,例如每月漫游语音通话时长占总语音通话时长的比例大的人和每月本地语音通话时长占总语音通话时长的比例大的人的消费习惯并不一样,这些比例的变化往往是导致客户生命周期阶段发生变化的原因之一。另一类是均值类的,反应了客户在一个连续的时间段内消费水平。由于客户的单月离散数据,可能受其他因素影响,而不能反映客户真实的消费水平,因此均值才是客户在最近一个连续的时间段内真正消费水平的体现,所构造的这两类变量无论从统计意义还是业务意义上都非常重要。选取的变量和构造的新变量显然过于庞大(见附录2),而且其中有些变量相关度过于高,47 这对分析和建模而言都是不利的,在进行降维处理后,有如下变量:表5.2降维处理后的变量变量变量解释mean_msisdn_time语音通话时长均值ratio_msisdn_hc_time每月呼出语音通话时长占总语音通话时长的比例ratio_msisdn_ct_count每月长途语音通话次数占总语音通话次数的比例mean_msisdn_my_time漫游语音通话时长均值ratio_msisdn_hr_time每月呼入语音通话时长占总语音通话时长的比例ratio_msisdn_wn_count每月网内语音通话次数占总语音通话次数的比例mean_sms_hc_count短信发送次数均值ratio_sms_hc_dz_count每月梦网上行短信次数占短信发送次数的比例ratio_msisdn_my_time每月漫游语音通话时长占总语音通话时长的比例mean_mms_hc_count彩信发送次数均值1.1数据挖掘过程下面以在网时长为6个月-1年的用户为例,运用SAS/EM模块进行数据挖掘分析,具体流程见图5.4:图5.4建模流程图1、数据输入和抽样48 建立工程tree_prediction,然后用InputDataSource工具导入sx库中的model_reg_data数据集,并把样本数改为全体数据集,产生输出数据集sx.model_reg_data。2、数据集划分借助数据集划分模块(DataPartitionNode),把样本集合按以下比例划分为3个子集:训练集(train):70%;验证集(validation):30%。3、数据属性调整和设定目标变量借助数据属性调整模块(DataSetAttributesNode),将客户手机号变量(serial_NO)、年龄(age)等原始变量的属性设置(NewmodelRole)为弃用(Rejected),将客户分类变量class_TYPE的属性设置为目标变量(Target),并将class_TYPE设为名义变量(Nominal)。4、Tree模型建立和分析通过前面对决策树的分析,决定采用EM提供的Tree工具来建立决策树模型,并且采用GINI系数标准进行分类,下面介绍tree工具中的标签设置。Basic标签相应参数设置:(1)设置属性分割标准(splittingcriterion)为ginireduction,即每次选择gini系数最小的属性划分样本,以降低分支后节点的不纯度。(2)将每个节点的最大分支数(Maximumnumberofbranchesfromanode)参数设置为4,以构建决策树。(3)取消将缺失值作为可接受值(Treatmissingasanacceptablevalue)参数的选择状态。即在按某一分割属性对节点进行分支时,将相应属性值缺失的记录忽略。(4)将节点内的替代分支规则数设置为0。所谓替代分支规则是在主要分支规则不起作用时启用的规则。此设置表示在使用分割属性创建分支时,如果某些样本相应属性值缺失,禁止使用替代分支规则,而将这些样本分配给包含样本最多的分支。(5)在建立决策树的过程中通过两个参数来实现先剪枝,即当树的高度大于设定的决策树最大深度(Maximumdepthoftree)参数值时,树的生长自动停止,本文所选参数为6;或节点包含的样本数小于设定的每个分裂所需的最少样本数(Observationrequiredforasplitsearch)参数值时,节点的分裂结束。以此来避免生成过于茂盛、对训练数据产生过度适应的决策树,本文所选参数为300。49 Advanced标签的参数设置:(1)模型评价方法(modelassessmentmeasure)采用proportionofeventintop10%,即识别前10%客户数据中arpu变化趋势准确的比例。(2)子树的选择依据最佳评价值(Bestassessmentvalue),即将建树过程中产生的子树应用于验证数据集,选择预测proportionofeventintop10%最高的子树作为最终建立的模型。(3)将建立分支所需搜索的充足的观察数(observationsufficientforsplitsearch)设置为5000。(4)将每个详尽分支过程的最大试验数(maximumtriesinanexhaustivesplitsearch)设置为5000,即采用详尽搜索的方法为多分类名义变量寻找最佳分割。1.1模型性能评价模型评估是建立模型过程中的关键步骤之一。在EM中,通过使用评估节点,将建立的模型运用于验证数据来进行模型的评判比较,并从中选择满足预测要求的最佳模型。本文在进行模型评价时,考核的指标主要包括模型预测准确率、模型结果的可理解性、模型的商业合理性、捕获率以及模型复杂度等。1、交叉提升图(crossliftchart)交叉提升图是SAS/EM中提供的评估模型预测准确性的最重要的评价图,它可以直观地反映分类模型的预测效果。交叉提升图的横坐标都是按照模型对测试数据的预测结果,将用户按预测成功的可能性的高低分成的10个百分位(percentiles)段。纵坐标为对应百分位下的提升值(lift值)。Lift=模型预测的命中率/实际概率一般决策树模型前10%的用户的lift值在3以上,则认为模型的准确率较好,由图可见,模型的lift值接近5,因此,模型具有较为可靠的准确率。50 图5.5模型交叉提升图2、决策树评价图(assessmentplot)决策树评价图的横坐标是不同的剪枝子树对应的叶节点数,纵坐标是选择最优子树所依据的评价标准,即误分类率。从图中可以看出,随着决策树叶节点数量的增加,训练数据集(TRAIN)和验证数据集(VALID)节点的误分率都在增加。当叶节点数目约10个左右时,训练数据集和验证数据集误分类率相当,当叶节点数约为33个时,模型构建完毕。51 图5.6模型决策树评价图1.1模型结果1、树状结构图图5.7显示的是决策树的部分输出结果。图中以可视化的方式直观地显示了从根节点到每个叶节点对应的分类规则、每个内部节点所对应的分支规则以及每个节点中目标事件出现的概率和样本数,从而便于用户理解决策树的构造过程。52 图5.7模型树状结构图2、规则解释决策树所表示的分类知识可以用IF-THEN形式的分类规则表示。从决策树的根节点到每一个叶节点的路径都对应一条分类规则,沿着给定路径上的每个属性-值对形成规则的前件,叶节点包含的类预测作为规则的后件。将决策树转换为规则更易于被用户理解,并以此做出决策。本例中选定的决策树模型共有23个叶节点,下面列出的是从决策树根节点到序号为7的叶节点对应的规则:IFmean_msisdn_time>=296.8448ANDmean_mms_hc_count>=3.148993ANDratio_sms_hc_dz_count<0.792643THENNODE:7N:16274:44.2%3:12.3%53 2:25.0%1:13.0%该规则的含义是:如果顾客的语音通话时长均值大于等于296.8448分钟,发送彩信次数均值大于等于3条,并且每月梦网上行短信次数占短信发送次数的均值的比例小于0.79,则为(--)的可能性有44.2%。将决策树模型所得到的规则,应用于3个月-6个月的顾客,可以得到客户从过去到未来的一个较完整的趋势,这样就可以较为准确的判断一个客户属于客户生命周期的哪个阶段。将模型的预测结果获得的两个符号(即趋势),和由历史数据获得的两个符号,组成一个符号矩阵,通过矩阵,可以判断一个客户当前正处于生命周期的具体阶段(见表5.3)。表5.3生命周期判定矩阵预测的未来趋势+,++,--,+-,-历+,+形成期形成期形成期衰退期史+,-形成期稳定期稳定期衰退期数-,+形成期稳定期稳定期衰退期据-,-形成期衰退期衰退期衰退期由矩阵图可以看到,定义客户处于生命周期具体阶段主要看客户在这一段的总体趋势,由此表明列指标在判断中起的作用更为关键。由于将客户按入网时长分为12组,因此针对每一组,分析方法类似,都需要应用决策树模型得出决策规则。对于5年以上的客户,由于没有可供预测决策规则的数据,因此并未对5年以上的客户进行预测,根据需要,一共做11颗决策树,综合这11颗决策树的结果,便可得出所有用户所处的生命周期的具体阶段,结果如下:形成期用户为14896人,占比约为21%,稳定期用户为30597人,占比约为43%,衰退期用户为25463人,占比约为36%。又跟踪模型判断月后6个月的数据,模型判断的准确性如下(见表5.4):54 表5.4预测模型与实际数据比较实际 预测形成期稳定期衰退期形成期17.94%1.59%4.45%稳定期6.33%27.96%9.74%衰退期8.37%4.73%18.90%由表5.3可以看出,预测为形成期的用户占21%,根据跟踪结果,实际上形成期用户为1.1%,稳定期有1.59%,衰退期4.45%,判断有85%的准确率,针对稳定期和衰退期的用户也有较高的准确率,达到了60%以上,由此可以看出模型还是有相对比较可靠的精度的。55 6顾客生命周期各阶段忠诚度分析通过客户忠诚度模型和客户生命周期判定模型的结果,可将客户群进行细分,通过对不同细分群体的特点分析,模型结果有较大的实用价值。1.11不同忠诚度用户特点分析根据模型评分的结果,客户忠诚度水平呈拟正态分布,绝大多数的用户集中在20分与80分之间。如果以50分作为阀值,区分客户忠诚度的高低,则63.49%的用户为相对忠诚度较高的用户,同时还可以发现,绝对忠诚(90分以上)以及绝对不忠诚(10分以下)的用户基本没有,这个结果与通常对客户忠诚的认知基本相同。20—80区间集中98.57%客户2500020000150001000050000<1010--2020--3030--4040--5050--6060--7070--8080--9090--100低忠诚客户—36.51%高忠诚客户—63.49%图6.1忠诚水平分布以行为忠诚和态度忠诚的得分为基础进行数据统计(见表6.1)如下:56 表6.1顾客忠诚因子数据统计统计项目均值标准差方差最小值最大值行为维度48.720.650.420100情感维度51.450.740.550100以行为维度和情感维度的均值作为起点,根据Dick&Basu分类法(即将行为维度划分为高/低行为取向,把情感维度划分为高低情感取向)对数据进行分组统计,结果如图6.2所示:有大约36.78%的顾客在行为维度和情感维度上都得到高分,是忠诚的顾客;有大约22.61%的顾客在行为维度上取得高分,而在情感维度方面表现低于平均得分,表现出一种虚假忠诚;有1.1%的顾客在情感维度上取得高分,而在行为维度方面的表现低于平均得分,表现出潜在的忠诚;另外还有11.26%的顾客在两个维度上都取得低分,忠诚度很低,因此总体而言,顾客对移动通信服务市场表现了比较高的忠诚度。态度取向忠诚者潜在忠诚高留恋36.78%29.35%虚假忠诚不忠诚低留恋22.61%11.26%高重复低重复行为取向图6.2行为-态度矩阵顾客分类从忠诚类型的角度分析,即如果行为维度得分高于情感维度得分,则客户为行为型忠诚,反之,称为情感型忠诚。通过比较,行为型忠诚相对占比较小为33.87%,即绝大多数的用户是属于情感依赖型用户,分析可能原因是我国移动通信行业垄断现象比较严重,客户的转移成本较高,因此客户留在网内的机会比较大,但是随着3G时代的到来,这种垄断格局将会受到挑战,大量非移动运营商通过颠覆性的互联网业务模式准备进入市场,可能成为对目前移动客户有吸引力的替代选择,因此如何真正提高客户忠诚度水平是个移动运营商需要考虑的因素。分析不同忠诚类型、不同忠诚水平用户的特点,从用户ARPU的角度作为切入点进行分析,即从客户对企业最直接的贡献(当前收入)的角度来近似代替客户价值。结果如图6.3所示:57 150100500情感型忠诚行为型忠诚整体ARPU100.585.34高忠诚用户ARPU109.6990低忠诚用户ARPU99.474.74图6.3不同忠诚客户类型ARPU分布各种类型的客户中,高忠诚客户的ARPU均高于低忠诚客户,即高忠诚客户是相对价值较高的用户。但从数量来看,这种关系虽然普遍,但高忠诚客户的价值并未远远超过低忠诚客户的价值。由此可知,忠诚度对当前ARPU(当前收入)的贡献是一方面,其更重要的贡献在于与运营商建立起稳固关系,带来持续稳定的收入。顾客忠诚的形成绝不是单单由于一种因素作用的,而是多个因素综合作用的结果,因此,多因素共同作用下的顾客忠诚管理需要从多个方面解决才有效果。客户忠诚度模型的建立,对于区分这些因素、影响起到了积极的作用。同时,模型的结果,为如何促进顾客忠诚的建立和强化顾客关系的维持,提供了一些有益的实践启示。1、客户行为规律是企业直接挖潜客户忠诚的入手点客户行为是客户与企业发生直接接触的展现,稳定的客户行为,往往可以反应客户的消费心理和对产品的满意度,进而转化成为客户忠诚度的展现。因此现代企业应该利用各种数据处理技术、自动化手段尽可能全的收集客户行为信息,并加以整理分析,制定与顾客长期建立忠诚关系的策略。2、高忠诚客户不一定是高价值客户忠诚客户为企业带来的利润,主要源自客户的当前价值与未来价值的总和。忠诚与当前价值之间没有必然的相关性,也就是说,高忠诚客户并不一定是高价值客户。因此,提高现有高忠诚客户价值,以及培养高价值客户忠诚,是企业未来需要重点分析的课题。3、情感维系仍是客户忠诚管理的重中之重58 为了长期维持顾客忠诚,企业应当重视顾客与企业之间良好情感的培育和发展。要避免急功近利,追逐利益而忽略客户感知的短视现象,形成以顾客为中心的企业文化并被广泛认同,是企业客户忠诚管理的核心要素。4、适当设置退出壁垒绝大多数企业的产品,往往难以通过短期体验即完全获得客户的认同与较良好的感知。设置退出壁垒,增加客户的退出转换成本是企业挽留客户,增长客户体验时长及次数的有效措施。然而也有分析证明,过度设置退出壁垒或增加转换成本可能会引起顾客的反感,不利于顾客情感的培养,因此企业在利用这一措施挽留客户的过程中,必须合理把握尺度,适当设置壁垒。1.1客户生命周期各阶段忠诚度分析根据客户生命周期阶段判定模型的结果,绝大多数的用户正处于形成期及稳定期64%,期中又以稳定期用户居多,占比达43%,然而当前正处于衰退期的用户占比也达到了36%。与客户忠诚度分析的角度类似,也从客户ARPU入手,对处于不同生命周期阶段的客户特点进行分析。150100500形成期稳定期衰退期平均ARPU值120.2794.22113.69图6.3生命周期不同阶段用户ARPU分布由数据可以发现,客户在形成期ARPU最高,衰退期次之,而稳定期用户的ARPU反而最低。但是通过对三个不同时期用户的ARPU中位数进行比较分析(形成期125.37,稳定期106.31,衰退期107.45),稳定期用户与衰退期用户平均ARPU的中位数仅相差约1元,证明衰退期用户存在大量相对更为高价值客户。经过分析,可能的原因是移动运营商长期以来的资费政策[54],59 导致费率不断下降,因此对于高价值客户的arpu影响更大。同时利用客户忠诚度评分模型和客户生命周期阶段判定模型的结果,可以对用户进行生命周期各阶段忠诚度的分析,分析结果如表6.2所示。表6.2顾客生命周期阶段的顾客忠诚度分析客户生命周期阶段忠诚水平忠诚类型用户占比ARPU形成期高低行为型2.10%92.4情感型9.70%121.6行为型2.50%89.3情感型6.70%107.5稳定期高低行为型10.09%88.7情感型19.50%90.4行为型7.02%68.6情感型6.40%98.3衰退期高低行为型2.90%105.4情感型19.20%118.5行为型3.20%97.2情感型10.69%94.8由表6.2可以看出:在客户生命周期的各个阶段,情感型忠诚都比行为型忠诚占比例高,这与客户忠诚度分析中结论是一致的。其中,行为型忠诚的用户较集中于稳定期,形成期情感型高忠诚和衰退期情感型高忠诚用户相对价值较高,而稳定期行为型低忠诚用户价值相对较低。在不同时间,顾客生命周期的不同阶段的忠诚度人数分布,往往与企业的经营营销策略有关。因此,企业在制定发展及营销策略时,应该充分考虑不同阶段客户生命周期的不同特点。形成期:如何把客户培养成高价值客户形成期是企业与客户关系高速发展的阶段,企业与客户在形成期,建立了一定的相互信任和交互依赖,在这个阶段双方的交易往往不断增加,因此企业在针对这一阶段的客户进行营销,应该要优先考虑如何将客户培养成高价值的客户,挖潜客户的需求,对客户的不同需求进行定位,设计合适的产品组合,刺激客户的价值增长潜力。形成期低忠诚客户容易提前衰退,提前 衰退是指客户在形成期后,不经历稳定期,或者稳定期较短,就直接进入衰退期。提前衰退的60 客户,往往对企业的价值贡献降低。而判定提前衰退用户的一个重要因素,即客户为处于形成期,但忠诚较低的客户。企业客户根据这一原则,制定相应的策略,以减少企业的损失,或合理分配成本的投入。稳定期:如何培养客户的忠诚稳定期是企业与客户关系发展相对较高的阶段,企业与客户在稳定期对对方提供的价值都相对较为满意,并为能长期维持稳定的关系,双方都做了大量有形和无形的投入,产生了大量的交易。因此企业一般都希望可以尽量延长客户的稳定期时长,避免衰退期的过早到来。因此在这一阶段服务往往是企业必须重点关注的因素,针对不同客户的差异化服务,将处于这一阶段的客户培育成高忠诚客户。处于稳定期的高忠诚客户,一般是与企业关系最为密切的一群顾客,稳定期高忠诚客户更容易接受新产品的推荐,针对这样的顾客进行新产品的营销,交叉销售或增值营销往往会取得较好的响应率,因此企业在产品营销过程中,应高密切关注这部分客户。衰退期:如何延长客户的生命周期衰退期是企业与客户关系水平的逆转阶段,一方或双方可能正在考虑结束关系,甚至物色候选关系伙伴,在这一阶段,往往伴随着交易量的急剧萎缩。客户是企业最宝贵的资源,因此,在这一阶段,如何留住客户,延长客户的生命周期成为了企业客户管理的重点。这需要一套较为完善的客户挽留机制,以及较为准确的客户预警机制。由于企业在客户挽留时投入的成本往往较高,因此在制定客户挽留策略时,应优先客户挽留成功率较高的客户。由于衰退期低忠诚客户挽留的成功性较低,因此对于衰退期低忠诚客户,要根据企业自身的实际情况,权衡利弊,制定合适的策略。61 7全文总结及展望通过客户忠诚度模型和客户生命周期判定模型的结果,可将客户群进行细分,通过对不同细分群体的特点分析,模型结果有较大的实用价值。本文通过选取移动通信行业作为实证分析对象,运用数据挖掘技术,结合顾客所处生命周期的具体阶段和忠诚评分以及忠诚类型,提出有意义的提高顾客忠诚的建议。对于移动通信行业来说,顾客的情感,行为是影响顾客忠诚度的主要因素,而其中绝大多数用户的表现为情感型忠诚;在网时长与顾客忠诚度并不成正比例;高忠诚客户并不一定带来高价值,衰退期的客户并不意味着低价值,行为型忠诚客户多集中于稳定期。但是在完成论文的同时,也发现了本文存在的许多不足:1、由于本文的分析仅针对某个地区的部分样本进行调查和实证,因此样本选择具有一定的局限性。2、本文只是从行为和情感两个维度来构建了顾客忠诚度模型,但在现实消费环境中,影响顾客忠诚的因素十分复杂,本分析无法涉及每一个因素,在以后的分析中可适当增加维度。3、在构建顾客生命周期模型中,模型还有改进的余地,觉得在以下这些方面考虑的更为全面,可能可以提升模型的准确率:(1)、判断符号可以做的更细,引入平的状态,即在指标上升和下降不是过分明显的时候将这种状态定义为平,这样可以尽可能的避免由于异常波动而造成的误判。(2)、考虑季节性因素(例如节假日等),自然月天数不同等,可以考虑计算日ARPU这种指标,这样就可以减少自然月天数不同造成的对ARPU的影响。(3)、考虑单价变化对ARPU造成的影响。由于市场环境和竞争的关系,电信业各品牌的单价也始终在波动,虽然价格的波动可能会刺激一部分话务量,但总的来说,可能还是会对客户的ARPU造成下降的影响,如果可以考虑这部分原因,会对客户生命周期的准确率有更大的提高。62 参考文献[1]ReichheldFrederickF.LearningfromCustomerDefection.HarvardBusinessReview,1996,74(2):61[2]Edvardsson,B.Johnson,M.D.,Gustafsson,A.,&Strandvik,T.Theeffectsofsatisfactionandloyaltyonprofitsandgrowth:Productsversusservices.TotalQualityManagement,2000,11,917-927[3]Gustafsson,A.,&Johnson,M.D.Measuringandmanagingthesatisfaction-loyalty-performancelinksatVolvo.JournalofTargeting,MeasurementandAnalysisforMarketing,2002,10,249-258.[4]OliverRichardL.WhenceConsumerLoyalty?JournalofMarketing,SpecialIssue,1999,63(4):36[5]DickAlanS.,andKunalBasu.CustomerLoyalty:TowardanIntegratedConceptualFramework.JournaloftheAcademyofMarketingScience,1994,22(2):102[6]MichaelA.Jones,DavidL.Mothersbaugh,SharonE.Beatty:Whycustomersstay:measuringtheunderlyingdimensionsofservicesswitchingcostsandmanagingtheirdifferentialstrategicoutcomes.JournalofBusinessResearch.2002,55:441-450[7]KnoxSimon.Loyalty-BasedSegmentationtheCustomerDevelopmentProcess.EuropeanManagementJournal,1998,16(6):733[8]凯瑟琳*辛德尔《忠诚营销》,北京:中国三峡出版社,2001年9月第1版,243-246[9]AbdolrezaEshghi,DominiqueHaughton,HeikkiTopi.Determinantsofcustomerloyaltyinthewirelesstelecommunicationsindustry.TelecommunicationsPolicy.2007,31,93-106[10]罗子明消费者心理学(第3版)清华大学出版社2007年1月,182-193[11]Bloemer,JoseandHansD.P.Kasper,TheComplexRelationshipBetweenConsumerSatisfactionandBrandLoyalty.JournalofEconomicPsuchology.1995,16,311-329.[12]Dabholkar,PratibhaA.,C.DavidShepherd,andDayleI.Thorpe,AComprehensiveFrameworkforServiceQuality:AnInvestigationofCriticalConceptualandMeasurementIssuesThroughaLongitudinalStudy”JournalofRetailing,2000,76(2),139-173.[13]Olsen,L.L.,&Johnson,M.D..Serviceequity,satisfaction,andloyalty:Fromtransaction-specifictocumulativeevaluations.JournalofServiceResearch,2003,5,184-195.[14]Johnson,M.D.andA.Gustafsson.ImprovingCustomerSatisfaction,LoyaltyandProfit:AnintegratedMeasurementandManagementandManagementSystem,2000,SanFrancisco,CA: Jossey-Bass.[15]Mittal,VikasandWagnerA.Kamakura.Satisfaction,RepurchaseIntent,andRepurchaseBehavior:InvestigatingtheModeratingEffectofCustomerCharacteristics.JournalofMarketingResearch,2001,38(February):131-142[16]Martensen,A.,Gronholdt,L.&Kristensen,K..Thedriversofcustomersatisfactionandloyalty:Cross-industryfindingsfromDenmark.TotalQualityManagement,2000,11,544-553.[17]Cassel,C.,&Eklof,J..Modellingcustomersatisfactionandloyaltyonaggregatelevels:ExperiencefromESCIpilotstudy.TotalQualityManagement,2001,12,834-841.[18]Yang,Z.&Peterson,R.T.CustomerPerceivedValue,Satisfaction,andLoyalty:TheRoleofSwitchingCost[J].Psychology&Marketing,2004,10,Vol.21Issue10:799-822[19]MarcinPont,LisaMcQuilken.Anempiricalinvestigationofcustomersatisfactionandloyaltyacrosstwodivergentbanksegments.JournalofFinancialServicesMarketing.London:Jun2005.Vol.9,Iss.4;pg.344,16pgs[20]DavidW.Wallacea,JoanL.Gieseb,JeanL.Johnson.CustomerRetailerLoyaltyintheContextofMultipleChannelStrategies.JournalofRetailing,2004,80(4):249-263.[21]Customerloyaltyine-commerce:anexplorationofitsantecedentsandconsequencesSriniS.Srinivasan,RolphAnderson,KishorePonnavoluJournalofRetailing200241-50[22]ACustomerloyaltymodelforE-servicecontextLuarn&LinJournalofElectronicCommerceResearch,2003,VOL.4,NO.4,45-56.[23]查金祥,B2C电子商务顾客价值与顾客忠诚度的关系分析博士论文2006.5[24]Ford,W..Communicationbetweenpracticesofprofessionalserviceproviders:Predictingcustomersatisfactionandloyalty.JournalofAppliedCommunicationResearch,2003,31,189-212.[25]MichaelD.Johnson,etc.Theevolutionandfutureofnationalcustomersatisfactionindexmodels[J].JournalofEconimicPsychology.2001,22:217-245[26]AgencyandtrustmechanismsinconsumersatisfactionandloyaltyjudgmentsJSingh,DSirdeshmukh-JournalofAcademyofMarketingScience,2000,24:54-62[27]Lastingcustomerloyalty:atotalcustomerexperienceapproach.TheJournalofConsumerMarketing.SantaBarbara:2006.Vol.23,Iss.7;pg.39764 [28]尤建新等著,《顾客抱怨管理》,石油工业出版社民主与建设出版社,2003年5月[29]韩经纶、韦福祥,顾客满意与顾客忠诚互动关系分析,南开管理评论,2001,(6)[30]陈明亮,客户重复购买意向决定因素的实证分析,管理世界,2002(1)[31]陈明亮,生命周期不同阶段客户重复购买意向决定因素的实证分析,管理世界,2002(1)[32]李怀祖、韩新民、齐佳音,一种新的客户-企业价值评价体系的设计,管理工程学报,2002(4):4-8[33]陈明亮客户保持动态模型的分析,武汉大学学报(社会科学版),2001(11)[34]刘雪山,李俚,基于层次分析法的移动通信行业客户忠诚度分析,广西通信技术,2004(9)[35]齐佳音,一种新的累积客户保持率模型,管理工程学报,2004(4)[36]RosalindMcMullanAmultiple-itemscaleformeasuringcustomerloyaltydevelopment.TheJournalofServicesMarketing;2005;19,6/7p470-481[37]王宏,《基于粗糙集数据挖掘技术的客户价值分析》,经济科学出版社,2006年[38]陈明亮,客户生命周期模式分析浙江大学学报(人文社会科学版)Vol.32,No,6Nov.2002[39]CustomersatisfactionmeasurementatPostDenmark:ResultsofapplicationoftheEuropeanCustomerSatisfactionIndexMethodology.KaiKristensen;AnneMartensen;LarsGronholdtTotalQualityManagement&BusinessExcellence,Volume11,Issue7September2000,1007-1015[40]HsipengLu,JudyChuan-ChuanLin,Predictingcustomerbehaviorinthemarket-space:astudyofRayportandSviokla’sframework,InformationandManagement,2002,40:1-10[41]陈明亮,客户忠诚与客户关系生命周期管理工程学报2003年Vol.17,No.2[42]朱立伟,《移动通信》,机械工业出版社,2002年p44[43]http://carrier.analysys.com.cn/index.php?action=showContent&ID=5069&TID=2&WID=4[44]http://it.ocn.com.cn/20077/2200778434.html[45]扬瑞祯,《现代通信企业市场营销管理》,北京,人民邮电出版社2002p45-48[46]江林,《消费者心理与行为(第二版)》,中国人民大学出版社p108-113[47]安淑芝等,《数据仓库与数据挖掘》,清华大学出版社2005p86-p95[48]陈京民等,《数据仓库与数据挖掘技术》电子工业出版社,2002年8月p258-261[49]齐佳音、万映红,《客户关系管理理论与方法》中国水利水电出版社2006.965 [50]吴修霆,SAS数据挖掘技术的实现,PCWORLDCHINA/APR3,2000NO.14[51]汪远征、徐雅静,《SAS软件与统计应用教程》,机械工业出版社2007年2月p194-p196[52]沈其君,《SAS统计分析》,高等教育出版社,2005年8月p265-269[53]柳林、涂光平、杨峰,基于决策树的数据挖掘方法在CRM中的应用分析计算机技术与自动化vol.25,No.1Mar.2006[54]http://tech.sina.com.cn/t/2006-03-17/0929870050.shtml66 附录1因子分析SAS程序:dataloyalty;inputchange_yy_bd_countchange_yy_snmy_timechange_yy_sjmy_timechange_sms_countchange_yy_ip_timechange_yy_fmy_sj_timechange_arpulianghaoonmonthmean_yy_10010_countmean_yy_10011_countmean_yy_1860_countmean_yy_1861_countmean_yy_bt_totalbangdingmean_sms_bt_countratio_ww_hc_btratio_ww_hr_bt;cards;...;run;procfactormethod=principaln=2rotate=varimaxscoreoutstar=rr;varx1-x18;run;67 附录2衍生变量列表构造变量变量解释(ratio_sms_hc_dz_count)每月梦网上行短信次数占短信发送次数的比例 (ratio_msisdn_ww_time)每月网外语音通话时长占总语音通话时长的比例 (ratio_msisdn_ww_count)每月网外语音通话次数占总语音通话次数的比例 (ratio_msisdn_ww_time)每月网内语音通话时长占总语音通话时长的比例 (ratio_msisdn_ww_count)每月网内语音通话次数占总语音通话次数的比例 (ratio_msisdn_my_time)每月漫游语音通话时长占总语音通话时长的比例 (ratio_msisdn_my_count)每月漫游语音通话次数占总语音通话次数的比例 (ratio_msisdn_ip_time)每月ip语音通话时长占总语音通话时长的比例 (ratio_msisdn_ip_count)每月ip语音通话次数占总语音通话次数的比例 (ratio_msisdn_hr_time)每月呼入语音通话时长占总语音通话时长的比例 (ratio_msisdn_hr_count)每月呼入语音通话次数占总语音通话次数的比例 (ratio_msisdn_hc_time)每月呼出语音通话时长占总语音通话时长的比例 (ratio_msisdn_hc_count)每月呼出语音通话次数占总语音通话次数的比例 (ratio_msisdn_ct_time)每月长途语音通话时长占总语音通话时长的比例 (ratio_msisdn_ct_count)每月长途语音通话次数占总语音通话次数的比例 (ratio_msisdn_bd_time)每月本地语音通话时长占总语音通话时长的比例 (ratio_msisdn_bd_count)每月本地语音通话次数占总语音通话次数的比例 (mean_sms_hc_dz_count)05年1月--05年6月梦网上行短信次数均值 (mean_sms_hc_count)05年1月--05年6月短信发送次数均值 (mean_mms_hc_count)05年1月--05年6月彩信发送次数均值 (mean_msisdn_ww_time)05年1月--05年6月网外语音通话时长均值 (mean_msisdn_ww_count)05年1月--05年6月网外语音通话次数均值 (mean_msisdn_wn_time)05年1月--05年6月网内语音通话时长均值 (mean_msisdn_wn_count)05年1月--05年6月网外语音通话次数均值 (mean_msisdn_time)05年1月--05年6月语音通话时长均值 (mean_msisdn_my_time)05年1月--05年6月漫游语音通话时长均值 (mean_msisdn_my_count)05年1月--05年6月漫游语音通话次数均值 (mean_msisdn_ip_time)05年1月--05年6月ip语音通话时长均值 (mean_msisdn_ip_count)05年1月--05年6月ip语音通话次数均值 (mean_msisdn_hr_time)05年1月--05年6月呼入语音通话时长均值 (mean_msisdn_hr_count)05年1月--05年6月呼入语音通话次数均值 (mean_msisdn_hc_time)05年1月--05年6月呼出语音通话时长均值 (mean_msisdn_hc_count)05年1月--05年6月呼出语音通话时长均值68 附录3决策树程序结果:****************************************************************;**DECISIONTREESCORINGCODE;****************************************************************;LENGTH_FNORVAL$%DMNORLEN;DROP_FNORVAL;_FNORVAL="";/*Initializetoavoidwarning.*/LENGTH_FORMAT$200;DROP_FORMAT;_FORMAT="";/*Initializetoavoidwarning.*/DROP_DECNUM;_DECNUM=1;******LENGTHSOFNEWCHARACTERVARIABLES*****;LENGTHI_CLASS_TYPE$1;LENGTHF_CLASS_TYPE$1;LENGTH_WARN_$4;******LABELSFORNEWVARIABLES*****;LABEL_NODE_="NodeIdentificationNumber";LABELP_CLASS_TYPE4="Predicted:CLASS_TYPE=4";LABELP_CLASS_TYPE3="Predicted:CLASS_TYPE=3";LABELP_CLASS_TYPE2="Predicted:CLASS_TYPE=2";LABELP_CLASS_TYPE1="Predicted:CLASS_TYPE=1";LABELI_CLASS_TYPE="Into:CLASS_TYPE";LABELU_CLASS_TYPE="UnnormalizedInto:CLASS_TYPE";LABELF_CLASS_TYPE="From:CLASS_TYPE";LABELR_CLASS_TYPE4="Residual:CLASS_TYPE=4";LABELR_CLASS_TYPE3="Residual:CLASS_TYPE=3";LABELR_CLASS_TYPE2="Residual:CLASS_TYPE=2";LABELR_CLASS_TYPE1="Residual:CLASS_TYPE=1";LABEL_WARN_="Warnings";******FORMATSFORNEWVARIABLES*****;FORMAT_NODE_5.;FORMATP_CLASS_TYPE46.4;FORMATP_CLASS_TYPE36.4;FORMATP_CLASS_TYPE26.4;FORMATP_CLASS_TYPE16.4;69 FORMATI_CLASS_TYPE$CHAR1.;FORMATF_CLASS_TYPE$CHAR1.;FORMATR_CLASS_TYPE46.4;FORMATR_CLASS_TYPE36.4;FORMATR_CLASS_TYPE26.4;FORMATR_CLASS_TYPE16.4;IFMISSING(CLASS_TYPE)THENF_CLASS_TYPE="";ELSEDO;_FORMAT=PUT(CLASS_TYPE,BEST12.);%DMNORMCP(_FORMAT,F_CLASS_TYPE);END;******INITIALIZEDUMMYVARIABLESTO0*****;_2_=0;LABEL_2_="1ifinnode2,0otherwise";FORMAT_2_2.;_7_=0;LABEL_7_="1ifinnode7,0otherwise";FORMAT_7_2.;_8_=0;LABEL_8_="1ifinnode8,0otherwise";FORMAT_8_2.;_33_=0;LABEL_33_="1ifinnode33,0otherwise";FORMAT_33_2.;_34_=0;LABEL_34_="1ifinnode34,0otherwise";FORMAT_34_2.;_26_=0;LABEL_26_="1ifinnode26,0otherwise";FORMAT_26_2.;******ASSIGNOBSERVATIONTONODE*****;IFNOTMISSING(MEAN_MSISDN_TIME)ANDMEAN_MSISDN_TIME<296.844797530922THENDO;_NODE_=2;P_CLASS_TYPE4=0.41334250343878;P_CLASS_TYPE3=0.12654745529573;P_CLASS_TYPE2=0.27303988995873;P_CLASS_TYPE1=0.18707015130674;I_CLASS_TYPE="4";U_CLASS_TYPE=4;_2_=1.0;_DECNUM=2;END;ELSEDO;70