第一论文网免费提供电子商务毕业论文范文,电子商务毕业论文格式模板下载

一种网店客户数据挖掘系统的设计与实现

  • 投稿薪人
  • 更新时间2015-10-13
  • 阅读量765次
  • 评分4
  • 44
  • 0

文/李博

摘要:本文讨论了一种以数据挖掘技术、XML技术以及数据库技术为基础的的网店客户数据挖掘系统的设计和实现方法。通过该系统可以帮助网店经营企业准确的把握网络市场中客户购买行为的规律和需求变化的趋势,提高网络营销的效率。

关键字:数据挖掘;XML;电子商务

数据挖掘技术是数据库应用研究较为活跃的领域之一,因为其现实意义,使得数据挖掘的技术研究和应用有了很大的发展,在国内外科研领域都备受关注。特别是在电子商务领域数据挖掘技术有着巨大的使用价值。随着电子商务市场的日臻成熟,第三方电子商务平台上众多的网店之间的竞争正日益激烈,网店开展网络营销的成本日益增加。每个网店企业通过一定时间的经营都会收集到众多的客户数据,如何通过庞大的客户访问数据挖掘出潜在的客户需求的金矿,使网店经营企业快速有效的通过现有客户数据掌握市场的变化的规律和趋势,已经成为网店经营管理者急需解决的问题。本文将探讨一种网店客户数据挖掘系统的设计与实现的方法。

1、网店客户购买数据挖掘系统的设计

1.1 客户购买数据挖掘系统的实现原理

对客户数据进行挖掘的关键要点就是把现有的网店访问日志经过数据预处理转换成满足XML文件格式要求的结构化数据,然后使用DBMS工具将结构化的XML文件转换成关系型数据库,最后运用数据挖掘的方法从数据库抽取能够反映客户消费和购买行为的数据。具体工作过程如下:

1)确定数据来源(主要是顾客购买记录)

数据挖掘离不开海量的数据,每一个网店在经营一段时间以后都会记录大量的客户购买记录,这些客户购买记录当中就蕴藏着大量的信息,这些信息我们进行数据挖掘的数据来源。

2)进行数据筛选

客户购买记录中蕴藏大量的信息不可能全部为数据挖掘的对象,从数据源中提取需要的数据,将无用的数据和干扰信息从数据源中剥离,为进一步的工作做准备。

3)数据格式转换

将进一步筛选过的有挖掘价值的非格式化数据数据转换为XML格式的文件并存储。

4)导入数据库

将表示客户访问数据的XML格式文件使用数据库管理工具进一步转换成可以存储于数据库的关系型数据库文件。[1]

5)进行数据挖掘

应用数据挖掘的相关算法,对存储在关系型数据库中的数据进行挖掘,发现海量数据中隐藏的客户行为模式和消费趋势。

6)对数据挖掘的结果进行甄别

通过数据挖掘总结出的一些模式有时可能脱离客户真实行为模式的实际,因此在最后一步需要为对数据挖掘总结出的规则进行甄别,这个工作目前还需要有经验的专家人工完成,今后考虑结合人工智能的技术加以解决。

1.2 网店客户购买数据挖掘系统模型

在上述系统设计的基础之上,我们提出了网店客户购买数据挖掘系统的模型,该模型由三个层次组成,其逻辑架构如图一所示。

2、系统设计与实现

2.1 系统开发与运行环境

硬件环境:CPUIntelI3380M/RAM2G/硬盘320G软件配置:

操作系统:Windows7SP1

开发工具:Microsoft.NET2005/VisualC#

数据库管理系统:MSSQLServer2008

辅助软件:spssClementine11.1;SQLServer2008AnalysisServices(SSAS)

2.2 主要技术与系统实现

通过对上述对客户购买数据挖掘系统模型的分析可知,该系统主要由用户接口模块、数据清洗模块、数据格式转换模块、数据库生成模块和数据挖掘引擎模块等组成。

1)用户接口模块

本系统最终目的还是为为客户的决策提供支持,因此友好的界面设计是用户与系统交互的基础。简洁而易于理解的界面有利于提高用户对系统的使用效率。

2)数据预处理模块

客户访问数据进入数据预处理模块进行清洗,去除无关的信息,剥离出对数据挖掘有价值的数据。数据预处理模块对原始访问数据进行分析,将用户购买数据记录逐条的分割成十个字段,分别为:u_id(访问者编号),u_date(到访日期),u_time(到访时间),u_orderid(订单编号),u_product(客户购买的商品),u_bowser(使用的浏览器类型),page(首次到访页面),place(客户所在地区),payment(支付方式),logistic(物流方式),同时删除访问数据中与以上字段不相干的数据。然后将经过预处理的数据存入中间文件。

3)XML转换模块

该模块程序使用.NET的相关的方法编写,主要功能将预处理过的客户购买数据转换成标准化XML格式的数据文件进行存储。该程序的主要实现原理是对经过预处理的中间文件中的数据记录逐个分割并存入数组,然后将数组的内容按照XML的格式写入文件,完成转换。

4)数据库导入模块

利用.NET的相关方法并结合数据库管理工具建立支持数据挖掘的客户购买数据库,编写相关程序将已经转换成XML格式的客户访问数据逐条的导入到数据库并形成日志数据表方便进行后续的数据挖掘。

5)数据挖掘引擎模块

数据挖掘引擎是实现客户购买数据挖掘系统的实现关键。优秀的数据挖掘算法不仅可以使数据挖掘的结果更加准确,也可以提高数据挖掘的效率。本系统主要用到的算法是该模块利用数据挖掘算法对数据进行挖掘,主要包括算法的优化、日志数据表的删除操作以及挖掘结果集的保存与删除操作等。这里主要用到的算法是K-Means算法。主要是利用该算法发现最相似的客户聚类,通过对聚类的分析来得出网店众多的顾客一般的购买行为模式,从而可以适当地调整网站营销的策略中的来提高网络营销的效果,进而增加销售量。[2]

3、小结

本文主要讨论了一种基于XML技术的网店客户访问数据挖掘系统的设计与实现方法。通该系统可以帮助网店经营企业对大量的客户访问数据进行分析,从中发现市场的变化规律和客户的行为模式,使企业的网络营销工作更有针对性,同时也更富有成效。

教育期刊网 http://www.jyqkw.com
参考文献

[1] 张光辉.XML与Web数据挖掘分析[J].中原工学院学报,2002,13(4):61-64.

[2] 汤艳艳.数据仓库中基于面向对象技术的多维数据模型的设计与实现.计算机应用技术[J],2003,5(10):57-6

作者简介:李博,广东理工学院 讲师,研究方向:网络营销。