R语言Apriori关联规则、kmeans聚类、决策树挖掘研究京东商城网络购物用户行为数据可视化...

全文链接:http://tecdat.cn/?p=30360

随着网络的迅速发展,依托于网络的购物作为一种新型的消费方式,在全国乃至全球范围内飞速发展点击文末“阅读原文”获取完整代码数据)。

电子商务成为越来越多消费者购物的重要途径。我们被客户要求撰写关于网络购物行为的研究报告。

项目计划使用数据挖掘的方法,以京东商城网购用户的网络购物数据为基础,对网络购物行为的三个要素:行为过程、行为结果、行为主体进行分析。

(1)使用关联规则分析方法分析网络购物用户的行为过程,分别探析信誉度、搜索排名对网购用户购买决策的影响程度;

(2)使用聚类分析方法,对网购用户的行为结果进行讨论,发现不同网购群体的网购习惯和特征;

(3)使用分类/预测分析方法,对网购行为主体进行研究。本项目还将引用其它研究的数据及观点对本数据分析所得结论进行比较验证。

相关视频

本项目的结论为以京东商城为代表的网购平台运营商、商家提供网站管理、网店运营方面的参考,为商家制定网络营销策略提供决策支持。

关联规则挖掘

data1[,i]=as.factor(data1[,i])##将每个变量转成因子形式

}

inspect(frequentsets[1:10])#查看频繁项集

de256e50d55e1258cdf9255401d6bea2.png 从上面的表 可以看到部分频繁出现的一些选项规则,抽取的10个频繁项集的支持度在0.3左右。

然后查看支持度最高的前10个规则

220cdd4544941f87104d86d5fcfa8907.png

可以看到支持度最高的前十个选项集合(称为频繁项集)的支持度在0.9左右,因此在下面使用apriori模型对数据进行分析时,选取最小支持度为0.9左右,以便发现合适数量的规则。

set of 47 rules

 

rule length distribution (lhs + rhs):sizes

 1  2  3

11 24 12

 

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.

  1.000   2.000   2.000   2.021   2.500   3.000

 

summary of quality measures:

    support         confidence          lift      

 Min.   :0.9000   Min.   :0.9000   Min.   :0.9977 

 1st Qu.:0.9050   1st Qu.:0.9400   1st Qu.:1.0000 

 Median :0.9150   Median :0.9585   Median :1.0043 

 Mean   :0.9191   Mean   :0.9572   Mean   :1.0043 

 3rd Qu.:0.9300   3rd Qu.:0.9846   3rd Qu.:1.0083 

 Max.   :0.9850   Max.   :0.9945   Max.   :1.0141 

 

mining info:

  data ntra
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值