purpro_20[1:20,] %>% ggplot(aes(x=Product_ID,y=n,fill=Product_ID))+geom_point(color=‘red’)+theme(axis.text.x = element_text(angle=45,vjust=0.5),legend.position = “none”)
结果:
从上图我们可以得知,编码为P00265242的产品被购买的次数最多,其次,编码为P00025442,P00110742,P00112142的产品被购买的次数也较多,次数均在1500次以上,从编码来看并没有什么很显眼的数据特点。
消费最多的价格区间
代码:
bf %>% ggplot(aes(x=Purchase))+geom_histogram(fill=“red”)
结果:
从图上可知,消费最多的价格区间再8500左右,约有60000以上的消费次数。不存在购买频率十分显著的编码号,所以还需要进一步的挖掘。
产品类别信息统计
- 对不同性别绘制箱线图:
代码:
p1<-bf %>% ggplot(aes(x=Gender,y=Purchase))+geom_boxplot()
p1
结果:
对不同城市绘制箱线图:
代码:
p2<-bf %>% ggplot(aes(x