前文回顾
作为新手小白,需要对数据分析有一个明确的了解和目标,因此,我最近在专攻与一个项目上,多思考,多作假设, 经常做发散思维,也可以参考别人写的文章,扫扫自己的盲区。
如果有看我之前写的数据分析文章,会发现我写的比较短,因为之前是跟着别人的项目走的,但是缺乏了对项目的了解,也无法扩展对项目本身的思考,因此我会对这个项目本身——淘宝用户行为,多做扩展,如果有什么好的想法,也欢迎在评论区留言。
说道用户行为,相比接触了一段时间的数据小白来说并不陌生,它是对用户行为打上一种标签,一种离散数据的表现,我们通常可以对其进行分类统计,或者限制条件。但是行为数据有一个最大的缺点就是——数据庞大,自学的数据小白,电脑配置可能不是特别高,如果你的电脑cpu只有4G的话,那么你可能跑不太动100万条的数据,我的解决办法是可以在网上申请资源,根据需求,申请不同的资源。
好了不多说,看看这次新的地方。
首先是上次的数据只有5000,可能对结果有影响,所以我这次用了100万条的数据做了分析。
从结果来看,显示用户的浏览行为有了更为明显的波动,从峰值就能看出的是淘宝的双十二会刺激用户的行为。
从小时的角度思考的话,那么可以看到的是从早上五点以后,用户浏览数量会上升,到了晚上,还会有一次上升的趋势,这些给商家的思考,可以根据用户的时间来推送不同的商品,会有更大的概率会被用户发现。
看来,基本上都是相同的趋势,不过,看来深夜买东西的人是挺多的。
通过不同的用户行为分析,亦可以用户不同行为的波动情况,并制定相关策略。
data['week']=pd.DatetimeIndex(data.date).weekday+1
好了,可以通过星期对数据进行分析(为什么+1,你可以用unique函数看看为什么)。
从结果图来看,会发现的是,礼拜四和礼拜五是用户行为的高峰期,可以好好把握(想要代码?可以翻翻之前我写的博客,只是换了变量,这一点并不难)
最后
这一次是对上一次的总结和衍生,如何对用户行为数据做进一步的扩展,容许我好好的想一想。