背景:
该数据集为某电商的用户信息及商家信息的一份数据,以此为基础对用户年龄,用户的平台年龄(注册至今的时间),消费频率,以及各个产品类别的用户消费占比等信息进行用户画像研究。
一、认识数据
数据集大小为183828条,共19个属性信息
'客户编码', '产品编码', '行为时间', '行为类别', '年龄分段', '性别', '客户注册日期', '会员级别',
'会员城市级别', '产品品牌', '店铺编码', '产品类别', '产品上市日期', '商家编码', '粉丝数', '会员数', '开店时间', '店铺主营', '店铺打分',
年龄已经做了分段处理,性别中包含M,N,U,其中U为未知
数据比较干净,在这里不再进行清洗。
查看一下数据的详细信息
二、对性别属性进行分析
查看性别字段的分布情况,男性数量为120077,女性为63278,未知的是473,男性占据了比较大的占比
我们使用pyecharts对数据进行可视化(pyecharts的交互性很强)
三、对整个数据中的年龄段进行分析
在年龄的第5/6