第三部分:可视化(30分)
这是一份用户消费行为数据,用来分析用户消费情况及品牌情况,可视化消费变化趋势。
数据中中文字符为UTF-8编码,字段分隔符为 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
- 进行用户消费趋势分析(按月)(8分)
按照月份分别对消费金额(price)进行求和,对消费人数(user_id)进行计数运算,对运算的进行双折线图画图操作,要求,消费金额与消费人数 进行不同的坐标展示。 其中对 price求和后显示为 消费金额(万元) 对 user_id计数后的显示为 消费人数 对montha 显示为 月度
每月的消费总金额(1分)
每月的消费人数 (1分)
消费金额 单位换算为 万元(1分)
两个折线不同的坐标(2分)
中文显示 (1分)
2、进行品牌消费情况(10分)
按照品牌(brand_name)分别对消费金额(price)进行求和,对消费人数(user_id)进行计数运算,并按照消费金额排序(降序),取得排序的前10名进行 双坐标,柱状图,画图操作,要求,消费金额与消费人数 进行不同的坐标展示。
其中对 price求和后显示为 消费金额(万元)
对 user_id计数后的显示为 消费人数对
brand_name显示为 品牌要求:
每个品牌的消费总金额(1分)
每个品牌的消费人数 (1分)
消费金额 单位换算为 万元(1分)
柱状图不同的坐标,不同的颜色(2分)
中文显示 (1分)
- 按照消费金额排序 有大到小(1分)
- 只取得 前10条记录(1分)
3 用户个体消费分析(12分)
3.1
、用户消费次数、消费金额散点图 4分
1)X轴是消费次数,Y轴是消费金额(1分) 2)画出散点图(1分) 3)中文显示 (1分)
从图中可以得出的结论描述:(2分)
3.2
、用户消费金额分布图 4分
按照用户id(user_id)分别对消费金额(price)进行求和,然后按照消费金额,并对消费金额小于5000元的绘制直方图。 要求: 1)消费金额汇总(1分) 2)直方图(1分) 3)金额小于5000(横轴坐标最大5000元) (1分) 结果截图:
从图中可以得出的结论描述:(2分)
从用户消费金额分布图中可以看出,去除金额大于5000元的极值数据后,用户消费金额的分布符合右偏分布。随着消费金额的增加,消费的用户数减少。
代码截图:
3.3
、用户消费次数分布图 4分
按照用户id(user_id)分别对消费次数(event_type)进行计数运算,然后按照消费次数,并对消费次数小于20的绘制直方图。 要求: 1)消费次数计数(1分) 2)直方图(1分) 3)次数小于20(横轴坐标最大20) (1分) 结果截图:
从图中可以得出的结论描述:(2分)
从用户消费次数分布图中可以看出,去除次数大于20元的极值数据后,用户消费次数的分布符合右偏分布。随着消费次数的增加,消费的用户数减少。
代码截图:
第1题,第3大题的第1小题可参考(数据、题目相同):2021年安徽省大数据与人工智能应用竞赛大数据(网络赛)-本科组赛题第四部分可视化_Steven灬的博客-CSDN博客