- 博客(4)
- 收藏
- 关注
原创 时间数据可视化 南丁格尔玫瑰图
这里就讲述下离散型数据的堆叠柱形图,堆叠柱形图的几何形状和常规柱形图很相似,在柱形图中,数据值为并行排列,而在堆叠柱图则是一个个叠加起来的。本次实验结合本章讲述的堆叠柱形图的列子,这里我们要画的是极坐标系-堆叠柱状图,也是南丁格尔玫瑰图。由于半径和面积的关系是平方的关系,南丁格尔玫瑰图会将数据的比例大小夸大,尤其适合对比大小相近的数值;不管是延续性还是暂时性的时间数据,可视化的最终的目的就是从中发现趋势。时间型数据包含时间属性,不仅要表达数据随时间变化的规律,还需表达数据分布的时间规律。
2023-05-16 10:07:18 784
原创 基本统计图表
将《基本统计图表练习数据.xls》文件上传到和pycharm文件同一目录。建议使用Markdown写实验报告;但也可以使用Word写。样例方法使用的软件是WPS, 如果还没安装可点击。当然也可以使用Office,操作类似。任选一种实验报告撰写方式即可。
2023-05-16 09:56:56 96 1
原创 超市订单数据分析
由于订单日期是以日为单位的,所以处理以年汇总需要处理订单日期。注意:记录对应的是商品,所以要去除同一地区重复的订单ID。测试的数据会放评论区!按照指定实验报告模版写。
2023-05-12 11:40:26 457 3
原创 用户行为数据采集
在产品的开发和设计,尤其针对互联网的产品,对用户行为的数据进行筛选、统计、分析,从而发现用户的一些使用习惯,操作规律,并将这些规律反馈到产品的设计、开发、运维、市场以及营销上,进而对一些预先的方案进行调整和修正从而达到更好的效果。是通过调用埋点SDK函数,在需要埋点的业务逻辑功能位置调用接口,上报埋点数据。这样我们就启动成功两个flume,现在我们的flume就在扫描/opt/module/applog/log下的新生成的文件,和文件中新增的数据,并把它传入kafka的topic中,然后再传到hdfs中。
2023-05-12 11:14:23 1285 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人