海量电商数据的处理与可视化

最新推荐文章于 2024-08-22 21:39:30 发布

-Kcaco

最新推荐文章于 2024-08-22 21:39:30 发布

阅读量1.9k

点赞数

文章标签： hadoop etl hdfs 数据可视化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_46304931/article/details/122457889

版权

海量电商数据的导入、分析与处理

海量数据的生成
海量数据的收集
数据导入与清洗
- kettle整合Hadoop
数据分析
数据可视化
流程图
待学习

海量数据的生成

海量数据的收集

数据导入与清洗

分布式下可以上传数据集到HDFS使用MR进行处理，单机可以使用kettle进行清洗。

kettle整合Hadoop

（1）修改配置文件：复制Hadoop的配置文件core-site.xml和hdfs-site.xml到kettle的插件目录下（如图4.13），覆盖掉原有的同名配置文件。在这里插入图片描述

（2）创建Hadoop cluster并测试是否创建成功。
在这里插入图片描述
（3）创建转换，配置Hadoop file input

（4）去空、去重、存储
在这里插入图片描述
（5）结果

数据分析

略

数据可视化

Echarts

●步骤1:引入echarts.js文件
●步骤2: 准备一个呈现图表的盒子
●步骤3: 初始化echarts实例对象
●步骤4:准备配置项（关键在这步）
●步骤5:将配置项设置给echarts实例对象

详细步骤：
在这里插入图片描述

配置项官方使用手册：https://echarts.apache.org/zh/option.html#title

Flask

是什么

轻量级的小框架，由于小，开源的插件多，所以灵活。

做什么

核心两部分：路由转发和模板渲染。

怎么做

两步：
1.写好页面或者找模板更具需求增删
2.定义好路由，把做好的html页面返回给用户
在这里插入图片描述

他做的的直接把原链接爬过来了，可以跳转过去。
在查库页面展示所有库信息效率低可以做分页
在这里插入图片描述

流程图

在这里插入图片描述

待学习

动态排序柱状图（可燃物了是）
地图可视化
bootstrap jquery
数据库分页展示

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

博客等级

码龄5年

13
原创

104
点赞

831
收藏

162
粉丝

关注

私信

热门文章

分类专栏

个人网站 1篇

最新评论

Python环境管理——Anconda
-Kcaco: 修改conda虚拟环境路径及安装包路径：https://blog.csdn.net/m0_56174109/article/details/137839695
Python环境管理——Anconda
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
Hadoop期末试题复习题
赵某某某某某: 关于数据副本的存放策略正确的有些? A、第三个副本:与第一个副本相同机架的其他节点上; B、更多副本:随机节点。 C、第一个副本,放置在上传文件的数据节点; D、第二个副本,放置在与第一个副本不同的机架的节点上; 正确答案： ABCD 正确答案是不是BCD啊第三个副本不是放到与第二个副本相同机架的不同节点上吗
Hadoop期末试题复习题
赵某某某某某: HDFS有一个gzip文件大小75MB，客户端设置Block大小为64MB。当运行mapreduce任务读取该文件时input split大小为？ A、一个map读取64MB，另外一个map读取11MB B、128MB C、64MB D、75MB 正确答案： D 这个的正确答案是A把两个切片
数据结构C/C++代码实现（可运行）2021.12.1
weixin_52686291: 为哈我一直程序运行不出来啊

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。