大数据毕业设计吊打导师hadoop+spark+hive小说数据分析可视化大屏(1)

最新推荐文章于 2024-10-08 11:26:52 发布

幸横网络

最新推荐文章于 2024-10-08 11:26:52 发布

阅读量439

点赞数 6

分类专栏：程序员文章标签：大数据 hadoop 课程设计

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sheji510/article/details/137728916

版权

本博客分享了一次大数据毕业设计，涉及爬取17k小说数据、MapReduce清洗、Hive建表、Spark分析、Flask+Echarts大屏展示。作者拥有丰富工作经验，分享了全套学习资料，涵盖大数据开发主要知识点，提供技术交流社区。

摘要由CSDN通过智能技术生成

1.爬取17k.的小说数据约5-10万，存入mysql数据库；
2.使用mapreduce对mysql中的小说数据集进行数据清洗，转为.csv文件上传至hdfs文件系统；
3.根据.csv文件结构，使用hive建库建表；
4.一半分析指标使用hive_sql完成，一半分析指标使用Spark-Scala完成;
5.将分析结果使用sqoop导入mysql数据库；
6.使用Flask+echarts构建可视化大屏；
创新点：Python爬虫、海量数据、可视化、实时计算spark+离线计算hive双实现
可选装知识图谱、推荐系统、后台管理、预测系统

最低0.47元/天解锁文章

关注

6
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。