- 博客(8)
- 收藏
- 关注
原创 Hadoop完全分布式部署
Hadoop的优势1、高可靠性:Hadoop底层维护多个数据副本,所以即使Hadoop某个计算元素或存储出现故障,也不会导致数据的丢失。2、高扩展性:在集群间分配任务数据,可方便的扩展数以千计的节点。3、高效性:在MapReduce的思想下,Hadoop是并行工作的,以加快任务处理速度。4、高容错性:能够自动将失败的任务重新分配。分布式文件系统分布式计算框架资源管理器数据存储和备份映射与规约提高。
2024-12-17 05:38:47
1093
原创 基于Flask框架搭建简易可视化网页
Flask 是一个用 Python 编写的轻量级 Web 应用框架。它是由 Armin Ronacher 开发的,并于 2010 年首次发布。Flask 以其简单性和灵活性而著称,非常适合开发小型到中型的 Web 应用程序。
2024-12-10 00:15:26
2087
原创 爬取豆瓣电影Top250进行数据清洗并存储到MongoDB
pandas,requests,matplotlib,lxml,python爬虫,mongodb数据库,python数据分析,数据可视化,数据预处理
2024-06-25 03:17:30
2118
2
原创 MongoDB的基本操作、Python的连接使用
MongoDB的基本使用,包含数据库的创建,集合的增删查改,文档的聚合查询。本地端Python连接MongoDB的简单使用
2024-04-23 01:39:25
1440
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人