- 博客(4)
- 收藏
- 关注
原创 MapReduce:大数据处理的基石
定义:MapReduce是一个分布式运算程序的编程框架,其核心功能是将用户编写的业务逻辑代码和自带的默认组件整合成一个完整的分布式运算程序,并发运行在一个Hadoop集群上。一个基本完整的MapReduce程序流程,包括:数据分片-数据映射-数据混洗-数据归约-数据输出Map阶段Map函数以键值对作为输入,并产生一系列新的键值对作为输出。这些输出键值对随后会按照键进行排序和分组。MapReduce作为一种分布式运算程序的编程框架,在大数据处理领域发挥着重要作用。
2024-06-01 10:21:11 1006
原创 爬取豆瓣短评(以电锯惊魂为例)
作为中国最大的电影评论网站之一,拥有大量的电影评论数据。这些数据对于电影研究者、影迷以及电影产业相关人士来说,具有极高的价值。本文只介绍如何使用Python爬取短评。
2023-12-23 14:24:54 675 1
原创 Python绘制词云图
通过以上步骤,我们使用了Python绘制出词云图。在绘制过程中,需要注意选择合适的文本数据和参数设置,以便得到更好的可视化效果。此外,还可以根据需要自定义词云图的样式和布局,使得词云图更加符合实际需求。在未来中,我们可以进一步探索词云图的应用场景和优化方法,提高数据可视化的效果和质量。
2023-12-21 09:57:35 1190 1
原创 Java猜大小游戏——简单的编程实践
大家好,今天我将和大家一起分享一个简单的Java编程实践——猜大小游戏。这个游戏的规则非常简单,计算机会随机生成一个1到100之间的整数。每次猜测后,计算机会告诉玩家他们的猜测是太大、太小还是正确。通过这个简单的Java编程实践,我们学习了如何使用随机数生成器、扫描器和基本的控制结构来创建一个交互式游戏。
2023-12-15 20:08:06 1046 4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人