spark demo之wordcount和K-means

最新推荐文章于 2024-06-03 09:52:57 发布

Hello-BigData

最新推荐文章于 2024-06-03 09:52:57 发布

阅读量743

点赞数

分类专栏： spark 文章标签： python spark demo wordcount k-means

本文链接：https://blog.csdn.net/hanlaipeng11/article/details/76863297

版权

由于Scala的学习成本有些高，所以，以下的demo都是基于python的。如果想了解spark架构，可以移步到博客点击打开链接

Wordcount介绍

作为类似于hello word一样经典的入门代码，wordcount主要是完成词频统计的，在spark框架中，它仍然是map和reduce两个步骤，但是代码的很简洁。

代码如下：

#!bin/lib/python
 
import sys
from operator import add
 
from pyspark import SparkContext
 
import sys
reload(sys)
sys.setdefaultencoding("utf-8")
 
if __name__ == "__main__":
    //定义上下文环境
    sc = SparkContext(appName="Py

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Hello-BigData

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
spark demo之wordcount和K-means

由于Scala的学习成本有些高，所以，以下的demo都是基于python的。Wordcount介绍作为类似于hello word一样经典的入门代码，wordcount主要是完成词频统计的，在spark框架中，它仍然是map和reduce两个步骤，但是代码的很简洁。代码如下：#!bin/lib/python import sysfrom operator imp
复制链接

扫一扫