Hadoop自带WordCount进行词频统计
准备:
- 安装好的Hadoop
- 需要统计词频txt文件(用jieba分过词的
链接: pycharm 分词 jieba 结巴分词输出txt.
step1
启动Hadoop
cd /usr/local/hadoop
./sbin/start-all.sh
用jps命令查看是否开启成功
准备好需要统计词频的txt文件(也可以用filezilla传入Ubuntu)
链接: 如何用filezilla连接Ubuntu.
- 找到Hadoop文件所在位置