前言
本文继续上一篇,链接在文章底部
三、项目运行
1.数据导入
将trackinfo_20130721.txt文件上传到HDFS中,作者这里放在**/input**下
2.程序运行
使用如下命令运行程序:
hadoop jar <jar包位置> <程序文件主类名> <输入文件路径> <输出文件路径>
注意:
- 作者已经在代码中设置好了输入文件路径和输出文件路径,所以此处不必考虑路径
- 代码中共有三个主类,分别解决三个需求,但第一个和第二个需求实在第三个需求已经解决的基础上,所以先运行MainApp3,再运行其他两个
3.结果展示
需求三
需求二
需求一
准备步骤:https://blog.csdn.net/2303_77130695/article/details/139498794
具体代码:https://blog.csdn.net/2303_77130695/article/details/139606448