Hadoop:HDFS应用实践(1)
实验题目:HDFS应用实践——网易云热评采集与存储模块
实验环境:
-
操作系统:Windows 10
-
虚拟机环境:VMware Workstation 16 Pro
-
Linux系统:CentOS 7
-
开发工具:IntelliJ IDEA 2020.2.1 x64
-
JDK环境:JDK 1.8.0_301
-
Hadoop版本:3.2.2
实验内容:
该网易云热评采集与存储模块主要有以下几个功能:上传网易云热评文件、下载网易云热评文件、复制网易云热评文件、移动网易云热评文件、重命名网易云热评文件、新建目录以及删除网易云热评文件。本模块的功能点结构图如下图所示:
网易云热评采集与存储模块的业务流程图如下图所示:
在该流程中,每一条从开始到结束的单向线均为一个具体的业务,且在处理每个业务的同时,也注重对业务中细节的处理。
本次实验的H