1.在实验前开启Hadoop集群
master:start-dfs.sh
slave1: satart-yarn.sh
注:namenode出现安全模式解决办法 hdfs dfsadmin -safemode leave
2.数据准备
将实验所有数据导入虚拟机中。
推荐路径
历史微博数据:/root/data/weibo
用户注册数据:/root/data/user
3.将存放历史微博数据合并
cd/root/data/weibo
4.创建实验所需要用到的数据库:
create database 数据库名;
use 数据库;