捣鼓的大半天,总算是把access 里面的数据先导入到windows下面的mysql 然后在导入到集群里面的mysql 最后导入到hdfs里面。
今天总结一下里面的经验:
1、access-->mysql 这里我使用的是 Navicat for MySQL 工具非常方便。
2、windows下面的mysql导入到集群里面去 同样是使用 mysql workbench 但是需要注意的是
2.1 默认情况下linux 下的mysql是不然外界连接的 所以你需要赋值相关的权限
grant create,select,insert,update,delete,ALTER on *.* to root@"%" Identified by "root"; 表示给root赋值create,select,insert,update,delete,ALTER这几种权限,让windos的mysql客户端可以使用这几种操作。
2.2set password for root@localhost=password('root')
该语句主要是用于修改mysql的密码。
3.把mysql里面的数据导入到hdfs 使用的是sqoop工具
hdfs dfs -ls 是查看hdfs 里面的文件
hdfs dfs -rm -r 是用来删除hdfs里面的文件
其实大部分的hdfs命令都是和linux的命令一样的只不过。在前面加了一定前缀。
sqoop import --connect jdbc:mysql://49.123.21.24/bbk_distinguish_cate --table c --username root --password root --m 1;
49.123.21.24 是主机的ip 使用127.0.0.1 或者localhost可能会报错。
bbk_distinguish_cate数据库名
c 表名
root 用户名
root 密码