sqoop主要的作用是将hdfs中的数据库文件导入到mysql中,
必须保证mysql中的变量名称和源数据库中的名称及类型必须一样
配置sqoop
下载压缩包,解压,可以的话可以配置环境变量,不常用的话不需要配置环境变量
需要将jdbc驱动包加载到lib文件中。查看sqoop配置完成的命令sqoop help
导入的时候需要注意用什么字符串来进行切分,通常的做法是使用'\t',但是
在sqoop中,该字符的表示形式为'\001',可以考虑使用此字符来进行切分变量
n
sqoop执行MapReduce使用的是分布式的形式来执行的,因此用户需要具有能够远程
访问的权限,配置该权限的命令是
GRANT ALL PRIVILEGES ON *.* TO 'root'@'192.168.1.100' IDENTIFIED BY '123456';
这其中的内容涉及到sql权限的配置
执行完该命令之后需要立即更新配置也就是flush一下,命令如下
flush privileges;
第一个:*.* 它表示什么数据库什么表,这里*表示任何的数据库和任何的表的意思
第二个:root,这个是远程登录mysql的账号
第三个: 192.168.1.100,这个是开放的用户,这里是IP
第四个:是远程登录mysql的密码