Sqoop导入时注意事项

最新推荐文章于 2022-10-01 19:47:47 发布

帅气的程序员

最新推荐文章于 2022-10-01 19:47:47 发布

阅读量2.5k

点赞数 1

分类专栏：大数据-Hadoop 大数据-Hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hr787753/article/details/79159329

版权

大数据-Hadoop 同时被 2 个专栏收录

10 篇文章 0 订阅

订阅专栏

8 篇文章 0 订阅

订阅专栏

参考：http://blog.csdn.net/zleven/article/details/53781111

导入时需要注意：

1）数据库表名需要大写；我试小写好像也可以不知道是不是版本问题

Imported Failed: There is no column found in the target table xxx. Please ensure that your table name is correct.

2）数据库表没有主键时，需要指定--split-by参数或者使用--autoreset-to-one-mapper参数；
Error during import: No primary key could be found for table xxx.

3）使用查询语句（--e或--query）导入时，需要指定--split-by参数及--target-dir参数；
When importing query results in parallel, you must specify --split-by. Must specify destination with --target-dir.

4）使用查询语句导入时，需要在where子句中加入$CONDITIONS

java.io.IOException: Query [select * from xxx] must contain '$CONDITIONS' in WHERE clause.

如：

[plain]view plain copy 
    
 $ sqoop import  --connect jdbc:oracle:thin:@192.168.1.10:1521:TEST --username test --password test   
 --e 'select * from T_SQOOP_TEST where $CONDITIONS' --verbose --split-by ID --target-dir temp3 --m 1  

5） sqoop默认使用“,”（逗号）作为列分隔符，\n（换行符）作为行分隔符。当导入的数据中包含","或\n时可以通过--fields-terminated-by <char>参数指定列分隔符；使用--lines-terminated-by <char>参数指定行分隔符。

6）sqoop对大对象（CLOB和BLOB字段）有2种处理方式：一种方式是内嵌方式，直接将大对象和其他字段数据放在一起；另一种方式是将大对象单独存储，然后和主数据做一个关联。

通常，小于16MB的大对象字段采用第一种方式大对象和主数据一起存储。超过16MB的大对象采用第二种方式单独存储在导入目录的_lobs子目录下，每个文件最大能容纳2^63字节。可以通过--inline-lob-limit参数设置内嵌字段的大小，如果设置为0，则所有大对象将会单独存储。

帅气的程序员

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。