Hive导入数据的四种方式

1、从本地文件系统中导入数据到Hive表

2、HDFS上导入数据到Hive表

先将文件从本地导入到hdfs上

注意:

(1)是移动不是复制,hdfs中的teacher2.txt移动走了。

(2)如果有多个文件可以:load data inpath '/input/*' into table teacher;

3、从别的表中查询出相应的数据并导入到Hive表中

创建一个新表

覆盖插入:只覆盖相同分区的。

再覆盖插入到age=26的,就不会增多,而是将原来age=26的内容覆盖

4、在创建表的时候通过从别的表中查询出相应的记录并插入到所创建的表中,在实际情况中,表的输出结果可能太多,不适于显示在控制台上,这时候,将Hive的查询输出结果直接存在一个新的表中是非常方便的,我们称这种情况为CTAS(create table .. as select)如下:

注意:此种方式不需要后面的(id int,name string)row format delimited fields terminated by ‘  ‘

欢迎加入【大数据技术】社区

  • 2
    点赞
  • 44
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Hive导入数据乱码问题主要分为三种情况。第一种情况是Hive CLI查询乱码,但在Ambari端查看正常;第二种情况是导入包含汉字数据后,所有客户端方式查询都乱码;第三种情况是Hive CLI查询没有乱码,但通过JDBC或HiveServer2查询出现乱码。 对于第一种情况,导致乱码的原因是HiveServer2查询输出的格式发生了变化,可能是因为Hive环境的编码格式未配置正确。解决方案是在hive-env.sh文件的最后加上编码格式配置:export HADOOP_OPTS="$HADOOP_OPTS -Dfile.encoding=UTF-8"。 对于第二种情况,可能是由于使用的SSH工具的编码问题导致Hive CLI查询中文乱码。解决方案是将SSH工具(如Xshell、PuTTY)的编码修改为UTF-8,然后重新连接。 对于第三种情况,可能是因为数据编码不一致导致的问题。Hive默认使用UTF-8编码,而导入的中文文本数据需要保证也是UTF-8格式。解决方案是通过查看文本编码格式并进行修改。可以使用一些常用文本工具如EditPlus、Notepad打开包含中文的文件,将其编码格式修改为UTF-8并保存;或者在Linux或macOS终端下使用Vim编辑器打开文件,输入命令":set fileencoding=utf-8"修改编码格式并保存退出。 综上所述,解决Hive导入数据乱码问题的方法包括配置Hive环境的编码格式、修改SSH工具的编码设置以及确保数据的编码一致性。<span class="em">1</span><span class="em">2</span><span class="em">3</span><span class="em">4</span>
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

郝少

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值