HIVE与GB2312字符集

最新推荐文章于 2022-03-16 18:05:26 发布

cfy_yinwenhao

最新推荐文章于 2022-03-16 18:05:26 发布

阅读量2.2k

点赞数

分类专栏： Hive 文章标签： jdbc hadoop java linux 存储平台

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cfy_yinwenhao/article/details/6981884

版权

Hive 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

HIVE 的Driver类在处理字符串时，是按照UTF-8来处理，但是HIVE的JDBC确没有强制按照UTF-8来处理，所以会发生中文字符无论是UTF8还是GB2312都会在JDBC查询时，都不能正确输出。

在Linux下Java的FileWriter默认是UTF8来写文件的，所以通过HIVE导入到HADOOP后，也是UTF-8的格式，如果依照之前（http://blog.csdn.net/cfy_yinwenhao/article/details/6977882）处理方式下，让JDBC的HIVEQueryDataSet以UTF-8来处理字符集，获取的数据是正确的。

但是这个方式下，UTF-8占用的空间比Latin1要大，Java的FileWriter写UTF-8文件，一个英文字符要占用2个字符的空间，太浪费了。。。尤其在HADOOP平台，本来就是处理大数据量的情况下，这么浪费的存储，真是不可取啊。

只能分析hive的源码了，看看能不能解决这个问题吧。。。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HIVE与GB2312字符集

HIVE 的Driver类在处理字符串时，是按照UTF-8来处理，但是HIVE的JDBC确没有强制按照UTF-8来处理，所以会发生中文字符无论是UTF8还是GB2312都会在JDBC查询时，都不能正确输出。在Linux下Java的FileWriter默认是UTF8来写文件的，所以通过HIVE导入到HADOOP后，也是UTF-8的格式，如果依照之前（http://blog.csdn.net
复制链接

扫一扫

专栏目录

cfy_yinwenhao CSDN认证博客专家 CSDN认证企业博客

码龄18年

12: 原创

48万+: 周排名

115万+: 总排名

3万+: 访问

: 等级

490: 积分

1: 粉丝

0: 获赞

6: 评论

6: 收藏

私信

关注

热门文章

分类专栏

Linux 3篇
C++ 4篇
Hadoop 3篇
Hive 4篇
Sql Server 5篇
Other 2篇

最新评论

HIVE打补丁编译Hive
ttkuso2: 请问能给我一个编译好的么，新手有点不懂，564190998@qq.com，谢谢
Sql server c#扩展存储过程支持并行多线程运算
晓哲: 找到原因了，多线程不能使用默认的连接了，必须自己重新建立连接。
Sql server c#扩展存储过程支持并行多线程运算
晓哲: TestStoredProcedureThread2函数没有被运行~~~
Sql server c#扩展存储过程支持并行多线程运算
晓哲: [Microsoft.SqlServer.Server.SqlProcedure] public static void TestStoredProcedureThread2() { int iT = 500; SqlConnection cnn = new SqlConnection("context connection=true"); cnn.Open(); SqlCommand cmd = new SqlCommand(); cmd.Connection = cnn; cmd.CommandText = "insert into testTable(test1, test2) values(getdate(), @p1)"; SqlParameter p1 = new SqlParameter("@p1", iT); cmd.Parameters.Add(p1); int i = cmd.ExecuteNonQuery(); cnn.Close(); SqlContext.Pipe.Send(i.ToString()); }
Sql server c#扩展存储过程支持并行多线程运算
晓哲: 我测试了下，无法多线程启动存储过程？ [Microsoft.SqlServer.Server.SqlProcedure] public static void AdjSelect(SqlInt32 iWeekID, SqlInt32 iObjType) { int iCount = 5; Queue thqueue = new Queue(); int [] iParameter = {1, 2, 3, 4, 5}; for (int i = 0; i < iCount; i++) { Thread th = new Thread(new ThreadStart(TestStoredProcedureThread2)); th.Start(); thqueue.Enqueue((object)th); /* Thread th = new Thread(new ParameterizedThreadStart(TestStoredProcedureThread)); th.Start((object)iParameter[i]); thqueue.Enqueue((object)th); */ } foreach (Thread th in thqueue) { th.Join(); } SqlContext.Pipe.Send(iCount.ToString()); }

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

目录

分类专栏

Linux 3篇
C++ 4篇
Hadoop 3篇
Hive 4篇
Sql Server 5篇
Other 2篇

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。