HBase中关于中文的处理

最新推荐文章于 2024-08-11 03:53:27 发布

dajuezhao

最新推荐文章于 2024-08-11 03:53:27 发布

阅读量2.3w

点赞数 1

分类专栏： HBase 文章标签： hbase table string exception windows linux

本文链接：https://blog.csdn.net/dajuezhao/article/details/5751646

版权

本文介绍了在HBase hbase-0.20.5版本中处理中文数据的方法，包括通过Java代码在Windows环境下成功录入汉字，以及在Linux下遇到的编码问题。在Linux下，由于编码格式差异，汉字前可能会出现“?”。解决办法是将文件在Linux下转换编码，避免Windows的3字节UTF-8头。此外，展示了HBase中查看的ASCII编码汉字，并提供了转换回汉字的方法。

摘要由CSDN通过智能技术生成

1、HBase版本hbase-0.20.5，Hadoop的版本hadoop-0.20.2，JDK1.6

2、在HBase中创建了表，如果想通过控制台使用命令写入含有汉字的数据，录入是不成功的。

3、如果想对汉字进行录入，可以通过代码实现，这里我使用的是java，代码如下：

         /**
	 * 向指定的表插入单个Put对象
	 * 
	 * @param tablename
	 * @param conf
	 * @throws Exception
	 */
	public static void insertData(String tableName, HBaseConfiguration conf) {
		HTable table = null;
		try {
			if (table == null) {
				table = new HTable(conf, tableName);
			}
			// 这里我使用time+6位随机数为row关键字,确保不重复
			String rowname = System.currentTimeMillis() / 1000 + "" + CommUtil.getSixRadom();
			System.out.println("rowname = " + rowname);
			Put p = new Put(Bytes.toBytes(rowname));
			p.add("acc".getBytes(), new Long(System.currentTimeMillis()).longValue(), "大绝招".getBytes());
			p.add("pwd".getBytes(), new Long(System.currentTimeMillis()).longValue(), "123456".getBytes());
			p.add("sex".getBytes(), new Long(System.currentTimeMillis()).longValue(), "1".getBytes());
			p.add("age".getBytes(), new Long(System.currentTimeMillis()).longValue(), "2222".getBytes());
			table.put(p);
		} catch (Exception e) {
			e.printStackTrace();
		}

最低0.47元/天解锁文章

dajuezhao

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
2
评论
HBase中关于中文的处理

1、HBase版本hbase-0.20.5，Hadoop的版本hadoop-0.20.2，JDK1.6 2、在HBase中创建了表，如果想通过控制台使用命令写入含有汉字的数据，录入是不成功的。 3、如果想对汉字进行录入，可以通过代码实现，这里我使用的是java，代码如下： /** * 向指定的表插入单个Put对象 * * @param tablename * @param conf * @throws Exception */
复制链接

扫一扫

专栏目录