HBASE专栏。
文章平均质量分 80
日常记录学到的HBASE知识以及出现的一些错误和解决办法。
啊帅和和。
大数据小白,逐渐进阶。
展开
-
HBASE的优化
目录预分区划分hbase预分区Rowkey设计rowkey长度原则rowkey散列原则rowkey唯一原则热点问题加盐哈希反转时间戳反转其他一些建议BulkLoading 有关HBASE的优化应该有许多方面,但是重点应该还在这三个部分,一个是预分区,一个是Rowkey的设计原则,一个是BulkLoading直接将数据导入到HFile中;这里面的重中之重又是Rowkey的设计原则,因为HBASE查询数据之快一定和Rowkey分不开 预分区 默认情况下,创建HBASE表的时候会自动创建一个region分区,原创 2021-10-19 22:05:32 · 486 阅读 · 0 评论 -
Phoenix简解
目录HBASE与HIVE的执行效率比较Phoenix搭建Phoenix使用Phoenix二级索引 HBASE与HIVE的执行效率比较 Hive能够把sql转换成mr任务运行,但整体运行速度比较慢,而HBase能够做到毫秒级的响应,最底层还是基于scan操作以及过滤器进行处理的,而中间,有一个Phoenix Phoenix搭建 Phoenix使用 Phoenix二级索引 感谢阅读,我是啊帅和和,一位大数据专业大四学生,祝你快乐。 ...原创 2021-10-16 17:18:40 · 580 阅读 · 0 评论 -
HBASE详细概述
hbase的api操作总结下来就是一句话,就是 需要对表做一些操作,就使用getAdmin()(修改表结构什么的) 需要对数据做一些操作,就使用getTable() 感谢阅读,我是啊帅和和,一位大数据专业大四学生,祝你快乐。 ...原创 2021-10-13 11:28:26 · 125 阅读 · 0 评论 -
HBASE小练习-根据时间戳求最新的三个位置
需求: 拿到的数据样式:(第一列为md5号码,第二列为进出时间,第四列和第五列为人所在的经纬度) 位置由经纬度确定,也就是说,拿到经纬度也就是拿到了一个人的位置 输入md5号码,根据进出时间来求出最新的三个经纬度 处理: 1、先对数据做一个处理,将所有的空格换成逗号方便后面处理 这里是将数据在shell里面做的转换 cat part-00000|tr “\t” “,” > part-00001 2、开始写代码 import com.jcraft.jsch.IO; import org.apache原创 2021-10-13 09:31:11 · 248 阅读 · 0 评论