HBase
文章平均质量分 65
HBase
优惠券已抵扣
余额抵扣
还需支付
¥9.90
¥99.00
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
不死鸟.亚历山大.狼崽子
太极计算机股份有限公司系统架构师,从事ios、.net、flex、java等开发
展开
-
HBase(19):Hbase项目实例
(2)在cn.itcast.momo_chat.service.impl包下创建HBaseNativeChatMessageService实现类,并实现getMessage方法。创建一个ExcelReader.java文件,ExcelReader工具类可以读取Excel中的数据称为HashMap这样,方便我们快速生成数据。在com.example.chatpro.entity包中创建一个名为Msg的实体类,使用Java代码描述陌陌消息。用于存放数据服务接口实现类相关代码,例如:查询的API代码。原创 2023-07-06 17:25:13 · 764 阅读 · 0 评论 -
HBase(18):表空间设计之ROWKEY设计原则
因为ROWKEY我们是使用多个字段拼接,而且前缀不是完全随机的,所以需要使用HexStringSplit。long类型为8个字节,8个字节可以保存非常大的无符号整数,例如:18446744073709551615。如果是字符串,是按照一个字节一个字符方式保存,需要快3倍的字节数存储。如果ROWKEY设计的都是按照顺序递增(例如:时间戳),这样会有很多的数据写入时,负载都在一台机器上。在HBase中,可以通过指定start key、end key来进行分区,还可以直接指定Region的数量,指定分区的策略。原创 2023-07-03 17:07:07 · 734 阅读 · 0 评论 -
HBase(17):表空间设计之数据压缩
在HBase可以使用多种压缩编码,包括LZO、SNAPPY、GZIP。只在硬盘压缩,内存中或者网络传输中没有压缩。通过以下输出可以看出,HBase创建表默认是没有指定压缩算法的。其中COMPRESSION => 'NONE'表示没有压缩算法。原创 2023-07-02 17:09:13 · 787 阅读 · 0 评论 -
HBase(16):表空间设计之列蔟设计与版本设计
一个列蔟所存储的数据达到flush的阈值时,表中所有列蔟将同时进行flush操作。这将带来不必要的I/O开销,列蔟越多,对性能影响越大。两个及以上的列蔟HBase性能并不是很好。原创 2023-07-02 16:54:39 · 608 阅读 · 0 评论 -
HBase(15):表结构设计之名称空间
在命令MOMO_CHAT命名空间下创建名为:MSG的表,该表包含一个名为C1的列蔟。删除命名空间,命名空间中必须没有表,如果命名空间中有表,是无法删除的。注意:带有命名空间的表,使用冒号将命名空间和表名连接到一起。原创 2023-07-02 16:45:26 · 1289 阅读 · 0 评论 -
HBase(14):HBase架构
客户端,例如:发出HBase操作的请求。例如:之前我们编写的Java API代码、以及HBase shell,都是CLient。在HBASE中,表被划分为很多「Region」,并由Region Server提供服务。在HBase的Web UI中,可以查看到Master的位置。当前Table的有效Region数为1。原创 2023-07-02 00:52:42 · 524 阅读 · 0 评论 -
HBase(13):HBase高可用
HBase的高可用配置其实就是HMaster的高可用。要搭建HBase的高可用,只需要再选择一个节点作为HMaster,在HBase的conf目录下创建文件backup-masters,然后再backup-masters添加备份Master的记录。一条记录代表一个backup master,可以在文件配置多个记录。原创 2023-07-01 18:50:11 · 832 阅读 · 0 评论 -
HBase(番外):常见问题
将 hadoop.dll 放到c:/windows/system32文件夹中,重启IDEA,重新运行程序。(1)找到$HADOOP_HOME/etc/mapred-site.xml,增加以下配置。无法连接到HBase,请检查HBase的Master是否正常启动。是因为缺少用户定义造成的,所以分别编辑开始和关闭脚本。(2)将配置文件分发到各个节点。(3)重新启动YARN集群。原创 2023-07-01 16:53:37 · 740 阅读 · 0 评论 -
HBase(12):Java编程
因为前面我们的代码,在打印所有的列时,都是使用字符串打印的,Hbase中如果存储的是int、double,那么有可能就会乱码了。从Linux中hbase环境中下载下载:sz /export/server/hbase/conf/hbase-site.xml。在HBase中,有一个Import的MapReduce作业,可以专门用来将数据文件导入到HBase中。在资料中,有一份10W的抄表数据文件,我们需要将这里面的数据导入到HBase中。查询rowkey为4944191的所有列的数据,并打印出来。原创 2023-07-01 16:41:58 · 551 阅读 · 0 评论 -
HBase(11):shell管理操作
检查表是否存在,适用于表量特别多的情况。删除一张表,记得在删除表之前必须先禁用。清空表的数据,禁用表-删除表-创建表。禁用一张表/启用一张表。例如:显示服务器状态。检查表是否启用或禁用。原创 2023-06-30 11:55:38 · 680 阅读 · 0 评论 -
HBase(10):INCR
incr可以实现对某个单元格的值进行原子性计数。语法如下:incr '表名','rowkey','列蔟:列名',累加值(默认累加1)如果某一列要实现计数功能,必须要使用incr来创建对应的列使用put创建的列是不能实现累加的。原创 2023-06-30 01:02:30 · 443 阅读 · 0 评论 -
HBase(9):过滤器
在HBase中,如果要对海量的数据来进行查询,此时基本的操作是比较无力的。此时,需要借助HBase中的高级语法——Filter来进行查询。Filter可以根据列簇、列、版本等条件来对数据进行过滤查询。因为在HBase中,主键、列、版本都是有序存储的,所以借助Filter,可以高效地完成查询。当执行Filter时,HBase会将Filter分发给各个HBase服务器节点来进行查询。HBase中的过滤器也是基于Java开发的,只不过在Shell中,我们是使用基于JRuby的语法来实现的交互式查询。原创 2023-06-29 20:37:05 · 1025 阅读 · 0 评论 -
HBase(8):扫描操作
在HBase,我们可以使用scan命令来扫描HBase中的表。[‘C1:STATUS’, …]在Ruby中[]表示一个数组。只查询订单状态以及支付方式,并且只展示3条数据。查看ORDER_INFO表中所有的数据。注意:要避免scan一张大表!原创 2023-06-29 18:54:26 · 2598 阅读 · 0 评论 -
HBase(7):大量数据的计数统计
当HBase中数据量大时,可以使用HBase中提供的MapReduce程序来进行计数统计。原创 2023-06-29 18:48:27 · 952 阅读 · 0 评论 -
HBase(6):计数操作
注意:这个操作是比较耗时的。在数据量大的这个命令可能会运行很久,真实环境不要使用该命令。查看HBase中的ORDER_INFO表,一共有多少条记录。count命令专门用来统计一个表中有多少条数据。count '表名'原创 2023-06-29 18:07:56 · 794 阅读 · 0 评论 -
HBase(5):导入测试数据集
ORDER_INFO.txt 中,有一份这样的HBase数据集,我们需要将这些指令放到HBase中执行,将数据导入到HBase中。将该数据集文件上传到指定的目录中,我这边直接上传到home下,现实环境中最好建立一个目录。可以看到这些都是一堆的put语句。那么如何才能将这些语句全部执行呢?原创 2023-06-29 15:33:46 · 826 阅读 · 0 评论 -
HBase(4):常用shell操作
我们可以以shell的方式来维护和管理HBase。例如:执行建表语句、执行增删改查操作等等。原创 2023-04-28 17:12:30 · 789 阅读 · 0 评论 -
HBase(3):集群搭建
(5)修改regionservers文件。(2)修改hbase-site.xml。(1)修改hbase-env.sh。(7)验证Hbase是否启动成功。(4)复制jar包到lib。(6)启动HBase。原创 2023-04-27 13:41:27 · 638 阅读 · 0 评论 -
HBase(2):HBase数据模型
在HBASE中,数据存储在具有行和列的表中。这是看起来关系数据库(RDBMS)一样,但将HBASE表看成是多个维度的Map结构更容易理解。表结构如下:ROWKEYC1列蔟C2列蔟rowkey列1列2列3列4列4列6列簇结构如下:rowkey0001C1(Map)列1 => 值1列2 => 值2列3 => 值3C2(Map)列4 => 值4列5 => 值5列6 => 值6"1" : "x",原创 2023-04-27 02:24:46 · 506 阅读 · 0 评论 -
HBase(1):简介
Kylin一个cube分析工具,底层的数据就是存储在HBase之中,不少客户自己基于离线计算构建cube存储在hbase之中,满足在线报表查询的需求。主要是轨迹、气象网格之类,滴滴打车的轨迹数据主要存在HBase之中,另外在技术所有大一点的数据量的车联网企业,数据都是存在HBase之中。不少的头条类、新闻类的的新闻、网页、图片存储在HBase之中,一些病毒公司的病毒库也是存储在HBase之中。在电信领域、银行领域,不少的订单查询底层的存储,另外不少通信、消息同步的应用构建在HBase之上。原创 2023-04-27 00:33:33 · 627 阅读 · 0 评论