happybase基本操作方法，2024年最新字节跳动算法工程师总结

2401_84164649

于 2024-04-08 04:03:52 发布

阅读量871

点赞数 5

分类专栏： 2024年程序员学习文章标签： python 网络数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_84164649/article/details/137486986

版权

2024年程序员学习专栏收录该内容

100 篇文章 0 订阅

订阅专栏

#2.建立HBase的连接
conn = happybase.Connection(
host=“192.168.25.200”, #主机名
port=9090, #Thrift的默认端口号
timeout=60000 #超时时间
)
#3.通过conn对象，调用tables方法，获取hbase中的表格
print(conn.tables())
#4.关闭连接
conn.close()

**注意：**如果运行结果报错显示无法连接到虚拟机节点，则需要检查你的虚拟机是否已经关闭防火墙，如果防火墙为开启状态，需要关闭防火墙：systemctl stop firewalld.service

（2）创建表

conn.create_table(
‘mytable’, # 表名，字符串类型
{‘cf1’: dict(max_versions=10), # 列族1
‘cf2’: dict(max_versions=1), # 列族2
‘cf3’: dict(), # 列族3，默认属性
}
)

通常，管理HBase，建议使用HBase Shell，因为HappyBase使用的Thrift接口仅有有限功能。

（3）获取表对象

table = conn.table(‘mytable’) # 传入表名

表不存在也不会报错，本步骤不会真的链接到HBase，只是在代码内创建一个table对象

（4）查询单行数据

table.row()从表中检索单行，并将其作为映射列到值的字典返回。

row = table.row(b’rk0001’)
print(row[b’info:name’]) # prints the value of info:name

返回值：b’zhangsan’，注意是二进制<class ‘bytes’>类型

转换字符串：

print(str(row[b’info:name’], encoding=“utf-8”))

即

str(bytes对象, encoding=“编码格式，通常使用utf-8”)

（5）查询多行数据

table.rows() 方法的工作方式与table.row() 类似，但需要多个行键并将它们作为 (key, data) 元组返回。

rows = table.rows([b’rk0001’, b’rk0002’])
for key, data in rows:
print(key, data)

“”"
返回值：
b’rk0001’ {b’data:pic’: b’picture’, b’info:age’: b’20’, b’info:gender’: b’female’, b’info:name’: b’zhangsan’}
b’rk0002’ {b’data:pic’: b’picture’, b’info:age’: b’11’, b’info:gender’: b’male’, b’info:name’: b’wangwu’}

注意哦，key是bytes对象
data是字典对象，字典中key和value都是bytes
“”"

（6）获取多版本数据

HBase支持存储同一单元的多个版本。这可以为每个列族配置。要检索给定行的列的所有版本，可以使用 table.cells()。此方法返回一个有序的单元格列表，最新版本排在最前面。

首先，准备一个保存多版本的表

create ‘tv’, {NAME => ‘info’, VERSIONS => 5}

插入版本1

put ‘tv’, ‘rk0001’, ‘info:name’, ‘hahaha’

插入版本2

put ‘tv’, ‘rk0001’, ‘info:name’, ‘heiheihei’

检查

hbase(main):024:0> scan ‘tv’
ROW COLUMN+CELL
rk0001 column=info:name, timestamp=1641836267655, value=heiheihei
1 row(s)
Took 0.0103 seconds

table = conn.table(‘tv’)

获取1个版本（默认最新咯）

values = table.cells(b’rk0001’, b’info:name’, versions=1)
print(type(values))
print(values)

“”"
返回值：
<class ‘list’>
[b’heiheihei’]
“”"

获取2个版本

values = table.cells(b’rk0001’, b’info:name’, versions=2)
print(type(values))
print(values)

“”"
返回值：
<class ‘list’>
[b’heiheihei’, b’hahaha’]
可见，2个版本都获取了，按照顺序，第一个最新

自我介绍一下，小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。

深知大多数大数据工程师，想要提升技能，往往是自己摸索成长或者是报班学习，但对于培训机构动则几千的学费，着实压力不小。自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年大数据全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，基本涵盖了95%以上大数据开发知识点，真正体系化！

由于文件比较大，这里只是将部分目录大纲截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频，并且后续会持续更新

如果你觉得这些内容对你有帮助，可以添加VX：vip204888 （备注大数据获取）

截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频，并且后续会持续更新**

如果你觉得这些内容对你有帮助，可以添加VX：vip204888 （备注大数据获取）
[外链图片转存中…(img-sZ6SeU8z-1712520222419)]

关注

5
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
happybase基本操作方法，2024年最新字节跳动算法工程师总结

截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频，并且后续会持续更新**
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。