- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 Hbase技术总结
Hbase是一个分布式列式数据库,列存储读取不存在冗余,行存储可以一次性存入。1.表->HTable2.按RowKey范围分为Region---HRegion--Region Servers3.HRegion按列簇---多个HStore4.HStore--memstore+HFiles(均为有序的KV)5.HFiles--HDFS说明:HRegion是HBASE中分布式存储和负载均衡最小的单元。最小单元表示不同的HRegion可以分布在不同的HRegion Server上,
2022-02-11 15:52:34 1168
原创 Hive技术总结
hivehive库表中信息查询:hadoop fs -ls /user/hive/warehouse/oa.dbHive中可以使用UDF(User Defined Function)用户自定义函数,UDF函数可以直接应用于select语句,对查询结构进行格式化处理后输出。UDF函数需要注意:--自定义UDF需要继承org.apache.hadoop.hive.ql.UDF;--需要实现evaluate函
2022-02-11 11:44:01 515
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人