![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
离线技术
# 离线技术
glamour2015
这个作者很懒,什么都没留下…
展开
-
HBase之rowkey设计原则和方法
rowkey设计原则和方法rowkey设计首先应当遵循三大原则:rowkey长度原则rowkey是一个二进制码流,可以为任意字符串,最大长度为64kb,实际应用中一般为10-100bytes,它以byte[]形式保存,一般设定成定长。一般越短越好,不要超过16个字节,注意原因如下:1、目前操作系统都是64位系统,内存8字节对齐,控制在16字节,8字节的整数倍利用了操作系统的最佳特性。2...转载 2020-04-19 09:08:50 · 217 阅读 · 0 评论 -
大数据离线计算
离线计算概述所谓大数据离线计算,就是利用大数据的技术栈(主要是Hadoop),在计算开始前准备好所有输入数据,该输入数据不会产生变化,且在解决一个问题后就要立即得到计算结果的计算模式。离线(offline)计算也可以理解为批处理(batch)计算,与其相对应的是在线(online)计算或实时(realtime)计算离线计算的特点大数据离线计算为多种应用场景提供基础计算功能,其特点 为:...原创 2020-02-23 12:34:12 · 5950 阅读 · 0 评论 -
HBase介绍和工作原理
Hbase简介HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩、 实时读写的分布式数据库利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理 HBase中的海量数据,利用Zookeeper作为其分布式协同服务主要用来存储非结构化和半结构化的松散数据(列存NoSQL数据库)HBase数据模型命名空间命名空间是对表...原创 2020-02-29 20:29:01 · 523 阅读 · 0 评论