bigdata
文章平均质量分 86
LaoLiulaoliu
这个作者很懒,什么都没留下…
展开
-
【甘道夫】HBase基本数据操作详解【完整版,绝对精品】
引言 之前详细写了一篇HBase过滤器的文章,今天把基础的表和数据相关操作补上。 本文档参考最新(截止2014年7月16日)的官方Ref Guide、Developer API编写。 所有代码均基于“hbase 0.96.2-hadoop2”版本编写,均实测通过。 欢迎转载,请注明来源: http://blog.csdn.net/u010967382/article/det...转载 2020-06-15 14:13:59 · 165 阅读 · 0 评论 -
【甘道夫】HBase基本数据操作详解【完整版,绝对精品】
引言 之前详细写了一篇HBase过滤器的文章,今天把基础的表和数据相关操作补上。 本文档参考最新(截止2014年7月16日)的官方Ref Guide、Developer API编写。 所有代码均基于“hbase0.96.2-hadoop2”版本编写,均实测通过。 欢迎转载,请注明来源: http://blog.csdn.net/u010967382/article/details/37878701 概述 对于建表,和RDBMS类似,HBase也有namespace的概念,可以指定表空间创建表,也可以直接创.转载 2020-06-15 14:06:31 · 310 阅读 · 0 评论 -
HDFS技术原理
HDFS概述及应用场景 HDFS在FusionInsight产品的位置 HDFS系统架构 关键特性介绍 HDFS概述及应用场景举例 HDFS(Hadoop Distributed File System)基于Google发布的GFS论文设计开发,运行在通用硬件上的分布式文件系统。其除具备其它分布式文件系统相同特性外,还有自己特有的特性: 高容错性:认为硬件总是不可靠的 高吞吐量:为大量数据访问的应用提供高吞吐量支持 大文件存储:支持存储TB-PB级别的数据 HDFS适合做什么?大文件存储转载 2020-06-14 15:33:37 · 371 阅读 · 0 评论 -
hadoop2.3.0单点伪分布与多点分布的配置
机器mac book,virtualbox4.3.6,virtualbox安装ubunt13.10,在多点分布环境中,配置好一个机器后,clone出另外2个,一共三台机器。 1. Configure the Environment Bash语言: sudo apt-get install -y openjdk-7-jdk openssh-server sudo add原创 2014-03-19 17:04:52 · 2561 阅读 · 2 评论 -
地理空间距离计算优化
原文地址:http://tech.meituan.com/lucene-distance.html 1 地理空间距离计算面临的挑战 打开美团app,不管是筛选团购还是筛选商家,默认的排序项都是“离我最近”或者“智能排序”(如下图所示)。 不管是“离我最近”还是“智能排序”,都涉及到计算用户位置与各个团购单子或者商家的距离(注:在智能排序中距离作为一个重要的参数参与转载 2015-02-05 11:56:40 · 803 阅读 · 0 评论