大数据
benxiaohai529
这个作者很懒,什么都没留下…
展开
-
基于HBase的大数据存储的应用场景分析
引言 HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,适用于结构化的存储,底层依赖于Hadoop的HDFS,利用HBase技术可在廉价PCServer上搭建起大规模结构化存储集群。因此HBase被广泛使用在大数据存储的解决方案中。 为何使用HBase HBase的优点: 列可以动态增加,并且列为空就不存储数据,节省存储空间。 Hbase自动切分数据转载 2017-08-04 08:41:01 · 5479 阅读 · 0 评论 -
Hadoop-入门-01
一、 Hadoop是什么? Hadoop是一个大家族,是一个开源的生态系统,是一个分布式运行系统,是基于Java编程语言的架构。不过它最高明的技术还是HDFS、MapReduce、Yarn,使得它可以分布式处理海量数据。 1、HDFS(分布式文件系统): 它与现存的文件系统不同的特性有很多,比如高度容错(即使中途出错,也能继续运行),支持多媒体数据和原创 2017-07-26 20:37:31 · 278 阅读 · 0 评论 -
大数据路线
GitChat 作者:Fickr孫啟誠 原文: 三个月大数据研发学习计划实战解析 关注微信公众号:「GitChat 技术杂谈」 一本正经的讲技术 【不要错过文末彩蛋】 申明: 本文旨在为普通程序员(Java程序员最佳)提供一个入门级别的大数据技术学习路径,不适用于大数据工程师的进阶学习,也不适用于零编程基础的同学。 前言: 一、背景介绍 二、大数据介绍 正文:转载 2017-11-14 11:11:48 · 2695 阅读 · 0 评论