- 博客(8)
- 收藏
- 关注
原创 大数据Linux学习之Sersync介绍 Linux运维
Sersync利用inotify技术实现水服务器数据实时同步的解决方案,其中监控sersync所在服务器上文件系统的事件变化,rsync是目前广泛使用的本地及异地数据同步工具,其优点是只对发生变化的目录数据操作,甚至是一个文件不同的部分进行同步,所以其优势大大超过使用挂接文件系统或scp等方式进行镜像同步。目前使用比较多的同步程序版本是inotify-tools,另外一个是Google开源项目op...
2018-05-11 16:23:24 195
原创 基于Hadoop数据仓库Hive1.2部署及使用
接下来安装Hadoop数据仓库Hive,上节了解HBase简单使用,听起来HBase与Hive有些类似,概念也有点模糊,那我们先了解下他们之间有什么区别: HBase是一种分布式、面向列的NoSQL数据库,基于HDFS存储,以表的形式存储数据,表由行和列组成,列划分到列族中。HBase不提供类SQL查询语言,要想像SQL这样查询数据,可以使用Phonix,让SQL查询转换成hbase的扫描和对应...
2018-05-11 16:19:13 230
原创 Hadoop运维记录系列(二十一)
大数据学习交流群 766988146 不管你是小白还是大牛,笔者我都挺欢迎,今天的源码已经上传到群文件,不定期分享干货,包括我自己整理的一份最新的适合2018年学习的大数据开发和零基础入门教程,欢迎初学和进阶中的小伙伴
2018-05-11 16:14:22 284 2
原创 大数据云盘核心技术:分布式文件系统的高级特性及实战,甲骨文技术总监整理!
一、什么是大数据?大数据的核心问题 举例: 1、商品推荐信息 问题1:大量的订单如何存储? 问题2:大量的订单如何计算? 2、天气预报 问题1:大量的天气数据如何存储? 问题2:大量的天气数据如何计算? 大数据的核心问题:1、数据的存储:分布式的文件系统 ...
2018-05-05 16:08:47 1164
原创 Hive数据仓库平台操作,甲骨文高级技术总监笔记看不看你决定!
今天小编给大家分享的是现今甲骨文Oracle公司高级技术总监的课堂笔记:大数据Hadoop生态Hive数据仓库平台管理操作及项目实战,这个课堂笔记需要有一些基础。大数据、Python学习资料分享群:596471005,我自己整理的一份最新的适合2018年学习的大数据开发和零基础入门教程已经上传到群文件。欢迎初学和进阶中的小伙伴。也可以关注我。最重要的是学习:思想、原理和体系结构1、HDFS2、Ma...
2018-04-02 20:03:34 250
原创 大数据分布式文件系统应用,阿里内部工程师整理,想学的可以看看
学习大数据,学什么?怎么学?今天给大家分享的文章就是分布式文件系统的高级特性及实战应用,各位大数据学习者都可以来看看。大数据、hadoop、Python学习资料分享群 596471005 不管你是小白还是大牛,小编我都挺欢迎,今天的源码已经上传到群文件,不定期分享干货,包括我自己整理的一份最新的适合2018年学习的大数据开发和零基础入门教程,欢迎初学和进阶中的小伙伴。也可以关注我。1、原理和运行机...
2018-04-02 19:58:43 245
原创 大数据Hadoop的分布架构ZooKeeper实战,甲骨文总监整理!
今天小编给大家分享的是现今Oracle高级技术总监的课堂笔记:大数据Hadoop的HA高可用架构集群+分布架构ZooKeeper实战应用,这个课堂笔记需要有一些基础。(1)Hadoop的体系结构(2)Spark的体系结构3、HA:high avaibility高可用性 ----> 解决大数据的单点故障问题===========================================一...
2018-04-02 19:54:38 425
原创 大数据杀熟?还是??
马克思曾在《资本论》里引用了「评论家周刊」中的那段话:资本害怕没有利润或利润太少,“一旦有适当的利润,资本就胆大起来。如果有10%的利润,它就保证到处被使用;有20%的利润,它就活跃起来;有50%的利润,它就铤而走险;为了100%的利润,它就敢践踏一切人间法律;有300%的利润,它就敢犯任何罪行,甚至冒绞首的危险。这段名言后来被广泛传播成为脍炙人口的名言。资本家必然是逐利的,而大数据对电商而言是很...
2018-03-08 20:55:20 714
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人