茅坤宝骏氹的博客

写博客,纯粹自娱。转载文章来源网络,转载链接不一定是原文,如有侵权请联系删除...

什么是数据分析

转载自 什么是数据分析什么是数据思维?「企业数据化管理变革」这本书中对数据思维是这么阐述的:数据思维是根据数据来思考事物的一种思维模式,是一种量化的思维模式,是重视事实、追求真理的思维模式。很多人陷入了一种误区,认为数据思维就是罗列数据,其实不然,数据思维的重点是要得出定性的结论。 举个简单的例子...

2018-05-07 10:43:26

阅读数 117

评论数 0

HDFS的诞生

转载自 HDFS的诞生1牛刀小试张大胖找了个实习的工作, 第一天上班Bill师傅给他分了个活儿:日志分析。张大胖拿到了师傅给的日志文件,大概有几十兆,打开一看, 每一行都长得差不多,类似这样:212.86.142.33 – - [20/Mar/2017:10:21:41 +0800] “GET /...

2018-05-07 10:22:45

阅读数 183

评论数 2

漫画:什么是数据仓库

转载自 玻璃猫 算法与数据结构一个故事在很久很久以前,世界上生活着许多种族,有人类,有矮人,有精灵......他们有着不同的信仰,不同的文化,彼此相安无事。可是,有一个猥琐男却偏偏想要统治整个世界。如何统治这么多不同文化信仰的种族呢?猥琐男想出一个馊主意,打造出几枚拥有魔力的戒指,免费送给不同种族...

2018-04-17 22:37:31

阅读数 97

评论数 0

什么是大数据

转载自  玻璃猫 程序员小灰大数据是具有海量、高增长率和多样化的信息资产,它需要全新的处理模式来增强决策力、洞察发现力和流程优化能力。Big data is high volume, high velocity, and/or high variety information assets tha...

2018-04-12 15:25:39

阅读数 97

评论数 0

漫画:什么是MapReduce

转载自 脑洞有点大的  程序员小灰什么是MapReduce?MapReduce是一种编程模型,其理论来自Google公司发表的三篇论文(MapReduce,BigTable,GFS)之一,主要应用于海量数据的并行计算。MapReduce可以分成Map和Reduce两部分理解。1.Map:映射过程,...

2018-04-12 14:16:01

阅读数 210

评论数 0

Hadoop入门(二)集群安装

一、集群安装 1、安装JDK版本1.7 2、Hadoop版本 2.6.03、Hadoop的安装为分布式模式,考虑到实际条件集群机定为3台   二、安装

2017-11-26 17:57:15

阅读数 86

评论数 0

Hadoop入门(一)概念与单机安装

一、hadoop的概念 (1)什么是大数据   大数据是不能用传统的计算技术处理的大型数据集的集合。它不是一个单一的技术或工具,而是涉及的业务和技术的许多领域。   (2)hadoop的定义   Hadoop是一个由Apache基金会所开发的分布式系统基础架构。   Hadoop的框架最核心的设计...

2017-11-26 17:57:12

阅读数 108

评论数 0

HDFS 的dao

一、HDFS dao接口 package cn.mk.dao; import java.io.FileNotFoundException; import java.io.IOException; import org.apache.hadoop.fs.BlockLocation; impor...

2017-11-26 17:57:02

阅读数 140

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭