大数据Hadoop的基础知识与入门

随着大数据与云计算的应用十分广泛,在这里写一下我对大数据的基本认识与了解;

一、大数据是啥?

1.

(1)      举例子:商品推荐 问题(1)、大量订单如何存储  (2)、大量的订单如何计算

(2)      天气预报  问题  (1)、大量天气数据如何存储 (2)、大量天气数据如何计算

 2.核心问题  数据的存储 与数据的计算

3、Hadoop 要解决的问题就是上面两个问题

4. IBM提出大数据的定义5个v ,就是关于数据量大单词

 

二、如何学习大数据Hadoop

1.重要:原理与运行机制

2.操作: 开发程序(Java程序)

 

三、Google的基本思想;


3篇论文:

1.GFS (Google file system) : 分布式的文件系统(类似与网盘)----数据的存储----HDFS(Hadoop Distribute file system )

2.Page rank (搜索排名) 算法:        Google向量矩阵 大---小       -----数据的计算   Mapreduce 计算模型

3.Big Table (大表                         ------) NoSql 数据库  Hbase ( Hadoop  DataBase) 不支持事物

 

分布式文件系统 :思想来源:Google论文

   问题:1、数据不够安全  冗余度:Hadoop 默认是3    2、硬盘不够大 (多几块硬盘)

管理员:namNode  1+1 DataNode(具体存储


 



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值