大数据 入门

最小的基本单位是bit,按顺序给出所有单位:bitByte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。

  Bit比特) =Binary Digit
8 Bits = 1 Byte( 字节
1,000 Bytes = 1 Kilobyte
1,000Kilobytes = 1 Megabyte
1,000 Megabytes = 1 Gigabyte
1,000 Gigabytes = 1Terabyte
1,000 Terabytes = 1 Petabyte
1,000 Petabytes = 1 Exabyte
1,000Exabytes = 1 Zettabyte
1,000 Zettabytes = 1 Yottabyte
1,000 Yottabytes = 1Brontobyte
1,000 Brontobytes = 1 Geopbyte
======
大数据这个入门。
快速入门
看了一些资料,书籍,还是懵逼。
就是知道了一些大数据名词,但还是不清楚到底是怎么回事。
是什么,怎么用。云里雾里的,很容易浮躁,看不下去,难以入门。
一种难以沟通的感觉。
实践,需要Linux系统。自己没有。 需要有。 
如果你想要走这条道路,那么就别撤退,不看了不学了不搞了。 
既然想要搞,就想办法搞,遇到困难不必浮躁,冷静下来去解决。
========
 

High Scalability 高可扩展性
NoSQL是Not Only SQL的缩写
Sharding(分片)
分片是指将数据拆分,将其分散在不同机器上的过程。
分片就是数据拆分。 名字起得不好,都不知道啥意思。

什么是分布式?
分布式 什么意思
一个业务分拆多个子业务,部署在不同的服务器上。
集群:同一个业务,部署在多个服务器上
分布式 就是 拆分业务
集群 就是 多个机器共同分担一个业务。

HDFS—Hadoop Distributed File System
Hadoop分布式文件系统
Reduce 减少,分解。
MapReduce实现了Map和Reduce两个功能
Map把一个函数方法应用于集合中的所有成员,然后返回一个基于这个处理的结果集;
Reduce对结果集进行分类和归纳;
Map()和 Reduce() 两个函数可能会并行运行,

=======

 

转载于:https://www.cnblogs.com/yue31313/p/7838046.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值