Hadoop权威指南学习笔记_第一章_初识Hadoop

最新推荐文章于 2022-06-21 14:56:18 发布

weixin_34391445

最新推荐文章于 2022-06-21 14:56:18 发布

阅读量99

点赞数

文章标签：数据库数据结构与算法大数据

原文链接：http://blog.51cto.com/xxrenzhe/1238932

版权

学习时间：20130701

知识点积累：

数据的存储和分析：
1. 为了实现数据读取的高效，可从多个磁盘并行读取数据，需要解决2个问题：
  1. 硬件故障，避免数据丢失
  2. 大部分分析任务需要通过某种方式把数据合并起来
相较于其他系统：
1. 关系型数据库管理系统：
2. 网格计算：
  1. 高性能计算（High Performance Computing）的方法是将作业分配给一个机器集群，这些机器访问共享文件系统，由一个存储区域网络（Storage Area Network，SAN）进行管理；这非常适用于CPU密集型的作业，但当节点需要访问大数据量时，网络带宽将成为“瓶颈”
  2. MapReduce尝试在计算节点本地存储数据，这项“数据本地化”功能成为MapReduce的核心功能
  3. MapReduce检测失败的map或者reduce任务，在健康的机器上重新安排任务，而不需要程序员考虑失败任务的处理机制
3. 志愿计算：
  1. 志愿计算项目通过将他们试图解决的问题分成多个块，每个块称为一个工作单元，并将它们发到世界各地的电脑上进行分析
  2. SETI@home问题是CPU高度密集型的，并在接入互联网的不可信的计算机上运行，这些计算机的网速不同，而且数据也不在本地
Hadoop生态圈：
1. Common：一组分布式文件系统和通用I/O的组件与接口（序列化、Java RPC和持久化数据结构）
2. Avro：一种支持高效、跨语言的RPC以及永久存储数据的序列化系统；
3. MapReduce：分布式数据处理模型和执行环境，运行于大型商用机集群；
4. HDFS：分布式文件系统，运行于大型商用机集群；
5. Pig：一种数据流语言和运行环境，用以检索非常大的数据集；
6. Hive:一个分布式、按列存储的数据仓库，管理HDFS中存储的数据，并提供基于SQL的查询语句用以查询数据；
7. HBase:一个分布式、按列存储数据库，使用HDFS作为底层存储，同时支持MapReduce的批量式计算和点查询（随机读取）；
8. Zookeeper：一个分布式、可用性高的协调服务；提供分布式锁之类的基本服务用于构建分布式应用；
9. Sqoop:在数据库和HDFS之间高效传输数据的工具

转载于:https://blog.51cto.com/xxrenzhe/1238932

weixin_34391445

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop权威指南学习笔记_第一章_初识Hadoop

学习时间：20130701知识点积累：数据的存储和分析：为了实现数据读取的高效，可从多个磁盘并行读取数据，需要解决2个问题：硬件故障，避免数据丢失大部分分析任务需要通过某种方式把数据合并起来相较于其他系统：关系型数据库管理系统：网格计算：高性能计算（High Performance Computing）的方法是将作业分配给一个机器集群，这些机器访问共享文件系统，由一个存储区域...
复制链接

扫一扫

weixin_34391445 CSDN认证博客专家 CSDN认证企业博客

码龄8年

149: 原创

-: 周排名

81万+: 总排名

140万+: 访问

: 等级

7831: 积分

5172: 粉丝

254: 获赞

39: 评论

1462: 收藏

私信

关注

热门文章

最新评论

BIM是什么东西
爱卿别来无恙啊: “BIM化建筑设计生产方式是计算机进一步代替大脑计算工作的设计生产方式的进步，比如映射和过滤的计算，同时通过建筑信息实体也改变了存储的信息之间的逻辑关联与表达关系，比如建筑信息模型，使信息的BIM化管理也成为可能。” —— 《建筑设计生产BIM化》
js数学小知识之巧妙取反
陪星河入梦314: 您小子挺行啊
基于Windows7下snort+apache+php 7 + acid（或者base） + adodb + jpgraph的入侵检测系统的搭建（图文详解）（博主推荐）...
『Solitude 』: snort_2.8.6_installer.exe 安装报有没有
Chat-React基于react的聊天会话组件
weixin_44438054: 历史数据怎么清空啊
使用Echarts3实现渐变仪表盘需求
Ｓòrry╮: 可以自己加个指针 pointer: { icon: 'path://M2.9,0.7L2.9,0.7c1.4,0,2.6,1.2,2.6,2.6v115c0,1.4-1.2,2.6-2.6,2.6l0,0c-1.4,0-2.6-1.2-2.6-2.6V3.3C0.3,1.9,1.4,0.7,2.9,0.7z', length: '16%', width: 2, offsetCenter: [0, '-100%'], itemStyle: { color: 'auto' } },

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。