大数据起步

大数据处理的共同特征:

1)数据分布在多个节点      2)计算程序靠近离数据更近    3)数据处理尽量在本地完成       4)顺序读取的I/O代替随机读取的I/O

大数据编程模型:

1)大规模并行处理数据库系统(Massively Parallel Processing , MMP):EMC公司的Greenmlum系统和IBM 公司的Netezza系统

2)内存数据库系统:Oracle的Exalytics和SAP公司的HANA系统

3)MapReduce系统,Hadoop

4)整体同步并行系统(Bulk srnchronous parallel ,BSP)系统:Apache HAMA  和Apache Giraph


Hadoop系统组成(基于Hadoop 1.x)

  守护进程:

      1)名称节点(构建大型计算集群系统的瓶颈)    2)辅助名称节点    3)作业跟踪器 (构建大型计算集群系统的瓶颈)   4)任务跟踪器

   主要的两种类型的节点:主节点和次节点

    主节点负责执行的守护进程:名称节点进程,辅助名称节点进程,作业跟踪器进程

    次节点负责执行的守护进程:数据节点进程,任务跟踪器进程



未完待续。。。。。。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值