hadoop学习笔记

最新推荐文章于 2023-04-09 00:21:59 发布

小飞侠-2

最新推荐文章于 2023-04-09 00:21:59 发布

阅读量384

点赞数

分类专栏：我的学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_26562641/article/details/51188706

版权

我的学习笔记专栏收录该内容

5 篇文章 0 订阅

订阅专栏

hadoop的核心就是hdfs和mapreduce ，两者只是理论基础，不是具体可使用的高级应用，hadoop下面有很多经典的子项目，比如hbase，hive等，这些都是基于hdfs和mapreduce发展出来的。

hdfs（hadoop distributed file system，hadoop分布式文件系统），他是一个高度容错性的系统，适合部署在廉价的机器上，hdfs能提供高吞吐量的数据访问，适合那些有着超大数据集的应用程序。

hdfs关键元素有：

block：将一个文件进行分块。128m

nameNode:保存整个文件系统的目录信息，文件信息及分块信息，

dataNOde：分布在廉价的计算机上，用于存储block块文件。

mapreduce：

通俗说mapreduce是一套从海量的数据提取分析元素最后返回结果的编程模型，将文件分布式存储在硬盘是第一步，从海量数据中提取分析我们需要的内容就是mapreduce做的是了，

hadoop common:hadoop体系最低成的模块，为hadoop哥哥项目提供各种工具，如配置文件和日志操作。

hdfs：分布式文件系统，提供高吞吐量的应用程序数据访问，对外部客户机而言，hdfs就像一个传统的分级文件系统，可以创建，删除，移动或者重命名文件，等等，但是hdfs的架构是基于一组特定的节点构建的，这是由他自身的特点决定的，这些节点报矿namenode，他在hdfs内容提供元数据服务，datanode，为hdfs提供存储块。

存储在hdfs中的文件被分成块，然后将这些块赋值到多个计算机中，datanode，这与传统raid架构大不相同，块的大小和复制的快的数量在创建文件时由客户机决定，namenode可以控制所有文件操作，hdfs内部的所有通信头基于标准tcp ip协议。

hadoop 家族中不包括flume sqoop mahout

hdfp学习：

namenode 保存元数据，启动时加载到内存中，工作时都是读取内存中的元数据，当然磁盘也有保存，并且保存，保存文件 block，datanode的映射关系。

分布式计算就是移动计算不移动数据

一个切片对应一个map 怎么去切片切片是程序控制 mpareduce 输入输出都是键值对形式

hadoop生态关键词：

hdfs mapreduce hbase hive pig zookeeper mahout avro sqoop flume storm spark。

下面是个简单的mapreduce程序。

public class wordcount(){

//首先 map用来读取数据进入下个环节

public static class tokenizerMapper extends Map<Object,text,text,IntWritable>{

private final static IntWritable one=new IntWritable();

private Text word=new Text();

pubilc void map(){

Object key,Text value,Context context{

Stringtokenizer itr=new String tokenize(value.toString));

while(itr.hasMoretoken){

context.write(word,onte);

}

}

}

//其次reduce用来对读取的数据进行一些简单的处理操作

public static class IntSumReducer extends Reducer<Tet,IntWritable,Text,IntWritable>

private IntWritable result=new IntWritable();

public void reduce Text key,Iterable<IntWritable>

values,context context

}

int sum=0;

for(IntWritable val:values){

result.set(sum);

context.write(key,result);

}

//一般主函数都是用来运行job

public static void Main(){

Configuration conf=new Configuration();

Job jo=JOb.getInstance(conf,"word count");

}

}

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。