Hadoop相关知识点

什么是Hadoop

一个分布式计算平台,以Hadoop分布式文件系统(HDFS)、MapReduce为核心。

Hadoop 的优点

易扩展:方便向集群中添加节点。
可靠:
容错:多个副本。
高效:在节点间动态移动数据。

Hadoop的项目结构

HDFS、MapReduce、Yarn、Common。
Zookeeper、Hive、HBASE、Pig。

MapReduce的计算流程

输入数据——切片——map——shuffle——reduce——输出数据。

HDFS的优点

手写WordCount程序

public class WordCount{
	public static void Map extends Mapper<LongWritable,Text,Text,IntWritable>{
		@override
		public void map(LongWritable key,Text value,Context context){
			context.write(value,new IntWritable(1));
		}
	}
	public static void Reducer extends Reducer<Text,IntWritable,Text,IntWritable>{
		@override
		public void reduce(Text key,Iterable values,Context context){
			for(IntWritable value:values)
				sum += value;
			context.write(key,sum)
		}
	}
	public static void main(String [] args){
		//构建、配置任务
		Configuration conf = new Configuration();
		Job job = Job.getInstance(conf);
		job.setJarByClass(WordCount.class);
		job.setMapperClass(Map.class);
		job.setReducerClass(Reducer.class);
		
		//设置输入、输出路径
		FileInputFormat.addInputPath(conf,new Path());
		FileOutputFormat.setOutputPath(conf,new Path());
       
       //设置输出键值对类型
       job.setOutputKeyClass(Text.class);
       job.setOutputValueClass(IntWritable.class);
      System.exit(job.waitForCompletion(true) ? 0 : 1);
	}
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

张之海

若有帮助,客官打赏一分吧

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值