2018年09月_deyu01

11月 10月 09月 08月 05月 04月 03月 02月 01月

原创大数据8-Hive简介和集群搭建

1.Hive特点： 1.1可扩展性：Hive可以自由的扩展集群的规模，一般情况下不需要重启服务； 1.2延展性：Hive支持用户自定义函数，用户可以根据自己的需求来实现自己的函数； 1.3容错：良好的容错性，节点出现问题，SQL仍可以完成执行。2.HIve架构 2.1基本组成：用户接口：包括CLI、JDBC/...

2018-09-30 10:30:36 423

转载大数据7-Hadoop的高可用（HA）

1.hadoop的高可用原理：双namenode协调工作的要点：A、元数据管理方式需要改变：内存中各自保存一份元数据 Edits日志只能有一份，只有Active状态的namenode节点可以做写操作两个namenode都可以读取edits 共享的edits放在一个共享存储中管理（qjournal和NFS两个主流实现）B、需要一...

2018-09-27 09:50:19 258

转载大数据6-Maptask并行度有关

1.FileInoutFormat切片机制：2.总结： 1.切片是为了给maptask分配任务，也就是为了整个mapreduce程序做map的并行度规划； 2.一个切片会交给一个maptsak来处置； 3.默认的切片机制是FileInputFormat getSplits（），他的逻辑是对输入目录中所有的文件挨个进行切片，切片的参数splitSize == b...

2018-09-17 09:25:43 253

原创大数据5-hadoop实现wordcount

1.原理：用户编写的程序分成三个部分：Mapper，Reducer，Driver(提交运行mr程序的客户端) Mapper的输入数据是KV对的形式（KV的类型可自定义） Mapper的输出数据是KV对的形式（KV的类型可自定义） Mapper中的业务逻辑写在map()方法中 map()方法（maptask进程）对每一个<K,V>调用一次 Reducer的输入数据类型对应M...

2018-09-06 10:14:03 346

Echarts3实现省和单列市数据（动态涟漪图）

包含实现的全部文件和代码，下载之后可以直接使用。动态实现了省和四个计划单列市的数据，根据涟漪的波浪大小来比较数据的大小，显得高大上。代码里面有详细说明可以根据需求修改。如要实现更多城市的数据，则直接添加两个json数据即可，方便实用

2018-09-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 大数据8-Hive简介和集群搭建

转载 大数据7-Hadoop的高可用（HA）

转载 大数据6-Maptask并行度有关