课 程 名 称                                                                                                                            

《Hadoop企业应用实战》——企业使用Hadoop的真实案列

详情链接:http://www.chinahadoop.cn/course/33

时 间                                                                                                                                    

第一期 5月12日-6月21日共八周

培 训 方 式                                                                                                                            

视频学习 + 在线答疑 + 每周作业 + 结业考试

培 训 价 格                                                                                                                            

599 元  5月5日之前
¥ 649元  5月6日——5月8日
¥ 699元  5月9日——5月11日


授 课 对 象                                                                                                                            

商业智能(BI)和企业数据仓库(EDW)的管理人员、建模人员、分析和开发人员、系统管理员等;

有意将Hadoop生态系统中的组件,作为现有EDW的补充,或未来替代产品的项目负责人及开发人员;

企业中牵涉到大数据处理的数据中心运行、规划、设计负责人;

Hadoop企业级应用、整合项目的成员、负责人、开发人员;

熟悉Hadoop生态系统,想了解和学习Hadoop企业应用实战案例的朋友。

课 程 大 纲                                                                                                                          

本课程目标是:给大家分享一些不能在网上随便一搜就搜到的内容和窍门,展示几个真实企业应用中的Hadoop成功案例

第一周:企业级Hadoop应用概述,Hadoop生态系统与现有企业级应用的整合

  1. 企业级集群部署、数据管理、任务调度、集群监控

  2. Hadoop现有架构的种种问题和限制,HA

  3. 企业数据仓库的选型,Hadoop世界与EDW世界中的TPC(TPC DS与TPC H

  4. Hadoop世界中的DBA

  5. 成本考量 —— 人?物?物是人非……


第二周:Hadoop Eco System 进阶应用基础知识
  1. HDFS / MapReduce / Yarn / Hive / Impala/Oozie 进阶应用、资源分配及调优

  2. 玩转Hive ETL高级应用:external  table、partition

  3. Hive的Windowing and Analytics Functions

  4. Hive 0.13的新功能

  5. Impala与Hive对比,各种Hints:Hive的Map Join,Impala的SHUFFLE Join(partitioned join)


第三周:进阶应用实例 — 初级
  1. 基于用户行为记录分析的用户个性化标签

  2. ——广告/电商行业Hadoop企业级大数据应用方案


第四周:Hadoop Eco System 进阶应用基础知识
  1. HBase / ZooKeeper / Sqoop / Graphite/ Ganglia 进阶应用及调优,Spark / Shark简介

  2. HBase Coprocessor介绍、开发与测试

  3. HBase与Hive的整合高级应用:binary(byte) value,lateral view explode

  4. Hive 0.13:posexplode

  5. Spark / Shark开发介绍


第五周:进阶应用实例 — 中级
  1. Hadoop生态系统中为企业级开发提供的测试框架应用实例

  2. 与Continuous Integration系统整合的可能

  3. ——软件/互联网行业Hadoop企业级开发框架


第六周:Hadoop Eco System 企业级应用整合
  1. HBase与Hive整合的大坑

  2. HBase的Region进阶应用Compact、Split与Merge

  3. HBase Coprocessor与HBase + Hive分别适用的场景

  4. 与现有企业级BI平台的整合

  5. 企业中应用HiveImpalaSpark / Shark的注意事项,资源分配方案

  6. Pentaho PDI / Kettle

  7. Oracle or In-Memory Database

  8. MicroStrategy / Tableau


第七周:进阶应用实例 — 高级
  1. 整合Hadoop与现有RDBMS的企业级BI解决方案

  2. —— 互联网行业Hadoop企业级大数据BI应用整合方案


第八周:总结与展望
  1. 现有几大Hadoop平台比较:Cloudera CDH,Hortonworks HDP,MapR

  2. CEP?Rule Engine?Stream processing?

  3. Hadoop大数据还能干什么?

  4. 金融 / 工业 / 能源 / Smart Data

  5. 德国汽车、新能源行业的大数据创新项目分享


主讲人:邱腾                                                                                                                        


专注于BI大数据架构及解决方案,精通网络数据、市场数据分析,早年泡过sunnet IRC,架过firebird BBS。
06年曾任职于新浪网络系统部,后转战德国科研机构Fraunhofer;
08年开始接触
hadoop/MapReduce,曾主导项目,通过整合Hadoop的各种组件使德国联盟广告商Zanox公司将海量tracking数据转化为DMP并成功与多家RTB和DSP平台对接。
现在欧洲最大的电商平台德国Zalando公司任大数据架构师


详情链接: http://www.chinahadoop.cn/course/33



在线咨询:                                                                                                                                                        

QQ群:306660272

电话:15611440609
邮件:admin@chinahadoop.cn


微信公众号:ChinaHadoop

13090956d5c1016179.jpg?2.0.3