hadoop笔记本

悉数那些“巨型”数据仓库

Hadoop在业界的使用情况

淘宝Hadoop集群的概况

分布式

Paxos在大型系统中常见的应用场景

hadoop的实现

HDFS的基本概念

HDFS 读写流程

HDFS namenode源码分析

HDFS datanode源码分析

HDFS dfsclient读文件过程 源码分析

HDFS dfsclient写文件过程 源码分析

MapReduce源码分析总结

mapreduce作业流程概论

How MapReduce Works

基于hadoop的crc校验谈hadoop的离线设计思想

Hadoop在MapReduce中使用压缩详解

HDFS数据的Checksum

Hadoop开发常用的InputFormat和OutputFormat

Hadoop之failed task和killed task

Hadoop的调度器总结

管理

hadoop集群部署

hadoop部署注意项

hadoop配置文件说明

hadoop集群默认配置和常用配置

hadoop集群测量

Hadoop管理员的十个最佳实践

Hadoop 权限管理

Hadoop FS Shell

Hadoop Shell 讲解

hadoop fs -count的结果含义

Hadoop添加节点datanode

Hadoop删除节点

hadoop SecondaryNameNode和NameNode

hadoop 根据SecondaryNameNode恢复Namenode

hadoop机架感知

HDFS 安全模式

hadoop的dfs.replication

Hadoop回收站trash

hadoop升级

Hadoop计算能力调度器算法解析

Hadoop计算能力调度器应用和配置

hadoop和kerberos的整合总结

hadoop的dfs.umask

NFS服务对Hadoop(hdfs)集群影响测试

Facebook团队关于Hadoop/HBase在SSD上的实验和讨论

调优

架构设计

Hadoop使用场景

hive

Hive体系架构应用

Hadoop和Hive的数据处理流程

管理

hive部署手册

hive元数据中utf8的修改

hive并发调用的运行方式-个人经验篇

hive Cli常用操作(翻译自Hive wiki)

hive数据类型(翻译自Hive Wiki)

hive 创建/删除/截断 表(翻译自Hive wiki)

hive数据操作(翻译自Hive wiki+实例讲解)

hive原生和复合类型的数据加载和使用

hive修改 表/分区语句

hive select操作(翻译自Hive wiki)

hive GroupBy操作(翻译自Hive wiki)

hive 中 Order by, Sort by ,Dristribute by,Cluster By 的作用和用法

Hive Join(翻译自Hive wiki)

hive lateral view语句(翻译自Hive wiki)

Hive Union(翻译自Hive wiki)

Hive子查询(翻译自Hive wiki)

hive实例讲解实现in和not in子句

Hive Explain(翻译自Hive wiki)

Hive虚拟列(翻译自Hive wiki)

hive 锁定(翻译自Hive wiki)

hive函数(Hive wiki)

hive udf开发流程(Hive wiki)

hive udaf开发入门和运行过程详解

hive中UDTF编写和使用

hive属性(Hive wiki)

hive中分组取前N个值的实现

hive sql遇到的问题

优化

hive大数据倾斜总结

hive join详解

hive文件存储格式

hive怎样决定reducer个数

hive的hive.exec.parallel参数说明

hive local hadoop特性

hbase管理

Hbase配置手册

pig

介绍入门

Apache Pig入门 –介绍/基本架构/与Hive对比

管理

pig部署手册

教程

 


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值