超好的: 转载地址: http://www.r66r.net/?p=1072【有很多好文章】 hadoop笔记本 海量数据 【视频】BBC.地平线.大数据时代 大数据量,海量数据 处理方法总结 布隆过滤器应用悉数那些“巨型”数据仓库 Hadoop在业界的使用情况 淘宝Hadoop集群的概况 分布式 Paxos在大型系统中常见的应用场景 从Hadoop框架与MapReduce模式中谈海量数据处理(含淘宝技术架构) Mahout专栏 Apache Mahout:适合所有人的可扩展机器学习框架 Naive Bayes分类示例 翻译:深入浅出 mahout ——0001 序言 翻译:深入浅出 mahout ——0002 第一部分 第一章 翻译:深入浅出 mahout ——0003 第一部分 第二章 翻译:深入浅出 mahout ——0004 第三部分 第13章 分类一 翻译:深入浅出 mahout ——0005 第三部分 第十三章 分类二 关于mahout分类(logistic算法)的实践 翻译:深入浅出 mahout ——0006 第二部分 聚类 第七章 翻译:深入浅出 mahout ——0007 第二部分 聚类 第八章 数据表示 翻译:深入浅出 mahout ——0008 第二部分 聚类 第九章 聚类算法 hadoop的实现 序 hadoop视频 hadoop视频全集下载 HDFS的基本概念 HDFS 读写流程 HDFS namenode源码分析 HDFS datanode源码分析 HDFS dfsclient读文件过程 源码分析 HDFS dfsclient写文件过程 源码分析 MapReduce源码分析总结 How MapReduce Works hadoop的离线设计思想 Hadoop在MapReduce中使用压缩详解 HDFS数据的Checksum Hadoop开发 Hadoop之failed task和killed task Hadoop的调度器总结 管理 hadoop集群部署 hadoop部署注意项 hadoop配置文件说明 hadoop集群默认配置和常用配置 hadoop集群测量 Hadoop管理员的十个最佳实践 Hadoop 权限管理 Hadoop FS Shell Hadoop Shell 讲解 hadoop fs -count的结果含义 Hadoop添加节点datanode Hadoop删除节点 hadoop SN和NN hadoop 根据SN恢复Nn hadoop机架感知 HDFS 安全模式 hadoop的dfs.replication Hadoop回收站trash hadoop升级 Hadoop计算能力调度器算法解析 Hadoop计算能力调度器应用和配置 hadoop和kerberos的整合总结 hadoop的dfs.umask NFS服务对Hadoop(hdfs)集群影响测试 Hadoop/HBase在SSD上的实验和讨论 调优 架构设计 Hadoop使用场景 深入理解Hadoop集群和网络 "Hadoop.Operations.pdf.zip" Hadoop权威指南(中文版)(带书签).pdf [Hadoop权威指南(第2版)].pdf hadoop权威指南第3版2012.rar 《Hadoop Common和HDFS.pdf MapReduce架构设计与实现原理.pdf Hadoop实战.pdf Hadoop实战-陆嘉恒(高清完整版).pdf Hadoop实战(第2版).pdf Hadoop in Action.pdf Hadoop in practice.pdf Hadoop The.Definitive.Guide,3Ed.pdf Hadoop.The.Definitive.Guide.3rd.pdf hadoop入门实战手册.pdf Hadoop入门手册.chm windows下配置cygwin、hadoop等并运行mapreduce及mapreduce程序讲解.doc 在Windows上安装Hadoop教程.pdf Hadoop源代码分析(完整版).pdf 19."hadoop-api.CHM"hadoop-api.CHM "但彬-Hadoop平台的大数据整合.pdf QCon2013-罗李 百度hadoop计算技术发展.pdf QCon-吴威-基于Hadoop的海量数据平台.pdf 8步安装好你的hadoop.docx hadoop运维经验分享.ppsx PPT集萃:20位Hadoop专家分享大数据技术工具与最佳实践.rar Hadoop 2.0基本架构和发展趋势.pdf Hadoop与大数据技术大会PPT资料.rar Hadoop2011云计算大会.rar hadoop开发者.zip 王家林:为何Hadoop是分布式大数据处理的未来&如何掌握Hadoop? hive Hive体系架构 应用 Hadoop和Hive的数据处理流程 管理 hive部署手册 hive元数据中utf8的修改 hive并发调用的运行方式-个人经验篇hive Cli常用操作(翻译自Hive wiki) hive数据类型(翻译自Hive Wiki) hive 创建/删除/截断 表(翻译自Hive wiki) hive数据操作(翻译自Hive wiki+实例讲解) hive原生和复合类型的数据加载和使用 hive修改 表/分区语句 hive select操作(翻译自Hive wiki) hive GroupBy操作(翻译自Hive wiki) hive 中 Order by, Sort by ,Dristribute by,Cluster By 的作用和用法 Hive Join(翻译自Hive wiki) hive lateral view语句(翻译自Hive wiki) Hive Union(翻译自Hive wiki) Hive子查询(翻译自Hive wiki) hive实例讲解实现in和not in子句 Hive Explain(翻译自Hive wiki) Hive虚拟列(翻译自Hive wiki) hive 锁定(翻译自Hive wiki) hive函数(Hive wiki) hive udf开发流程(Hive wiki) hive udaf开发入门和运行过程详解 hive中UDTF编写和使用 hive属性(Hive wiki) hive中分组取前N个值的实现 hive sql遇到的问题 hive使用中碰到的问题之union 优化 hive大数据倾斜总结 hive join详解 hive文件存储格式 hive怎样决定reducer个数 hive的hive.exec.parallel参数说明 hive local hadoop特性 Hive学习笔记 Hive调优以及发展趋势 hbase管理 HBase简易原理 HBase中文教程 HBase技术介绍Hbase配置手册 HBase-Hadoop@小米.pptx 林昊谈HBase技术在淘宝中的应用 HBase利用bulk load批量导入数据 Hbase 三维有序存储 Hbase_schema_表设计教程整理版 HBase:权威指南 HBase性能优化方法总结(一):表的设计 HBase性能优化方法总结(二):写表操作 HBase性能优化方法总结(三):读表操作 HBase性能优化方法总结(四):数据计算 HBase在数据统计应用中的使用心得 HBase常见问题答疑解惑 HBase解决Region Server Compact过程占用大量网络出口带宽的问题 HBase的Block Cache实现机制分析 NoSQL选型及HBase案例详解 hbase参数详解 pig介绍 Apache Pig入门 –介绍/基本架构/与Hive对比 管理 pig部署手册 教程 Pig常见错误集锦 Pig Latin编程概要 Hadoop Pig学习:各种SQL在PIG中实现 pig核心开发者对如何编写与执行脚本的介绍 来自于yahoo的关于pig的介绍 使用Apache Pig时应该注意/避免的操作或事项 Apache Pig的一些基础概念及用法总结(1) Apache Pig的一些基础概念及用法总结(2) 使用Apache Pig从大数据集中获得所需的信息 Apache Pig中文教程 第一次与pig的亲密接触 《Hadoop实战》的笔记-勾搭Pig(1) 《Hadoop实战》的笔记-勾搭Pig(2) Pig常见错误集锦 如何在pig中的UDF函数中记录log信息 《Programming Pig》电子书 pig第三方的UDF库之DataFu pig第三方UDF之elephant-bird apache hadoop&pig国外比较好的ppt Hadoop pig进阶语法 apache pig的哲学 pig latin的历史 PigTools集锦 apache pig系列:再论join apache pig系列:pig传参数 原文网址: hadoop笔记本 请我喝咖啡 版权声明:自由转载-非商用-非衍生-保持署名 | Creative Commons BY-NC-ND 3.0