互联网技术学习中的一些资源总结
Hadoop在大数据世界里的地位毋庸置疑,总结一下一些学习资源。当然还有一些java、python等等。
IT电子书下载:只有英文版哦
Hadoop
准备工作
YARN介绍
Hadoop 生态系统
SQL on Hadoop
SQL is what’s next for Hadoop: Here’s who’s doing it
All SQL-on-Hadoop Solutions are missing the point of Hadoop
Hadoop Summit
书籍和Paper
Hadoop : The Definitive Guide 绝对是经典中的经典
Hadoop: The Definitive Guide, 4rd Edition
该书作者的Github主页及Hadoop-book主页
tomwhite/hadoop-book · GitHub
Google的三辆马车,GFS, MapReduce, BigTable
Google的新三辆马车:Caffeine、Pregel、Dremel
Big Data beyond MapReduce: Google’s Big Data papers
入门
1、理解MapReduce框架的基本流程:Map、shuffle、Reduce
2、清楚Combiner, partition作用,设置Compression
3、能搭建Hadoop集群,Master/Slave 都运行那些服务 NameNode, DataNode, JobTracker, TaskTracker,最好是完全分布式的Hadoop集群
4、Pig, Hive 简单语法,UDF写法
When to use Pig Latin versus Hive SQL?
Introduction to Apache Hive Online Training
Hive – A Petabyte Scale Data Warehouse Using Hadoop
Hadoop 2.0新知识 (Hadoop 1.xx VS Hadoop 2.xx)
HDFS2 HA, Snapshot, ResourceManager,ApplicationsManager, NodeManager
进阶
HDFS,Replica如何定位
HDFS Design
Hadoop 参数调优,性能优化,Cluster level: JVM, Map/Reduce Slots, Job level: Reducer #, Memory, use Combiner? use Compression?
7 Tips for Improving MapReduce Performance
Apache HBase ™ Reference Guide
算法
字典同位词:由相同字母组成的不同单词
翻译SQL语句
Designing algorithms for Map Reduce
Blog
让你知道日志文件在大数据中是多么重要
与Hadoop相关系统
数据流系统: Storm
内存计算系统: Spark and Shark
交互式实时系统:Cloudera Impala, Apache Drill (Dremel开源实现),Tez (Hortonworks)
Hadoop相关公司
Java
查看知识点,当然不仅只有java。
其它类
Linux
有这个教程后就不需要买什么歌叫你学Linux了,命令忘了上网查,多查几次你就主动去记住应该记住的命令。
Linux 使用,基本的 Shell 编程,这个视频教程很好,我一直用它学Linux
面试
养成维护自己中英文简历的习惯(mordenCV)
在线代码测评,如 Leetcode
笔试、面试题库,如 牛客网
笔试面试经验,如 米群
题解及 Cheat Sheet,如 LeetCode 题解、Machine Learning Cheat Sheet
时间管理
知识管理
站点推荐
问答:V2EX、SegmentFault、Reddit
视频:慕课网
Github 不仅是代码,还有技术笔记、题解等等
知识保存
用版本控制工具和代码片段工具管理你的代码
Markdown :
Ulysses、Haroopad 等 Markdown 类编辑软件
Gitbook 适合教程类书籍写作
《Docker 技术入门与实践》 杨保华
该资源由本人整理,很大部分来自于 董飞老师的知乎