1.NLP/DM/ML
GBDT http://www.cnblogs.com/LeftNotEasy/archive/2011/03/07/random-forest-and-gbdt.html
Andrew Ng 视频
龙行计划 课程
推荐系统 博文 http://www.cnblogs.com/wentingtu/category/342977.html
deep learning 深度学习基础教程:Deep Learning 101 http://markus.com/deep-learning-101/
机器学习视频汇总:http://work.caltech.edu/library/
2.笔试题
Coolshell:http://coolshell.cn/
Matrix67大牛的博客:http://www.matrix67.com/blog/。
July的CSDN博客:http://blog.csdn.net/v_JULY_v。
何海涛博客:http://zhedahht.blog.163.com/。
笔试面试的经典:Cracking the coding interview--问题与解答:http://hawstein.com/posts/ctci-solutions-contents.html
LeetCode:http://leetcode.com/
这里有不少笔试题集锦:http://blog.csdn.net/hackbuteer1
3.架构
淘宝文件系统:TFShttp://blog.chinaunix.net/uid-20196318-id-3904914.html
架构师谈高性能大型网站架构设计:http://www.niyun.net/v/daxing-jiagousheji.htm
4.数据库
1、大数据时代的 9 大Key-Value存储数 http://www.iteye.com/news/27628