这里主要搜集推荐、搜索、计算广告等会用到的机器学习算法相关资源。包括各个它们的背景知识以及常用算法,其中算法包含了模型算法和求解两个方面
推荐相关
- github上Flowerowl整理的 Big-Data-Resources 资源列表列表,见 这里
- 美团技术博客整理的 美团推荐算法实践,见 这里
- Airbnb租房搜索推荐,产品和技术的一些思考,见 这里
机器学习模型相关
常用算法包括NB、LR、SVM、GBDT、协同过滤等。有些算法是各个领域共用的,例如用于点击率预估的NB、LR、GBDT等,有些算法是各个领域特有的,例如协同过滤。
模型求解相关
各种炫酷的机器学习模型有了,面对大数据,模型的求解常常也是一个大问题。实际就是算法的时间和空间复杂度过高,于是出现了各种改进优化算法,比较典型的例子就是牛顿算法到BFGS,再到LBFGS等算法都是面对计算速度慢和内存数据存储等问题提出来的新算法。
- 在线学习算法FTRL简介见 这里
- 常用优化算法小结,见 这里