本文是小小挖掘机2020年货的第五篇,主要回顾一下2019年转载的机器学习相关的文章。后续还会有更多的年货送给大家,希望大家持续关注呦~。首先感谢以下公众号提供的支持:
年货系列回顾:
本文将从机器学习资源、机器学习基础、机器学习实战等三部分展开。
1、机器学习资源
想要入门机器学习,书籍的话首推李航博士的《统计学习方法》,下面两篇分别整理了第一版的学习笔记和第二版的课件:
李航《统计学习方法》第 2 版发布完整课件!清华教授出品!附完整下载
视频也是一种很好的学习方式,推荐李宏毅老师的机器学习课程:
《李宏毅机器学习完整笔记》发布,Datawhale开源项目LeeML-Notes
而下面一篇文章是一篇不错的机器学习入门教程,推荐给大家:
除此之外,下面几篇文章总结了机器学习教程以及资源:
最后,机器学习的学习也离不开论文的阅读,下面推荐三个常见的论文搜索网站,分别是arXiv、NIPS、paperswithcode,当然我个人经常使用的还有dblp。
2、机器学习基础
下面的一些文章,带你入门或复习一些基础的机器学习算法和定理,如逻辑回归LR、SVM、K-means聚类、LDA等降维算法等
这里我们单拎出XGBoost,这个模型实在是太重要了,相比于上述的算法,其在面试中被提问的概率更高,下面几篇文章对于深入理解XGBoost一定会有帮助:
终于有人把XGBoost 和 LightGBM 讲明白了,项目中最主流的集成算法!
而对于机器学习的评估,我们需要了解常用的评估指标和损失函数,如分类问题中的精确率、召回率、F1值、AUC、交叉熵损失等,回归问题中的MAE、MSE等:
在机器学习中,我们经常遇到类别不平衡的问题,类别不平衡问题并非简简单单的各类别数据数量上具有差异,更需要从数据分布上进行详细分析。下面两篇文章解释了什么是数据不平衡问题以及对应的解决方法:
机器学习中另一个问题是可解释性模型可解释性指对模型内部机制的理解以及对模型结果的理解,机器学习模型的可解释性越高,人们就越容易理解为什么做出某些决定或预测。比如在推荐系统中,我们不仅要知道给用户推荐什么物品,更需要知道为什么给用户推荐这个物品。下文对机器学习模型可解释性做了详尽介绍:
最后是数学相关的问题,个人感觉数学在工作中的作用并不大,但是学好数学对于理解机器学习算法很有帮助:
3、机器学习实战
最后是一些机器学习实战相关的文章,包括机器学习模型的部署和调优相关的经验、算法工程师在岗工作的经验等等: