转载的一些东西

TX0099

于 2016-01-04 21:57:11 发布

阅读量675

点赞数

分类专栏： girls 文章标签：读书笔记

girls 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

选择机器学习方向，需要专注提高以下方面的能力：

（一）基础代码能力：刷OJ（leetcode or hackrank)和实现机器学习算法（如svm、lr、gbdt、random forests等），并且让代码规范高效。

（二）领域知识：kaggle比赛、认真读书（ESL或者PRML）并写读书笔记、和大神交流（特征工程、模型等）、每天找点其他人遇到的问题回答一下（知乎、Quora、StackOverFlow等）【https://www.zhihu.com/question/29890222】

（三）英语水平：

著作权归作者所有。
商业转载请联系作者获得授权，非商业转载请注明出处。
作者：issac Syndrome
链接：https://www.zhihu.com/question/29890222/answer/46163276
来源：知乎

Logistics Regression，基本是区分菜鸟和逗逼的第一题啦。
Support Vector Machine，基本是区分进阶和菜鸟的第一题啦。
Naive Bayes，离散和连续的差别，可以看出概率基础哟。
Decision Tree，可以看点信息论，然后面试官就对你刮目相看啦。

Expectation Maximization，了解它的应用的模型，不需要背，理解EM就会觉得豁然开朗啦。
Gradient Descent，同上。

Over-fitting，如何避免过拟合？
Regularization，为什么可以避免过拟合？可以参考下病态问题。

Ensemble Learning，数据挖掘最常用的模型了吧，想想为什么集成方法是有效的。
Transfer Learning，貌似现在很火啊（图像识别领域）！！我不是很懂啊~~求懂的大神留言~~为什么由某一领域训练模型可以应用到其他领域？又是如何应用的？

著作权归作者所有。
商业转载请联系作者获得授权，非商业转载请注明出处。
作者：吴俣
链接：https//www.zhihu.com/question/21714701/answer/49112656
来源：知乎

最后想说的是：学好Python，掌握好开源的Tool。在工作解决实际问题的过程中，往往是这个逻辑：这个问题我们需要这个数据我们去crawl吧！！！（爬虫能力）-> 这些数据应该抽取ABCD这些特征（对数据的感觉）->这种数据特征的拟合用这个模型好！！！我记这个开源Tool实现了（对开源机器学习模型的了解）-> 还是不work，我们写Rule吧（有多少人工就有多少智能的步骤）。当然最后一步十分重要，尤其对于自然语言处理问题（摊手脸）

TX0099

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
转载的一些东西

选择机器学习方向，需要专注提高以下方面的能力：（一）基础代码能力：刷OJ（leetcode or hackrank)和实现机器学习算法（如svm、lr、gbdt、random forests等），并且让代码规范高效。（二）领域知识：kaggle比赛、认真读书（ESL或者PRML）并写读书笔记、和大神交流（特征工程、模型等）、每天找点其他人遇到的问题回答一下（知乎、Quora、StackOv
复制链接

扫一扫