转载的一些东西

选择机器学习方向,需要专注提高以下方面的能力:

(一)基础代码能力:刷OJ(leetcode or hackrank)和实现机器学习算法(如svm、lr、gbdt、random forests等),并且让代码规范高效。

(二)领域知识:kaggle比赛、认真读书(ESL或者PRML)并写读书笔记、和大神交流(特征工程、模型等)、每天找点其他人遇到的问题回答一下(知乎、Quora、StackOverFlow等)【https://www.zhihu.com/question/29890222】  

(三)英语水平:



著作权归作者所有。
商业转载请联系作者获得授权,非商业转载请注明出处。
作者:issac Syndrome
链接:https://www.zhihu.com/question/29890222/answer/46163276
来源:知乎

Logistics Regression,基本是区分菜鸟和逗逼的第一题啦。
Support Vector Machine,基本是区分进阶和菜鸟的第一题啦。
Naive Bayes,离散和连续的差别,可以看出概率基础哟。
Decision Tree,可以看点信息论,然后面试官就对你刮目相看啦。

Expectation Maximization,了解它的应用的模型,不需要背,理解EM就会觉得豁然开朗啦。
Gradient Descent,同上。

Over-fitting,如何避免过拟合?
Regularization,为什么可以避免过拟合?可以参考下病态问题。

Ensemble Learning,数据挖掘最常用的模型了吧,想想为什么集成方法是有效的。
Transfer Learning,貌似现在很火啊(图像识别领域)!!我不是很懂啊~~求懂的大神留言~~为什么由某一领域训练模型可以应用到其他领域?又是如何应用的?






著作权归作者所有。
商业转载请联系作者获得授权,非商业转载请注明出处。
作者:吴俣
链接:https//www.zhihu.com/question/21714701/answer/49112656
来源:知乎

最后想说的是:学好Python,掌握好开源的Tool。在工作解决实际问题的过程中,往往是这个逻辑:这个问题我们需要这个数据我们去crawl吧!!!(爬虫能力)-> 这些数据应该抽取ABCD这些特征(对数据的感觉)->这种数据特征的拟合用这个模型好!!!我记这个开源Tool实现了(对开源机器学习模型的了解)-> 还是不work,我们写Rule吧(有多少人工就有多少智能的步骤)。当然最后一步十分重要,尤其对于自然语言处理问题(摊手脸)











  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值