数据挖掘/机器学习 之 开新坑

之前的博客一直是关于LeetCode的内容,接下来除了这个外我还会写关于数据挖掘/机器学习的一些东西,开一个新的坑。这个一个方向将会是我的重心,近期的计划包括:

  1. 面试经验
  2. 书籍阅读笔记
  3. 自己的一些感想和经验
在这里我先介绍下我的心路历程:
我本科和研究生的方向和数据挖掘/机器学习其实不太沾边,甚至和计算机都太沾边。自己之所以私下里搞这个方向主要是自己真的很喜欢,本科时喜欢玩每天过的比较潇洒,一直不知道自己喜欢什么,直到研一时选了《web搜索》这个课程,了解了机器学习、模式识别的一些东西,后来又听说了数据挖掘这个方向,这个时候才发现自己对这个如此痴迷。我们生活在信息爆炸时代,移动互联网有如此的广泛普及,在信息的海洋里提炼出有价值的信息,分辨出信号和噪声,需要使用数据挖掘这个强大的工具。
我是如何进行自学的:
  1. 要先明确这是干嘛的?可以用在什么领域?我们平时接触的一些东西中,哪些和这个相关或者用到了这些方面的技术?
  2. 学习台湾大学的《机器学习基石》:通过这个课程我了解了机器学习中基本概念,系统组成。一些基本的方法:感知机、逻辑回归、线性回归等,一些重要的概念:VC维,过拟合和欠拟合,正则化,交叉验证,奥卡姆剃刀、抽样偏差等。这个课程非常的好,非常适合没有接触过的人,林老师把原理过程以及引申讲的非常清楚,这里非常感谢他!
  3. 学习斯坦福大学的《机器学习课程》,这个是吴恩达教授比较老的一版。和上面的比差别就在于,全面和深奥,这个课程将的模型和方法特别的多,而且只听课程明显不够需要辅助教材和论文,正如吴教授最后说的,如果你掌握了这个课程所有东西,那么你就成为了机器学习领域的专家了,当然我距离这个还很远。
  4. 《机器学习实战》,这本书提供了机器学习算法的简单实现,配合着一些基本的课程和书,可以对如何实现各种模型,已经如何使用有一些初步的认识,这本书错误比较多
  5. 《集体智慧编程》,这本书相比于上一本更贴近实际应用,代码,深度和广度都要比上一本好一点,最好是看这个
  6. 《统计学习方法》,我学习理论和准备面试的主要书籍,我重点看了前面的部分,这本书讲的比较基础易懂,在中文的书籍里面是相当好的,初学者要看看
  7. 《数据挖掘导论》,我是当做科普读物来读的,因为他介绍的东西比较全面,读完后会对数据挖掘有个初步的认识,会感觉到和机器学习不一样的地方
  8. 《统计学习基础》,目前正在看,因为是全英文的有点困难,暂时还没啥想法
  9. scikit-learn,python中的一个很好的库,常见的模型都有,最好是学习下如何使用,直接拿来用的结果还挺好的,想深入的话可以读读源码,了解下架构和实现。
  10. Kaggle,很不错的练手网站,上面的一些入门的例子,很适合初学者,也是通过这个网站我才认识到数据处理的重要性,有时候模型上做不了太多工作时,数据的处理很影响结果。
  11. PRML,未来的目标,希望自己在看完统计学习基础后能研究下这本书。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值