CS281: Advanced Machine Learning 第一节

接触机器学习领域有一段时间了,跟过不少基础的课程,也看过一些入门的书籍和论文,现在想通过一门公开课系统的进入机器学习的领域,所以选择了advanced Machine Learning,这是哈佛大学的一门高级机器学习公开课,主要教材选用的是kevin Murphy Machine Learning: A Probabilistic Perspective, MIT Press 以及Christopher M. Bishop, Pattern Recognition and Machine Learning, Springer. 希望通过这一个系列的学习,磨练自己的理论水平,同时通过kaggle平台的竞赛进行实际的联系操作。OK,咱们下面进入第一章, 本章需要完成以下的阅读任务:

Murphy Chapter 1 introduction

Bishop Chapter 1 introduction

Introduction 

今天我们已经进入大数据时代,每天有成千上万的数据产生,如何能够自动化的从万千的大数据中发现探索知识已经成为了这个时代的关键技术,这就是机器学习所能够做的事情,它可以用一系列的方法自动的从数据中探索模式,并通过这种模式去预测未来的数据。

机器学习的类型

机器学习主要分为监督学习和无监督学习,监督学习可以分为分类任务和回归任务,而无监督学习没有明确的响应变量,需要我们自己去无标记的数据中发现知识。

分类

当应变量是一系列类别时,机器学习的任务就是分类,分类就是从自变量X到Y中学习到mapping,y ∈ {1,…,C} ,y属于类别变量,如果C=2,那么这就是一个二元分类问题(binary classification),如果C>2,那么这就是一个多元分类问题(multi-label classification),我们还可以用更加标准的定义该问题,假设X和y之间满足function:y = f(x),但是我们不可能完全准确的学习到这个function,所以我们的目标就是从中学到另外一个function:

用这样一个function来近似表示真实存在的function。分类问题用概率的观点来表示就是: p ( y | x , D ),在知道训练数据D,以及测试数据x的条件下,y为某个类别的概率。在做这个假设的同时,我们也需要一个model来实现预测的目标,所以最终的表达式:  p ( y |
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值