机器学习基石-01-the learning problem

2017-10-16

       昨天开始学习台湾大学的机器学习课程。本课程分为机器学习基石机器学习技法两部分,配套的PPT内容很详细了,这里主要是分享自己在学习过程中的一些感悟和小知识积累。本科和研究生专业都是统计学,之前学的数学课程零零散散记得一部分,会在下面着重分享自己的心路历程。

课程刚开始老师用很通俗的语言解释了机器学习的概念和三个特征

概念:data---->ML---->kill,在数据资料中通过机器学习来达到使得“某一种表现的增进”的目的。e.g:更高的准确率;更高的股票市场回报。 

机器学习的三个特征:1.某一种表现的增进(pattern);2.不可以或者很难用代码实现;3.必须有数据资料data。

1.小孩子下一次哭会是单数还是双数? no pattern

2.图中有没有循环存在? 代码可以实现

3.是否给某一个顾客发信用卡? 满足3个特点

4.核能的过度使用会导致地球毁灭? no data

老师在课程中介绍了衣食住行等方面的机器学习应用,下面举“是否给某个顾客开通信用卡”的例子。

用最通俗的话讲就是,大写H是一个假定集,包含“good”和“bad”的假定;g是在里面找出一个“best”来作为g。“best”的标准就是g无限接近于f。

关于目标函数f需要注意的:

1.目标函数f是不知道的,unknown!!!

2.最终得到的“best”假定g,g≈f是无限接近但不是完全一样。

本节课的最后讲了一下机器学习和其他几个相关名词的关联

和区别

机器学习和数据挖掘

数据挖掘:use huge data to find property that is interesting。

如果把"g≈f"看做”interesting property”,那么此时的机器学习和数据挖掘是一样的。

如果"g≈f"和”interesting property”是相关的,那么机器学习和数据挖掘会互相起作用。

 

传统的数据挖掘着重于“大量数据”进行“有效率的运算”。

 

机器学习和人工智能

人工智能:compute something that shows intelligent behavior.

值得一提的是,行业性的专有名词用英语释义会更准确和精简。

 

如果把"g≈f"看做”shows intelligent  behavior”的一种形式,那么机器学习是实现人工智能的一种方式。

机器学习和统计学
统计学:use data to make inference about an unknown process.

如果把"g≈f"中的g看做inference,f看做“unknown process”,统计学是机器学习的一种方法。

图片插在里面但怎么没显示出来啊。结合PPT看就可以了,只是为了更深刻的理解而写的自己的总结。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值