机器学习分类

机器学习定义

1 机器学习 (Machine Learning): 一个程序被认为能从经验 E 中学习,解决任务 T,达到性能度量值P,当且仅当,有了经验 E 后,经过 P 评判,程序在处理 T 时的性能有所提升。

用下棋举例,其中:
经验E :就是程序上万次的自我下棋(训练)的经验,
任务 T: 就是下棋。
性能度量值 P:就是它在与一些新的对手比赛时,赢得比赛的概率。


2.1监督学习 (Supervised Learning):对于数据集中每一个样本都有对应的标签。通俗来说就是:给学习算法一个数据集。这个数据集由“正确答案”组成。即数据集中的每个样本都有相应的“正确答案”。(比如肿瘤的样本,恶性肿瘤良性肿瘤就是样本的标签)

监督学习包括:回归问题,分类问题。

回归:试着推测出这一系列连续值属性。

回归问题:通过回归来推出一个连续的输出。

  • 给了一系列房子的数据,我们给定数据集中每个样本的正确价格,即它们实际的售价然后运用学习算法,算出更多的正确答案(比如你朋友新房子的价格)。
  • 你有一大批同样的货物,有上千件一模一样的货物等待出售,这时想预测接下来的三个月能卖多少件? 如果我有数千件货物,我会把它看成一个实数,一个连续的值。因此卖出的物品数,也是一个连续的值。

分类:试着推测出离散的输出值。(即非连续)

分类问题:其目标是推出一组离散的结果。

  • 你有许多客户,这时你想写一个软件来检验每一个用户的账户。对于每一个账户,你要判断它们是否曾经被盗过? 我会把预测的值,用 0 来表示账户未被盗,用 1 表示账户曾经被盗过。所以我们根据账号是否被盗过,把它们定为 0 或 1,然后用算法推测一个账号是 0 还是 1,因为只有少数的离散值,所以我把它归为分类问题。

2.2无监督学习 (Unsupervised Learning):数据集中没有任何标签,或者是有相同的标签,或者就是没标签。但是可以通过一定的算法(如聚类算法)找到数据之间的结构关系。
比如:

  • 聚类算法:判断出数据有两个不同的聚集簇,二者不同。
  • 鸡尾酒晚会
    实现公式:[W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x’);

以上为本人根据吴恩达老师的机器学习课程的学习笔记,如有错误或建议,请大方提出,感谢!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序猿tu

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值