机器学习笔记(一)——初识机器学习

什么是机器学习

定义一: Arthur Samuel这个人定义机器学习为,在进行特定编程的情况下,给予计算机学习能力的领域。

例子: 让跳棋棋程序自己跟自己下了上万盘棋。通过观察哪种布局(棋盘位置)会赢,哪种布局会输,久而久之,这跳棋程序明白了什么是好的布局,什么样是坏的布局。

定义二: Tom Mitchell提出一个程序被认为能从经验E中学习,解决任务T,达到性能度量值P,当且仅当,有了经验E后,经过P评判,程序在处理T时的性能有所提升。经验E就是程序上万次的自我练习的经验,而任务T就是下棋。性能度量值P就是它在与一些新的对手比赛时,赢得比赛的概率。

例子: 电子邮件程序会观察收到的邮件是否被你标记为垃圾邮件。在这种Email客户端中,你点击“垃圾邮件”按钮,报告某些Email为垃圾邮件,不会影响别的邮件。基于被标记为垃圾的邮件,您的电子邮件程序能更好地学习如何过滤垃圾邮件。

T为给邮件进行分类,正确归类的邮件为P,E为观察是否把邮件归类到垃圾文件

监督学习(Supervised Learning)

基本思想;数据集中的每个样本都有相应的“正确答案”,再根据这些样本作出预测。

监督学习问题分为“回归(classification)”和“分类(regression)”问题。

(1)回归:我们在试着推测出这一系列连续值属性。

例子: 在房价的问题中,我们给了一系列房子的数据,我们给定数据集中每个样本的正确价格,即它们实际的售价然后运用学习算法,算出更多的正确答案。这就是回归问题

在这里插入图片描述

(2)分类:我们试着推测出离散的输出值

例子: 5个良性肿瘤样本,在1的位置有5个恶性肿瘤样本。现在我们有一个朋友很不幸检查出乳腺肿瘤。假设说她的肿瘤大概是在某个size,那么机器学习的问题就在于,你能否估算出肿瘤是恶性的或是良性的概率。这是一个分类问题

在这里插入图片描述

无监督学习(Unsupervised Learning)

在这里插入图片描述

看上不同于监督学习的数据的样子,即无监督学习中没有任何的标签 或者 是有相同的标签 或者 就是没标签。

无监督学习可能会把这些数据分成两个不同的簇所以也叫做聚类算法
无监督学习的主要目的就是挖掘出数据内在的联系

例子: 谷歌新闻每天都在,收集非常多,非常多的网络的新闻内容。它再将这些新闻分组,组成有关联的新闻。所以谷歌新闻做的就是搜索非常多的新闻事件,自动地把它们聚类到一起。所以,这些新闻事件全是同一主题的,所以显示到一起。

例子: 细分市场可以当作无监督学习问题,因为只是拿到算法数据,再让算法去自动地发现细分市场。

例子: 非聚类:“鸡尾酒会算法”,可以让我们在混乱的环境中找到结构。(即在鸡尾酒会上从声音网格中识别个别的声音和音乐)

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值