week1第一章(对应22新版一二章)---引言---吴恩达机器学习笔记


1-1 欢迎

本节主要介绍了机器学习是什么,机器学习在诸多应用领域中可以干什么。
我们每天都在接触机器学习的算法,比如:

  • 谷歌和必应对搜索结果排序,展示我们所需要的内容,正是因为他们有良好的学习算法。
  • 手机相册对人物分类,认出我们的朋友。
  • 电子邮件系统可以的垃圾邮件筛选。

未来的某一天,机器也许可以模拟人类的大脑,创造出和人类一样聪明的机器。
现在机器学习涉及到各个行业和基础科学中,如机器人、计算生物学、硅谷中大量的问题都受到机器学习的影响。
这里有一些机器学习的案例。

  • 比如说,数据库挖掘。机器学习被用于数据挖掘的原因之一是网络和自动化技术的增长,这意味着,我们有史上最大的数据集比如说,大量的硅谷公司正在收集web上的单击数据,也称为点击流数据,并尝试使用机器学习算法来分析数据,更好的了解用户,并为用户提供更好的服务。这在硅谷有巨大的市场。

  • 再比如,医疗记录。随着自动化的出现,我们现在有了电子医疗记录。如果我们可以把医疗记录变成医学知识,我们就可以更好地理解疾病。

  • 再如,计算生物学。还是因为自动化技术,生物学家们收集的大量基因数据序列、DNA序列和等等,机器运行算法让我们更好地了解人类基因组,大家都知道这对人类意味着什么。

  • 再比如,工程方面,在工程的所有领域,我们有越来越大、越来越大的数据集,我们试图使用学习算法,来理解这些数据。

  • 另外,在机械应用中,有些人不能直接操作。例如,我已经在无人直升机领域工作了许多年。我们不知道如何写一段程序让直升机自己飞。我们唯一能做的就是让计算机自己学习如何驾驶直升机。

  • 手写识别:现在我们能够非常便宜地把信寄到这个美国甚至全世界的原因之一就是当你写一个像这样的信封,一种学习算法已经学会如何读你信封,它可以自动选择路径,所以我们只需要花几个美分把这封信寄到数千英里外。

事实上,如果你看过自然语言处理或计算机视觉,这些语言理解或图像理解都是属于AI领域。大部分的自然语言处理和大部分的计算机视觉,都应用了机器学习。学习算法还广泛用于自定制程序。每次你去亚马逊或Netflix或iTunes Genius,它都会给出其他电影或产品或音乐的建议,这是一种学习算法。仔细想一想,他们有百万的用户;但他们没有办法为百万用户,编写百万个不同程序。软件能给这些自定制的建议的唯一方法是通过学习你的行为,来为你定制服务

最后学习算法被用来理解人类的学习和了解大脑。

1-2 机器学习是什么?

机器学习并没有准确的定义,但专家尝试对机器学习有过以下定义:

  • 第一个机器学习的定义来自于Arthur Samuel。他定义机器学习为,

在进行特定编程的情况下,给予计算机学习能力的领域。

Samuel的定义可以回溯到50年代,他编写了一个西洋棋程序。

  • 另一个年代近一点的定义,由Tom Mitchell提出,来自卡内基梅隆大学,Tom定义的机器学习是,

一个程序被认为能从经验E中学习,解决任务T,达到性能度量值P,当且仅当,有了经验E后,经过P评判,程序在处理T时的性能有所提升。

在西洋棋程序中,经验E 就是程序上万次的自我练习的经验,而任务T 就是下棋。性能度量值P呢,就是它在与一些新的对手比赛时,赢得比赛的概率。

目前存在几种不同类型的学习算法。主要的两种类型被我们称之为监督学习和无监督学习。本课中,我们将花费最多的精力来讨论这两种学习算法。而另一个会花费大量时间的任务是了解应用学习算法的实用建议。
给你讲授学习算法就好像给你一套工具,相比于提供工具,可能更重要的,是教你如何使用这些工具。

1-3 监督学习

使用3个例子来讲述监督学习。

  • 预测房价,这是一个回归问题,结果为连续值。
  • 预测乳房肿瘤为良性还是恶性,这是一个分类问题,结果为几个离散值。

监督学习是指给出的样本,被人为地做出了标记。
其基本思想是,我们数据集中的每个样本都有相应的“正确答案”
我们以后会讲一个算法,叫支持向量机,里面有一个巧妙的数学技巧,能让计算机处理无限多个特征

1-4 非监督学习

监督学习是将样本打上不同的标记;而非监督学习中,所有的样本都没有标签或者全都是一种相同的标签,机器可以将样本分为几个类簇,这叫聚类算法。

  • 比如谷歌新闻,每天都是分析几万条或者几十万条新闻,将关联的新闻归为一类,将这些新闻归为一个主题,显示到一起。
  • 再比如,基因学的理解应用,一个DNA微观数据的例子,输入一组不同个体,运行一个聚类算法,把个体聚类到不同的类或不同类型的组(人)……
  • 组织大型计算机集群,分析那些计算机适合协同工作,使数据中心工作得更高效。
  • 社交网络分析,将朋友自动化分到不同的圈子。
  • 市场分割。检索这些顾客数据集,自动地发现市场分类,并自动地把顾客划分到不同的细分市场中,你才能自动并更有效地销售或不同的细分市场一起进行销售。

2022课程新增

除了聚类学习以外,无监督学习还包括异常检测降维

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值