吴恩达机器学习【Lecture 1】

本文介绍了机器学习的基本概念,包括它的起源、应用实例和重要性。机器学习分为监督学习和无监督学习,其中监督学习涉及通过观察标记数据来学习预测模型,如邮件分类和房价预测。无监督学习则关注于发现数据集中的结构,如聚类分析。吴恩达的课程详细讲解了这两个领域的学习问题。
摘要由CSDN通过智能技术生成

Welcome

Machine Learning 机器学习
-Grew out of work in AI 在人工智能领域工作
-New capability for computers 计算机的新功能
Examples例如:
-Database mining 数据挖掘
Large datasets from growth of automation/web. 来自自动化/web发展的大型数据集。
E.g., Web click data网络点击数据, medical records医疗记录, biology计量生物学, engineering工程
-Applications can’t program by hand应用程序不能手工编程.
E.g., Autonomous helicopter自动直升机, handwriting recognition手写识别, most of Natural Language Processing (NLP)自然语言处理, Computer Vision计算机视觉.
-Self-customizing programs私人定制程序
E.g., Amazon, Netflix product recommendations购物网站产品推荐
-Understanding huan learning (brain, real AI)理解人类的学习过程和大脑.

What is machine learning

Machine Learning definition

  1. Arthur Samuel (1959). Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed在没有明确设置的情况下,使计算机具有学习能力的研究领域.
  2. Tom Mitchell (1998) Well-posed Learning Problem: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.计算机程序从E中学习解决某一任务T进行某一性能度量P,通过P测定在T上的表现因经验E而提高.
    Suppose your email program watches which emails you do or do not mark as spam, and based on that learns how to better filter spam. What is the task T in this setting? 假设你的邮件程序观察你将哪些邮件标价为垃圾邮件,基于你标记的垃圾邮件,你的邮件程序学会了如何更好的过滤垃圾邮件,在这个例子中,任务T是什么?
  3. Classifying emails as spam or not spam. 邮件分类为垃圾邮件或垃圾邮件。
  4. Watching you label emails as spam or not spam. 看着你把电子邮件标签为垃圾邮件或垃圾邮件。
  5. The number (or fraction) of emails correctly classified as spam/not spam. 电子邮件的数量(或分数)被正确归类为垃圾邮件/垃圾邮件。
  6. None of the above—this is not a machine learning problem.以上这些都不是机器学习问题。
    因此我们的系统在任务T上的性能在得到经验E之后会提高性能度量P

因此我们的系统在任务T上的性能在得到经验E之后会提高性能度量P。

Machine learning algorithms:

  • Supervised learning监督学习
  • Unsupervised learning无监督学习

Others:

  • Reinforcement learning强化学习
  • recommender systems推荐系统

Also talk about:

  • Practical advice for applying learning algorithms应用算法的实际案例

Supervised Learning

监督学习算法例子一:

在这里插入图片描述假设绘制了一个数据集,如图,横轴表示平方英尺书,纵轴表示每平方英尺价格(美元),假设有一栋750英尺的房子要卖,估价。第一种方法:针对数据采用了直线拟合数据,依据图显示估价为150;第二种方法:采用二次函数拟合数据,估价为200.
在这里插入图片描述
我们给算法一个数据集,其中包含了正确答案,算法的目的就是给出更多的正确答案。
在这里插入图片描述
回归问题:我们设法预测连续值的属性
这类问题的特点就是给定一些正确的数据作为训练集,然后用这些数据集拟合出来一个公式,然后用这个公式再去预测未知的问题,比如房价,股票价格等等

监督学习算法例子二:

在这里插入图片描述预测乳腺癌:横轴表示肿瘤大小,纵轴表示良性恶性,0表示良性,1表示恶性。首先给出一些给定的数据(数据集),其中蓝色的为良性,红色为恶性,粉色为待预测的数据。
由此引入一个新的概念:分类,分类问题是指我们设法预测一个离散值输出,在实际中也有可能存在两个以上的输出值。
在这里插入图片描述
仅仅一个判断,无法给出准确的预测值,于是引入第二个衡量标准:年龄。
在这里插入图片描述事实上,在真正的学习算法中并不只这两种或者五种(旁边给出三种)特征或属性,而是能处理无穷多特征的。
You’re running a company, and you want to develop learning algorithms to address each of two problems.假设你经营一家公司,你想开发学习算法来处理两个问题。
Problem 1: You have a large inventory of identical items. You want to predict how many of these items will sell over the next 3 months.你有很多同一件货物的库存,你想预测在接下来的三个月内你能卖出多少件。
Problem 2: You’d like software to examine individual customer accounts, and for each account decide if it has been hacked/compromised. 你有很多客户你想要写一个软件来检查每一个客户的账户,对于每个账户,判断这个账户是否被入侵或者破坏。
Should you treat these as classification or as regression problems?

  • Treat both as classification problems. 分类
  • Treat problem 1 as a classification problem, problem 2 as a regression problem. 1分类,2回归
  • Treat problem 1 as a regression problem, problem 2 as a classification problem. 1回归,2分类
  • Treat both as regression problems. 回归

Unsupervised Learning

在这里插入图片描述监督学习:对于监督学习中的每个样本我们给出了正确答案。
在这里插入图片描述无监督学习:我们得到一个数据集,从中找出某种结构,将这些数据分为两个簇,这就叫聚类算法。
聚类算法应用:谷歌新闻;基因分组;大型计算机集群;社交软件的分析;市场细分;天文数据分析。
非聚类的无监督学习的一个很经典的例子就是鸡尾酒会算法,就是让机器在一片嘈杂的环境中辨别或是提取出某种特定的声音。
Of the following examples, which would you address using an unsupervisedlearning algorithm? (Check all that apply.) 在以下示例中,您将使用无监督学习算法解决哪些问题?(检查所有适用的。)

  • Given email labeled as spam/not spam, learn a spam filter.给定电子邮件标记为垃圾邮件/不是垃圾邮件,学习垃圾邮件过滤器。
  • Given a set of news articles found on the web, group them into set of articles about the same story. 给定在网上找到的一组新闻文章,将它们分组成关于同一故事的一组文章。
  • Given a database of customer data, automatically discover market segments and group customers into different market segments. 给定一个数据库的客户数据,自动细分市场,并把客户组织到不同的细分市场。
  • Given a dataset of patients diagnosed as either having diabetes or not, learn to classify new patients as having diabetes or not. 给定一组诊断为糖尿病或不糖尿病的患者,学习将新患者分类为糖尿病或不糖尿病。
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值