课程链接 来自bilibili
根据黄博的笔记进行一个整理和个人总结
文章目录
一.引言
强调机器学习的热度 (不过是在2014年啦)
课程学习一些机器学习的术语 & 一些算法
1.什么是机器学习?
本节尝试定义什么是机器学习。
接下来的课程 希望教授——如何应用学习算法!
我们在实际应用中 一定要选择合适的学习算法加以修改来达到我们的需求!
吴恩达教授这样说:
在硅谷我住的地方,当我走访不同的公司,即使是最顶尖的公司,很多时候我都看到人们试图将机器学习算法应用于某些问题。有时他们甚至已经为此花了六个月之久。但当我看着他们所忙碌的事情时,我想说,哎呀,我本来可以在六个月前就告诉他们,他们应该采取一种学习算法,稍加修改进行使用,然后成功的机会绝对会高得多
吴恩达教授表示:
我们要花很多时间来探讨,如果你真的试图开发机器学习系统,探讨如何做出最好的实践类型决策,才能决定你的方式来构建你的系统
这样做的话,当你运用学习算法时,就不太容易变成那些为寻找一个解决方案花费6个月之久的人们的中一员。
本课将花很多时间来教我们这些机器学习 人工智能的最佳实践&如何让这些算法工作 &我们应该如何做
这一切的一切 都是为了让我们了解如何设计和构建机器学习和人工智能系统。
2.监督学习
简单来说
就是我们给学习算法一个数据集 这个数据集由“正确答案”组成 之后学习算法进行学习后 可以进行预测
监督学习的基本思想是:
给学习算法的数据集中的每个样本都有相应的“正确答案” 训练好的
学习算法就可以根据这些样本做出预测
之后讲了
回归问题
通过经典的“波士顿房价问题”
房价实际上是一系列离散的值 但是我们通常又把房价看成实数 看成是标量 所以又把它看成一个连续的数值
我们通过回归来推出一个连续的输出
举个例子
这就是个回归问题 我们把数千件货物看成一个实数 一个连续的值
所以卖出的物品数也是一个连续的值
分类问题
分类问题的目标与回归问题(推出一个连续的输出)恰巧相反 是推出一组离散的结果
这部分举了良性肿瘤的例子
假设说你想通过查看病历来推测乳腺癌良性与否
纵轴上,标出1和0表示是或者不是恶性肿瘤
有5个良性肿瘤样本,在1的位置有5个恶性肿瘤样本。
现在我们有一个朋友很不幸检查出乳腺肿瘤。假设说她的肿瘤大概这么大,那么机器学习的问题就在于,你能否估算出肿瘤是恶性的或是良性的概率。用术语来讲,这是一个分类问题。
这个问题中 分类 指的是 我们尝试推测出离散的输出值——0良性 1恶性
然而实际的分类问题中输出可能不止两个值
比如会出现第二类肿瘤 第三类肿瘤…这也是分类问题
我们画图来展示分类的结果(x表示恶性 o表示良性)
距离中间这条线越近 越危险。
3.无监督学习
为了更好地认知 监督&非监督学习 先来做个对比吧!
监督学习
数据集中的每条数据都打上标签了!
即×和o
模型可以清楚地知道 训练集对应的正确答案!
无监督学习
鸡尾酒会算法
举了一个例子 来分离音频 蛮有意思的~
一行代码实现~
二、单变量线性回归(Linear Regression with One Variable)
2.1 模型表示
模型描述
我们的第一个学习算法是线性回归算法。在这段视频中,你会看到这个算法的概况,更重要的是你将会了解监督学习过程完整的流程。
2.2 代价函数
代价函数
在这段视频中我们将定义代价函数的概念,这有助于我们弄清楚如何把最有可能的直线与我们的数据相拟合。
本节主要给了代价函数一个数学上的定义
2.3 代价函数的直观理解I
To Be continued