【吴恩达机器学习2022学习笔记】课程1 -- 机器学习基础

特卡的风

已于 2022-07-03 19:43:21 修改

阅读量1.6k

点赞数 5

分类专栏：吴恩达机器学习笔记文章标签：机器学习 python 深度学习人工智能计算机视觉

于 2022-07-03 17:39:47 首次发布

本文链接：https://blog.csdn.net/Tekapo_s/article/details/125581218

版权

吴恩达机器学习笔记专栏收录该内容

3 篇文章 7 订阅

订阅专栏

吴恩达大佬又重新录了机器学习视频，借此机会重温并做笔记简单记录一下。课程共分成三门，首先是机器学习基础。

课程链接：https://www.bilibili.com/video/BV19B4y1W76i/?spm_id_from=333.788.recommend_more_video.1&vd_source=337295bc6e342e05e35b53ca8f411ebe

课程1-- 机器学习基础

1. 监督学习

给定X Y使得模型学习后可以对给定的任意X得到对应的Y。
预测问题：（X到Y的映射）例如预测房价，属于回归模型，可用直线或者曲线进行拟合。
分类问题： 预测类别（二分类0，1），找到对应的分类边界。

2. 无监督学习

数据与任何输出标签都不相关。没有数据标签,只有x没有y（Finding something interesting in unlabeled data)
聚类算法clustering： 将无标签数据分成两类或多类。
异常检测Anomaly detection： 金融欺诈等。
降维 Demensionality reduction: 将大数据集分成小数据集，尽可能减少数据丢失。

3. 线性回归模型

简单的线性回归：f(x)=wx+b
在这里插入图片描述

4. 代价函数

f(x)=wx+b，w和b是两个可学习的参数，为了衡量w,b对于真实值的匹配程度，采用代价函数来计算模型预测的y与真实值之间的差异。
在这里插入图片描述
计算真实值与模型预测值之间的误差。图中J(w,b)就是代价函数的定义，采用均方差计算误差。
目标：
minimize J(w,b)，线性回归的本质就是找到w,b使得代价函数J(w.b）的值最小。

采用等高线可视化代价函数J
在这里插入图片描述

5.梯度下降

通过不断梯度下降，找到使得代价函数最小的点。
在这里插入图片描述
梯度下降流程：同时更新w和b，α是学习率(即下降幅度)乘上w和b相对于J(w,b)的导数(即梯度下降的方向,想象二次函数切线)。

在这里插入图片描述

学习率α：
学习率越小，梯度下降越慢，需要多次梯度下降才能达到代价函数最小值，学习率越大，梯度下降越快，但容易跳过最小值，出现过拟合现象。可采用逐渐减小的学习率。

求导过程：
在这里插入图片描述

6.多种特征向量化

在python中，向量之间相乘采用np.dot(w,x)来进行计算
在这里插入图片描述

多元回归梯度下降就是将多个w,b逐一进行梯度下降算法，与上述计算相同。

7.特征工程

特征缩放：
通过适当的缩放数据的范围，使得参数取值范围在一个比较合理（容易计算）的区间，有利于后续梯度下降和可视化。
在这里插入图片描述
学习率选择：
按照我的经验来说，学习率一般从大往小开始实验。0.1、0.01、0.001…，可以使用渐变学习率，通过观察loss图像判断是否收敛。