【吴恩达机器学习】笔记Week3

sssusan537

于 2023-10-07 19:18:36 发布

阅读量37

点赞数

分类专栏：上课记录吴恩达机器学习文章标签：机器学习笔记人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/i_want_money111/article/details/133652446

版权

上课记录同时被 2 个专栏收录

8 篇文章 0 订阅

订阅专栏

吴恩达机器学习

3 篇文章 0 订阅

订阅专栏

Week3 Classification

Motivations

This type of classification problem where there are only two possible outputs is called binary classification. Where the word binary refers to there being only two possible classes or two possible categories.

只有两个可能输出的分类问题称为二元分类,其中 binary 一词是指只有两个可能的类或两个可能的类别。

0: false, benight, negative, absence ≠ bad

1: true, malignant, positive, presence ≠ good

当额外添加例子的时候，线性回归拟合的决策边界会移动。

logistic regression逻辑回归，虽然名字带有回归，但作用是分类。

Logistic regression

S型函数：sigmoid function，有时叫做logistic function, 结果再0到1之间

在这里插入图片描述

f表示的是y是1的概率，1-f即是y是0的概率

Decision boundary

在这里插入图片描述

设置一个阈值，使得当f>这个阈值时，y预测为1；相反，y预测为0。

通常，这个阈值设置为0.5，即z=0的时候。

决策边界：z=0时的线，边界两侧y=1或y=0

决策边界不一定是直线，多项式越高阶，决策边界越复杂。

Cost function for logistic regression

使用方差成本函数，则f为逻辑回归函数时，不是凸函数，局部最小值不一定是全局最小值。

在这里插入图片描述

定义损失函数如图，f的取值范围在0到1之间。

当真实值y是1，且f接近1时，L的值接近0，说明损失较小；相反，f接近0时，L的值趋向正无穷，说明损失非常大。

当真实值y是0，且f接近0时，L的值接近0，说明损失较小；相反，f接近1时，L的值趋向正无穷，说明损失非常大。

选择这种损失函数，总体成本曲线是凸的，即有且仅有一个最小值，最小值是全局最小值。

回归与分类的成本函数区别如下图，上面是回归函数的成本函数，下面是分类函数的成本函数：

Simplified Cost Function for Logistic Regression

在这里插入图片描述

Gradient Descent Implementation

逻辑回归的wi和b的导数形式上看起来和线性回归的导数，但f函数实际上不一样，一个是sigmoid函数，一个是线性函数

The problem of overfitting

underfit欠拟合，high bias高偏差，对训练案例也没办法很好地拟合

just right, generalization正则化，对训练案例比较好地拟合，并且对测试案例也可以很好地拟合

overfit过拟合，high variance高方差，对训练案例非常好地拟合，但对测试案例拟合很差

Our goal when creating a model is to be able to use the model to predict outcomes correctly for new examples. A model which does this is said to generalize well.

Addressing overfitting

在这里插入图片描述

解决过度拟合的方法：

Collect more data
Select features ——Feature selection 选择重要的、影响大的特征
Reduce size of parameters ——"Regularization"正则化

在这里插入图片描述

Cost function with regularization

在这里插入图片描述

令w3、w4乘以一个非常大的数加到 J 后面，这样当使 J 尽可能地小的时候，w3、w4的值就会变得非常小

more generally, the way that regularization tends to be implemented is if you have a lot of features, say a 100 features, you may not know which are the most important features and which ones to penalize.

一般并不能提前知道哪个特征更重要，所以正则化就是把所有特征都做类似处理

在这里插入图片描述

正则化参数 λ ，与学习率α类似，需要选择一个适合的值。

当λ过小的时候，wj的值就会减小得少，对wj没有说明影响，仍然会过度拟合；当λ过大的时候，所有w的值都变得很小，此时 J 的值就接近常数b。

一般不会对b进行正则化

在这里插入图片描述

如图，成本函数的表达式的左边一项称为均方误差项（成本），右边一项称之为正则化项。

Regularized linear regression

正则线性回归：

在这里插入图片描述

为什么每次更新λ都会缩小参数w：

导数计算过程：

在这里插入图片描述

Regularized logistic regression

正则逻辑回归的导数形式和线性回归的一样，不同的只是f的表达式

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
【吴恩达机器学习】笔记Week3

只有两个可能输出的分类问题称为二元分类,其中 binary 一词是指只有两个可能的类或两个可能的类别。当额外添加例子的时候，线性回归拟合的决策边界会移动。logistic regression逻辑回归，虽然名字带有回归，但作用是分类。
复制链接

扫一扫

专栏目录

sssusan537 CSDN认证博客专家 CSDN认证企业博客

码龄1年

15: 原创

148万+: 周排名

16万+: 总排名

2526: 访问

: 等级

200: 积分

29: 粉丝

45: 获赞

11: 评论

50: 收藏

私信

关注

热门文章

分类专栏

最新评论

【吴恩达机器学习】笔记Week1
CSDN-Ada助手: "恭喜你写了第三篇博客，看到你对吴恩达machine learningWeek1的深入探讨，真的让人佩服。希望你能继续保持写作的热情和劲头，不断分享你的学习心得和见解。或许下一步可以考虑分享一些自己的实践经验，结合实际案例来加深对机器学习的理解，期待你的下一篇作品。" CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
【微表情分析领域常用术语（方法）介绍】
CSDN-Ada助手: 恭喜博主持续分享关于微表情分析领域的专业知识，文章标题看起来非常有深度，对于这个领域的术语和方法有了更清晰的了解。希望接下来可以结合实际案例或者应用场景，深入探讨一些具体的问题，让读者更易于理解和应用。期待您更多的精彩作品！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
【吴恩达机器学习】笔记Week3
CSDN-Ada助手: 恭喜你写了第7篇博客！看到你对吴恩达机器学习课程的学习笔记，我感到非常欣慰。你的分享让我也能够从中受益，谢谢你的付出！希望你能够继续坚持下去，不断分享你的学习心得和体会。或许下一步可以考虑结合自己的实际项目或者应用场景，分享一些实战经验和案例分析，这样对读者来说会更有启发和帮助。加油吧！期待你更多的精彩内容！
【opencv快速入门】
CSDN-Ada助手: 恭喜您写了第8篇博客！阅读了您的《opencv快速入门》，不禁感叹您对opencv的深入理解和对技术的热爱。接下来，希望您可以继续分享一些实际项目中opencv的应用案例，或者深入探讨一些opencv在图像处理中的高级技巧，这样可以让更多的读者受益。期待您的下一篇作品！
《Python神经网络编程》手写字体识别
CSDN-Ada助手: 恭喜您写了第9篇博客！标题《Python神经网络编程》手写字体识别听起来非常有趣。您在这一领域的持续创作让我非常钦佩。接下来，我希望您可以考虑分享一些关于如何优化神经网络模型或者如何应用手写字体识别的案例研究。这些内容将进一步丰富读者的知识，并帮助他们更好地应用这些技术。谢谢您的分享，并期待您未来更多的精彩文章！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。