李宏毅机器学习笔记（一）

最新推荐文章于 2022-11-29 17:48:27 发布

plancer16

最新推荐文章于 2022-11-29 17:48:27 发布

阅读量182

点赞数

分类专栏：机器学习笔记文章标签：机器学习学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41558341/article/details/94407041

版权

机器学习笔记专栏收录该内容

7 篇文章 1 订阅

订阅专栏

机器学习笔记(一)

谨以此记录自己的学习笔记，小结以及心得。

1.Regression

Regression分为三个步骤
建立模型
评价函数的优劣(从Function set中找出best function)
用训练集输入模型，评价函数的优劣，找出最好的函数
（其中评价函数的好坏用损失函数（Loss function，以下简称L）的数值来评分。）
求最小损失函数的方法之一：梯度下降法（Gradient Descent）
基本思想：对函数参数求微分，使得待求的参数为
令微分为0，求出w。
通过每次如下迭代，得到最终的w。

然而，这里存在一个问题，微分为0的点可能是局部最小（对于Loss function），并不是全局最小的点。
对于两个参数的模型，对两个参数分别求微分：

随着每次迭代，L确实在变小，但是却不一定能到全局最小的点。可能卡在saddle point，亦可能卡在局部最小值。

经过选择的模型在测试集上会产生比训练集更大的误差，需要重新选择模型。
越复杂的模型在训练集上表现会更好，因为比其简单的模型是其子集。然而，更加复杂的模型在测试集的表现不一定更好。这就是过拟合问题。
有以下调整方法：

.

考虑其他可能的变量，重新设计模型
正则化（Regularization）
正则化目的在于寻找到一个较为平滑的函数模型，平滑的函数更可能有更好的效果。
若输出与输入关系如下：

原先的L如下：

加入正则化后，L变为如下：

这里为了得到最小的L,会同时限制w的大小，但是需要设置一个合适的参数来找到w。

以此作为Myblog的Demo

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。