《神经网络与深度学习》学习笔记——第二章机器学习概述

最新推荐文章于 2024-06-24 09:00:00 发布

我要毕业！！

最新推荐文章于 2024-06-24 09:00:00 发布

阅读量130

点赞数

分类专栏：神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_51118741/article/details/117477231

版权

神经网络专栏收录该内容

4 篇文章 0 订阅

订阅专栏

在这里插入图片描述

文章目录

一、机器学习的三个基本要素

一、机器学习的三个基本要素

1.1、模型

线性模型
非线性模型

1.2、学习准则

模型f(x;θ)的好坏可以通过期望风险R(θ)(损失函数的期望) 来衡量
在这里插入图片描述

1.2.1 损失函数

损失函数是一个非负实数函数，用来量化模型预测和真实标签之间的差异。

0-1损失函数

模型在训练集上面的错误率
在这里插入图片描述

平方损失函数

用于预测标签y为实数值的任务中，一般不适用于分类问题（最小二乘法）
在这里插入图片描述

交叉熵损失函数

一般用于分类问题（负对数似然函数）

在这里插入图片描述

hinge损失函数

一般用于分类问题
在这里插入图片描述

1.2.2 风险最小化准则

一个好的模型应该有较小的期望错误。

经验风险最小化

由于不知道真实数据分布和映射函数，实际上无法计算其期望风险。但可以计算经验风险（在训练集上的平均损失）。一个确实可行的学习准则是找到一组参数θ^*使得经验风险最小，即：
在这里插入图片描述
由于训练样本比较少，不能反映全部数据的真实分布。经验风险最小化准则很容易导致模型在训练集上错误率很低，但在未知数据上错误率很高（过拟合）。

结构风险最小化

为解决过拟合问题，一般在经验风险最小化的基础上再引入参数的正则化来限制模型能力，使其不要过度的最小化经验风险。
在这里插入图片描述

1.3、优化算法

梯度下降法

提前停止

随机梯度下降法

小批量梯度下降法

我要毕业！！

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。