机器学习名称解释

最新推荐文章于 2023-09-07 21:41:04 发布

lcvcl

最新推荐文章于 2023-09-07 21:41:04 发布

阅读量991

点赞数 1

分类专栏：学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lcvcl/article/details/81081700

版权

目录

非监督学习

半监督学习

1.经验风险函数：

常用的损失函数（代价函数）：

2.结构风险函数：

训练误差：

测试误差：

泛化误差上界

模型评估方法

分层采样：保留类别比例的采样方法

1.S折交叉验证

2.留一交叉验证

3.留存交叉验证

查准率(精确率)、查全率(召回率)、F1

偏差与方差

监督学习

利用已知类别或结果的样本对模型进行学习的过程

学习过程中需要注意：权衡偏差和方差

非监督学习

半监督学习

强化学习

假设空间

输入空间到输出空间的映射的集合

模型属于假设空间

学习的目的在于找到最好的映射，即模型

统计学习三要素：模型、策略、算法

模型

指根据数据学习出来的模型，如贝叶斯的条件概率、决策树、线性回归的的系数等

策略

指学习的准则，即选择使用的经验风险函数或结构风险函数(一般通过选择的损失函数求和计算出来)

1.经验风险函数：

指模型f关于训练数据集的平均损失，其平均损失由选择的损失函数得到

期望损失函数公式：

因为x，y联合分布无法直接得出，所以使用经验风险近似期望损失

L代表所选择的损失函数

常用的损失函数（代价函数）：

2.结构风险函数：

防止出现过拟合情况，引入正则化项的经验风险函数

结构风险函数公式：

为正则化项，一般为系数的L1范数(会使某系数为0，使得特征更加稀疏)

策略将模型的求解转化为求解最优解的问题，也就是

求解最优化问题

算法：

指用于求解最优化问题的算法

一般有：坐标下降、梯度下降、拟牛顿法等

训练误差：

模型关于训练数据集的平均损失，也就是期望损失函数

测试误差：

模型关于测试集的平均损失（真实结果-根据模型计算出来的结果，的平均值）

测试误差小的模型的性能更好，说明模型泛化能力更强

过拟合：

将训练集特有的特征，学习成数据集整体的特征

学习时选择模型所包含的参数过多（训练模型使用的特征过多）

对已知数据预测的很好，未知数据预测的很差

最低0.47元/天解锁文章

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。