机器学习01-基础概念公式

最新推荐文章于 2024-08-31 11:22:05 发布

twilight_cc

最新推荐文章于 2024-08-31 11:22:05 发布

阅读量183

点赞数

分类专栏：机器学习文章标签：基础概念

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43841579/article/details/102564561

版权

机器学习专栏收录该内容

8 篇文章 0 订阅

订阅专栏

最大似然估计

似然函数是一种关于统计模型中的参数的函数，表示模型参数的似然性。

似然函数取得最大值表示相应的参数能使统计模型最为合理。

$L (b ∣ A) = P (A ∣ B = b)$

假设空间

由输入空间到输出空间的所有模型映射的集合

损失函数

模型输出的预测值 $f (X)$ 与真实值 $Y$ 的非负实值函数

风险函数（期望损失）

模型 $f (X)$ 关于联合分布 $P (X, Y)$ 的平均意义下的损失

$R_{exp}(f)=E_p[L(Y,f(X))]=\int_{x*y} L(y,f(x))P(x,y)dxdy$

经验风险

模型 $f (X)$ 关于训练数据集的平均损失

$R_{emp}(f)=\frac{1}{N}\sum_{i=1}^nL(y_i,f(x_i))$

经验风险最小化：经验风险最小的模型就是最优的模型

$min_{f\subset F}\frac{1}{N}\sum_{i=1}^nL(y_i,f(x_i))$

模型选择方法

结构风险最小化：结构风险最小的模型就是最优的模型；防止过拟合的策略 = 正则化

$R_{srm}(f)=\frac{1}{N}\sum_{i=1}^nL(y_i,f(x_i))+\lambda J(f) min_{f\subset F}\frac{1}{N}\sum_{i=1}^nL(y_i,f(x_i))+\lambda J(f)$

L2范数： $L(w)=\frac{1}{N}\sum_{i=1}^nL(y_i,f(x_i))+\frac{\lambda}{2} ||w||^2$

L1范数： $L(w)=\frac{1}{N}\sum_{i=1}^nL(y_i,f(x_i))+\lambda||w||$

过拟合

学习时选择的模型所包含的参数过多，导致模型对训练数据预测的很好，对测试数据预测的很差

泛化能力

泛化误差：理论上分析学习方法的泛化能力 $\hat{f(X)}$ 为学习到的模型，可理解为经验风险最小化模型
$R_{exp}(\hat{f})=E_p[L(Y,\hat{f(X)})]=\int_{x*y} L(y,\hat{f(x)})P(x,y)dxdy$

生成模型

由数据学习联合概率分布 $P (X, Y)$ ，然后求出条件概率分布 $P (Y ∣ X)$ 作为预测模型，即生成模型

$P(Y|X)=\frac{P(X,Y)}{P(X)}$

特点：生成方法可还原出联合概率分布 $P (X, Y)$ ，而判别方法则不能；生成方法的学习收敛速度更快，即当样本容量增加的时候，学到的模型可以更快的收敛于真实模型；当存在隐变量时，仍可以用生成方法学习，但判别方法不能用

朴素贝叶斯法
隐马尔可夫模型

判别模型

由数据直接学习决策函数 $f (X)$ 或条件概率分布 $P (Y ∣ X)$ 作为预测模型，即判别模型
特点：直接面对预测，往往学习的准确率更高；由于直接学习 $f (X)$ 或 $P (Y ∣ X)$ ，可以对数据进行各种程度上的抽象，定义特征并使用特征，因此可以简化学习问题

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

twilight_cc CSDN认证博客专家 CSDN认证企业博客

码龄6年

28: 原创

41万+: 周排名

49万+: 总排名

2万+: 访问

: 等级

477: 积分

12: 粉丝

17: 获赞

4: 评论

103: 收藏

私信

关注

热门文章

分类专栏

最新评论

贝叶斯优化与高斯过程
qq_42124129: http://www.jos.org.cn/jos/ch/reader/create_pdf.aspx?file_no=5607&journal_id=jos
深度学习网络-AlexNet
Rococo-W: conv_4_1和conv_4_2为什么第四个卷积层分开了？
深度学习网络-AlexNet
Rococo-W: 卷积通道和特征map数量计算那边，4*4*1，1是指把三色通道相加了吗？
PCA之sklearn与sparkmllib源码剖析对比
qq_45976202: 哥们那sparkmllib的pca处理和python的pca处理相比，可靠性怎么样

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。