Linear Regression Logistic Regression

最新推荐文章于 2024-06-05 10:44:52 发布

LAwwp

最新推荐文章于 2024-06-05 10:44:52 发布

阅读量256

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LAwwp/article/details/47065533

版权

线性回归概率解释。假设误差分布为正态分布，然后在theta条件下y相对于x的概率分布就是误差的概率分布了。

这时存在m个样本，由于m次实验是相互独立的，所以结果向量y的分布概率密度应为各次实验y分布概率密度的乘积

这是我们需要搞定的一个问题就是，theta取何值时，得到的L函数值最大。

这里的一些解释：由于误差epsilon服从期望为0的正态分布，所以在epsilon越接近0时，即模拟值theta · x 越接近y值时，概率密度越大。所以如果要使得模拟值最大程度地接近y值，L值应尽可能地大。所以我们需要找到使得L值最大的theta

log函数是严格单调递增函数，所以取 l=logL 将乘法转化为加法，幂运算转化为乘法运算，便于计算。

逻辑回归

线性回归是对连续目标值的模拟，而逻辑回归是利用theta的某函数进行对于给定输入数据的评估分类，输出为0或1。

此时若使用线性函数作为h评估函数那么由于函数图像是一条直线，并不能体现出输入不同对于输出的影响。所以使用了sigmoid函数，在h=1/2的附近，函数值的变化很快，会迅速地从0变为1，更适合分类。

将theta · x 作为函数的自变量。仍然从概率方面入手，将h函数的值作为x给定的情况下y取1的概率。此时有：若theta · x大于0，则h函数的值大于1/2 即y取1的概率大于1/2，y更有可能取1。否则，y更可能取0。

仍然利用极大似然方法，求结果向量y在给定x输入组的情况下的概率分布。

此时利用极大似然方法的意义，使得每个样本中的y都能取得“有着较大概率取得”的值，以分类的角度看，即是分到更为客观的那一类中。

GLM（generalized linear model 广义线性模型）

exponential family

y在某前提下的概率密度有固定程式

1 如果theta前提 x条件下 y的分布是ex family

2 h函数为x条件下T(y)的期望

3 fai为theta · x

即可得到一个线性模型

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Linear Regression Logistic Regression

线性回归概率解释。假设误差分布为正态分布，然后在theta条件下y相对于x的概率分布就是误差的概率分布了。这时存在m个样本，由于m次实验是相互独立的，所以结果向量y的分布概率密度应为各次实验y分布概率密度的乘积这是我们需要搞定的一个问题就是，theta取何值时，得到的L函数值最大。这里的一些解释：由于误差epsilon服从期望为0的正态分布，所以在epsilon越接近0时，即模
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。