Linear Regression Logistic Regression

线性回归概率解释。假设误差分布为正态分布,然后在theta条件下y相对于x的概率分布就是误差的概率分布了。

这时存在m个样本,由于m次实验是相互独立的,所以结果向量y的分布概率密度应为各次实验y分布概率密度的乘积


这是我们需要搞定的一个问题就是,theta取何值时,得到的L函数值最大。

这里的一些解释:由于误差epsilon服从期望为0的正态分布,所以在epsilon越接近0时,即模拟值theta · x 越接近y值时,概率密度越大。所以如果要使得模拟值最大程度地接近y值,L值应尽可能地大。所以我们需要找到使得L值最大的theta

log函数是严格单调递增函数,所以取 l=logL 将乘法转化为加法,幂运算转化为乘法运算,便于计算。


逻辑回归

线性回归是对连续目标值的模拟,而逻辑回归是利用theta的某函数进行对于给定输入数据的评估分类,输出为0或1。

此时若使用线性函数作为h评估函数 那么由于函数图像是一条直线,并不能体现出输入不同对于输出的影响。所以使用了sigmoid函数,在h=1/2的附近,函数值的变化很快,会迅速地从0变为1,更适合分类。

将theta · x 作为函数的自变量。仍然从概率方面入手,将h函数的值作为x给定的情况下y取1的概率。此时有:若theta · x大于0,则h函数的值大于1/2 即y取1的概率大于1/2,y更有可能取1。否则,y更可能取0。


仍然利用极大似然方法,求结果向量y在给定x输入组的情况下的概率分布。

此时利用极大似然方法的意义,使得每个样本中的y都能取得“有着较大概率取得”的值,以分类的角度看,即是分到更为客观的那一类中。


GLM(generalized linear model 广义线性模型)

 exponential family 

y在某前提下的概率密度有固定程式


1 如果theta前提 x条件下 y的分布是ex family

2 h函数为x条件下T(y)的期望

3 fai为theta · x

即可得到一个线性模型

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值