Logistic Regression详解

Regression是什么?

  • Regression:找到一个模型去表示数据间的关系
  • Linear Regression:使用线性模型拟合数据
  • Logistic Regression:其实本质也是线性拟合,但引入了log,这个之后会详细说

也就是说,不管什么Regression,都是想找到一个模型来拟合数据。

Likelihood

Likelihood与我们平常所说的Probability相反。

举个例子,平常说B站有60%的人是宅男,这个60%就是概率。我们换个思路,如果告诉你一个人是宅男,那他有多大的可能是B站用户呢?我们同意“宅男都混B站”这个判断的话,就说这个宅男100%是B站用户。这里100%就是likelihood。

其实到这里,我们已经完成了一次预测 —— 预测一个宅男是否为B站用户。事实上,这个在现实生活中非常有用。比如根据症状判断是否得了癌症,根据性别年龄等特征判断是否已婚等等。

regression的主要用途就是根据输入的特征做判断,并使本系统的判断与实际输出之间的差值最小。

Logistic Regression

引子:我们常用的是线性拟合,为什么?当然因为线性拟合简单,比如下面的红色数据点,我们可以简单的拿一个线性模型拟合(黄线)

这里写图片描述

可是,如果我们的点不是这么的符合线性条件呢?

使用最大后验概率作为模型质量的评测方式,我们需要使输入的已知点的likelihood最大,从而得到一个比较好的模型。

假设y的取值为1或0(也就是说,所有数据分为两类)

后验概率:

假设

PY1|XxPxθ

(给定输入x,输出为1的概率)

可以得到,

i=1mPYyi|Xxii=1mPxiθyi(1Pxiθ)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值