统计学习方法——逻辑回归

逻辑分布(Logistic Distribution):

定义:设X是连续型随机变量,X服从逻辑斯谛分布是指X具有以下的分布函数和分布密度:F(x)=P(X\leq x)=\frac{1}{1+e^{-\frac{(x-\mu )}{\gamma }}}        ;       f(x)={F}'(x)=\frac{e^{-\frac{(x-\mu )}{\gamma }}}{\gamma (1+e^{-\frac{(x-\mu )}{\gamma }})^{2}},                      式中\mu是位置参数,\gamma是形状参数。

  • 分布函数是一条S形曲线,该曲线也被称为sigmoid曲线,关于点(\mu ,\frac{1}{2})中心对称。
  • 概率密度函数是一条钟型曲线,中间高两边低,关于x=\mu对称,在此处取得最大值\frac{1}{4}\gamma

逻辑回归(Logistic Regression):

定义:

x\in R^{n}是输入,Y\in \left \{ 0,1 \right \}是输出,w\in R^{n}b\in R是参数,w称为权值参数,b称为偏置,w\cdot x表示wx的内积。二项逻辑回归模型为以下的条件概率:

P(Y=1|x)=\frac{e^{w\cdot x+b}}{1+e^{w\cdot x+b}}      ;        P(Y=0|x)=\frac{1}{1+e^{w\cdot x+b}}

  • 该模型的输入变量和输出变量之间不存在线性关系;
  • 逻辑回归的输入变量可以是连续变量或离散变量;
  • 参数估计采用极大似然估计法。

参数估计方法:

可以用极大似然估计法来求参数w

L(w)=\prod_{i=1}^{N}P(Y=y_{i}|x_{i})=\prod_{i=1}^{N}P_{i}^{y_{i}}(1-P_{i})^{1-y_{i}}=\sum_{i=1}^{N}[y_{i}logp_{i}+(1-y_{i})log(1-p_{i})]=\sum_{i=1}^{N}[y_{i}(w\cdot x_{i})-log(1+exp(w\cdot x_{i}))]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值