TensorFlow训练Logistic回归

最新推荐文章于 2024-07-14 13:27:24 发布

超人汪小建(seaboat)

最新推荐文章于 2024-07-14 13:27:24 发布

阅读量1.1w

点赞数 3

文章标签： tensorflow logistic 回归对数似然

本文链接：https://blog.csdn.net/wangyangzhizhou/article/details/70474391

版权

TensorFlow 专栏收录该内容

6 篇文章 1 订阅

订阅专栏

Logistic回归

在用线性模型进行回归训练时，有时需要根据这个线性模型进行分类，则要找到一个单调可微的用于分类的函数将线性回归模型的预测值关联起来。这时就要用到逻辑回归，之前看吴军博士的《数学之美》中说腾讯和谷歌广告都有使用logistics回归算法。

如下图，可以清晰看到线性回归和逻辑回归的关系，一个线性方程被逻辑方程归一化后就成了逻辑回归。.

这里写图片描述

Logistic模型

对于二分类，输出 $y \in \{0,1\}$ ，假如线性回归模型为 $z = \theta^Tx$ ，则要将z转成y，即 $y=g(z)$ 。于是最直接的方式是用单位阶跃函数来表示，即

y = ⎧ ⎩ ⎨ ⎪ ⎪ 0, 0.5, 1, z < 0; z = 0; z > 0;

$y = \left\{\begin{matrix} 0, & z<0;\\ 0.5, & z=0;\\ 1, & z>0; \end{matrix}\right.$
如图，
这里写图片描述

但阶跃函数不连续，于是用sigmoid函数替代之，为

y = 1 1 + e - z

$y = \frac{1}{1+e^{-z}}$
如图，
这里写图片描述

则有，

y = 1 1 + e - ( θ T x )

$y = \frac{1}{1+e^{-(\theta^Tx)}}$
即logistics函数，可化为，

ln y 1 - y = θ o + θ 1 x 1 + θ 2 x 2 + . . . + θ m x m

$\ln \frac{y}{1 - y} = \theta_o + \theta_1 x_1 +\theta_2 x_2 +...+\theta_mx_m$
此即为对数几率回归模型，其中y看成是样本x正例的概率，1-y则为样本x负例的概率，则

ln p ( y = 1 | x ) 1 - p ( y = 1 | x ) = θ T x

$\ln \frac{p(y=1|x)}{1-p(y=1|x)}=\theta^T x$

现在要解决的问题是如何求得 $\theta$ 。对于给定样本集 $\{(x_i,y_i)\}_{i=1}^{m}$ ，每个样本出现的概率为，

p (y i, x i) = p (y i = 1 | x i) y i (1 - p (y i = 1 | x i)) 1 - y i

$p(y_i,x_i)=p(y_i=1|x_i)^{y_i} (1-p(y_i=1|x_i))^{1-y_i}$
其中

yi $y_i$ 为1或0。则样本集出现的似然函数为

L (θ) = \prod i = 1 m p (y i, x i) = \prod i = 1 m p (y i = 1 | x i) y i (1 - p (y i = 1 | x i)) 1 - y i

$L(\theta) = \prod_{i=1}^{m}p(y_i,x_i)=\prod_{i=1}^{m}p(y_i=1|x_i)^{y_i} (1-p(y_i=1|x_i))^{1-y_i}$

对数似然为：

l (θ) = \sum i = 1 m ln p (y i, x i)

$l(\theta) = \sum_{i=1}^{m} \ln p(y_i,x_i)$

= \sum i = 1 m y i ln p (y i = 1 | x i) + (1 - y i) ln (1 - p (y i = 1 | x i))

$= \sum_{i=1}^{m} y_i \ln p(y_i=1|x_i) + (1-y_i) \ln (1-p(y_i=1|x_i))$

= \sum i = 1 m y i ln p ( y i = 1 | x i ) 1 - p ( y i = 1 | x i ) + \sum i = 1 m ln (1 - p (y i = 1 | x i))

$=\sum_{i=1}^{m} y_i \ln \frac {p(y_i=1|x_i)}{1-p(y_i=1|x_i)} + \sum_{i=1}^{m} \ln (1-p(y_i=1|x_i))$

= \sum i = 1 m y i θ T x i - \sum i = 1 m ln (1 + e θ T x i)

$= \sum_{i=1}^{m} y_i \theta^T x_i - \sum_{i=1}^{m} \ln (1+e^{\theta^T x_i})$

求对数似然最大化的 $\theta$ 。其中通过求导没办法求得解，所以肯定要用迭代去逼近最优解，可以用梯度下降法或者牛顿法求的解。

实现代码

import tensorflow as tf
from numpy import *

x_train = [[1.0, 2.0], [2.0, 1.0], [2.0, 3.0], [3.0, 5.0], [1.0, 3.0], [4.0, 2.0], [7.0, 3.0], [4.0, 5.0], [11.0, 3.0],
           [8.0, 7.0]]
y_train = [1, 1, 0, 1, 0, 1, 0, 1, 0, 1]
y_train = mat(y_train)

theta = tf.Variable(tf.zeros([2, 1]))
theta0 = tf.Variable(tf.zeros([1, 1]))
y = 1 / (1 + tf.exp(-tf.matmul(x_train, theta) + theta0))

loss = tf.reduce_mean(- y_train.reshape(-1, 1) * tf.log(y) - (1 - y_train.reshape(-1, 1)) * tf.log(1 - y))
train = tf.train.GradientDescentOptimizer(0.01).minimize(loss)

init = tf.initialize_all_variables()

sess = tf.Session()
sess.run(init)
for step in range(1000):
    sess.run(train)
print(step, sess.run(theta).flatten(), sess.run(theta0).flatten())

========广告时间========

公众号的菜单已分为“分布式”、“机器学习”、“深度学习”、“NLP”、“Java深度”、“Java并发核心”、“JDK源码”、“Tomcat内核”等，可能有一款适合你的胃口。

鄙人的新书《Tomcat内核设计剖析》已经在京东销售了，有需要的朋友可以购买。感谢各位朋友。

为什么写《Tomcat内核设计剖析》

=========================
欢迎关注：

这里写图片描述

超人汪小建(seaboat)

关注

3
点赞
踩
15

收藏

觉得还不错? 一键收藏
打赏
0
评论
TensorFlow训练Logistic回归

Logistic回归在用线性模型进行回归训练时，有时需要根据这个线性模型进行分类，则要找到一个单调可微的用于分类的函数将线性回归模型的预测值关联起来。这时就要用到逻辑回归，之前看吴军博士的《数学之美》中说腾讯和谷歌广告都有使用logistics回归算法。如下图，可以清晰看到线性回归和逻辑回归的关系，一个线性方程被逻辑方程归一化后就成了逻辑回归。.Logistic模型对于二分类，输出y∈{0,1}y
复制链接

扫一扫