从一个简单的数据集学习Logistic Regression

最新推荐文章于 2024-05-18 10:19:02 发布

coding丁

最新推荐文章于 2024-05-18 10:19:02 发布

阅读量709

点赞数

分类专栏：机器学习文章标签： Logistic Regression

本文链接：https://blog.csdn.net/dingdingdodo/article/details/101163249

版权

Logistic Regression

Logistic Regression是一种被广泛使用的分类算法，通过训练数据中的正负样本，学习样本特征到样本标签之间的假设函数。

通常用于将数据映射到不同类别的函数成为阈值函数，常用的阈值函数为Sigmoid函数，形式为：
$f(x)=\frac{1}{1+e^{-x}}$
Sigmoid函数的图像：

在这里插入图片描述
从Sigmoid的图像可以看出函数的值域为(0,1),在0附近变化比较明显

Sigmoid函数的python代码：

def sig(x):
    '''Sigmoid函数
    input:  x(mat):feature * w
    output: sigmoid(x)(mat):Sigmoid值
    '''
    return 1.0 / (1 + np.exp(-x))

因此对于输入向量X，其属于正例和反例的概率为：
$P(y=1|X,W,b)=\frac{1}{1+e^{-（WX+b）}}\\反例的概率： P(y=1|X,W,b)=\frac{e^{-(WX+b)}}{1+e^{-（WX+b）}}$
对于Logistic Regression算法来说，如何定义W和b使得算法最优？(什么是最优)

为了求解最优的权重矩阵W和偏置向量b，需要定义损失函数

对于上述的Logistic Regression算法，属于类别 y 的概率是
$P(y|X,W,b)=\sigma(WX+b)^y(1-\sigma(WX+b))^{1-y}$
其中 σ 表示的是Sigmoid函数。

在此用极大似然法进行估计。假设训练数据集有m个训练样本{ {X1,Y1},{X2,Y2},……{Xn,Yn}},则其似然函数为：

最低0.47元/天解锁文章

coding丁

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
从一个简单的数据集学习Logistic Regression

Logistic RegressionLogistic Regression是一种被广泛使用的分类算法，通过训练数据中的正负样本，学习样本特征到样本标签之间的假设函数。通常用于将数据映射到不同类别的函数成为阈值函数，常用的阈值函数为Sigmoid函数，形式为：f(x)=11+e−xf(x)=\frac{1}{1+e^{-x}}f(x)=1+e−x1Sigmoid函数的图像：从Si...
复制链接

扫一扫