机器学习------逻辑回归认识

写点东西,以作记忆
首先是一点自己的理解:
一、 逻辑回归是一个二分类算法,主要是根据测试数据来构建一个公式,称为概率密度函数,然后根据这个公式对验证数据进行计算,算出属于哪个类别的概率是多少。
能用概率来算的前提数据类别一定是两类的,也就是0和1,而测试数据各属性值范围都是不一定,因此找到一个函数能够根据测试样例的各属性值X计算出的一个y能够映射到0—-1之间,这就是Sigmoid函数,也就是预测函数,函数形式为:
这里写图片描述
二、预测函数找到了,那么预测函数中的有效参数θ 如何找呢。
首先我们应该知道,除非非常特殊情况下,一般不会正好有一列值θ 能够让所有的测试样例根据θ 算出的概率正好不是0就是1,也就是预测函数对所有测试样例来说一定会有误差(也有说是损失,这里我就都用自己的理解来说了)。
那么选取一列θ 值,让所有的样例数据最后得到的计算值y与实际值0–1的差值尽量达到最小,也就完成了最后的预测函数。
通过数学方面概率函数变换,使概率取值越大,越接近实际值0或者1(yi)也就是函数

P(y=1│x;θ)=h_θ (x)
P(y=0│x;θ)=1-h_θ (x)

函数h(x)的值有特殊的含义,它表示结果取1的概率;将两者综合一下,得到一个函数:(cost函数:损失函数)这里写图片描述

也就是说,在m个测试样例进行计算的最后得到的值越大越好,
然后根据极大似然函数并求导,推导出最后的求解公式:
这里写图片描述

具体推导过程详看转载链接
然后对θ 进行迭代,直到合适为止。
这里自我理解,其实梯度下降就是对一元函数的系数计算,对θ j的每个来说,其实都是一个一元函数 y=ax+b(a = θj,b=θ i*x+k ) 进行求导后就是a(θ j)
所以叫梯度下降求解,

以上都是对逻辑回归算法当中专有名词的一些理解,尽量转化成所学的最浅显的东西进行解释,详细推导过程网上一堆,这里就不贴了,之后有补充再进行添加。

参考资料:
https://blog.csdn.net/chibangyuxun/article/details/53148005
https://www.cnblogs.com/babers/p/6817317.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值