所记知识来自网络,视频,资料等。仅为自己记录,回顾使用。
侵删。
一、逻辑回归问题
在分类问题中,要预测的变量是一个离散的值,我们将学习一种逻辑回归的算法(LogisticRegression)这是比较主流的一种方法。
在分类问题中,我们尝试预测的结果是否是一类。
例如判断一封电子邮件是否是垃圾邮件,判断一次交易是否是欺诈等。
之前的线性回归,如果假设函数输出值可能会大于1或者小于0。这会有点奇怪。
现在我们要学的逻辑回归算法他的输出值在0与1之间。
【注】虽然逻辑回归中有“回归”二字,但是我们通常说他是一个分类算法。
1.1如何表示
对于一个分类问题,为了便于说明,我们举判断肿瘤是否是恶性的例子。
线性回归的方法我们认为
hθ(x)>=0.5时y=1
hθ(x)<=0.5时y=0
在逻辑回归的模型中,我们的假设函数
hθ(x)=g(θTX)
其中:X代表特征向量
g代表逻辑函数
如sigmoid函数。当然有许多的逻辑函数可供选择。
hθ(x)的作用是,对于给定输入变量,根据参数计算出输出变量=1的可能性。
对于给定的X,通过确定的参数计算出hθ(x)=0.7,则表示有70%的几率y是正向,相应的y是负向的几率就是0.3.
判定边界
决策边界(