分类算法是典型的监督学习,其训练样本中包含样本的特征和标签信息。比如:二分类中,结果会表示正类和负类。分类算法通过对训练样本的学习,得到从样本特征到样本的标签之间的映射关系,也被称为假设函数,之后可利用该假设函数对新数据进行分类。
逻辑回归模型
一、问题
所解决的问题,例如:
1、判断一条评论是正面还是负面
2、判断用户性别
3、预测一个用户是否点击特定的商品
二、模型
1、认识sigmoid函数,其数学形式为:
Sgimoid图像
2、决策函数
逻辑回归模型所做的假设是:
其中,为sigmoid函数,相应的决策函数为:
,if
首先来解释一下的表示的是什么?它表示的就是将因变量预测成1的概率,具体来说它所要表达的是在给定x条件下事件y发生的条件概率,而
是该条件概率的参数。
P(y=0|x;o)=1-P(y=1|x;o)
3、参数求解
逻辑回归模型中,似然度可表示为:
取对数可以得到对数似然度:
4、分类边界
从sigmoid函数分类,当,
,否则
,
是模型隐含的分类平面