介绍:
回归:用一条直线对已知数据点进行拟合的过程称作回归。
利用Logistic回归进行分类的主要思想:根据现有数据对分类边界线建立回归公式,以此进行分类。
回归的关键在于寻找最佳拟合参数,使用的是最优化算法。
Logistic回归的一般过程:
1 收集数据---2 准备数据---3 分析数据---4 训练算法(目的是找到最佳的分类回归系数,占用大部分时间)---5 测试算法
---6 使用算法(将数据转换为对应的结构化数值,基于训练得到的回归系数进行简单的回归计算,并判断类别)
5.1 基于Logistic回归和Sigmoid函数的分类
期待的函数:根据所有的输入然后预测出类别。若有两个分类,则输出为0/1.
单位阶跃函数:该函数在跳跃点上从0瞬间跳到1,该过程有时很难处理。
Sigmoid函数:有单位阶跃函数相似的性质,且在数学上更易处理。
计算公式和函数图像如下:
当x为0时,函数值为0.5。随着x值的增大,函数值将逼近于1。随着x的减小,函数值将逼近于0.Logistic回归分类器:在每个特征上都乘以一个回归系数,然后把所有的结果值相加,将这个总和带入到Sigmoid函数中,进而得到一个范围在0-1之间的数值。任何大于0.5的数据被分入1类,小于0.5被归入0类。
z=w0x0&