第五章 Logistic回归
PS:个人笔记 根据《机器学习实战》这本书,Jack-Cui的博客,以及深度眸的视频进行学习
1 优缺点及适用数据范围
优点:
①计算代价不高(算起来比较简单,log做了简化)
②易于理解和实现
缺点:
①容易欠拟合(拟合效果不是特别好,有些异常数据)
②分类精度可能不高
适用数据类型:
数值型和标称型数据
2 Logisitc回归与Sigmoid函数
回归:假设现在有一些数据点,我们利用一条直线对这些点进行拟合(该线称为最佳拟合直线),这个拟合过程就称作为回归。
Logistic回归是回归的一种方法,它利用的是Sigmoid函数阈值在[0,1]这个特性。Logistic回归进行分类的主要思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。其实,Logistic本质上是一个基于条件概率的判别模型(Discriminative Model)。
Sigmoid函数公式如下:
这个公式就是参数(未知),与给定数据集的矩阵。
这是sigmodi公式的本质,把值反映在一个区间中。
整合成一个公式,就变成了如下公式: