案例1
现在有100个样本点,部分数据截图如下:该数据前两列为特征数据,最后一列为标签
因为只有两个特征,我以第一个特征作为横坐标的值,以第二个特征作为纵坐标的值。图像如下:现在我要找到决策边界(找到最佳的θ)对未知样本点进行预测分类
案例1-线性逻辑斯蒂回归分类
线性逻辑斯蒂-易错点的强调
(1)数据的预处理-添加偏置项
为每一个样本点添加一个偏置项,即添加1;
(2)利用梯度下降法求解最优的回归参数
numpy中数组和矩阵的区别
numpy中数组和矩阵的区别:matrix是array的分支,matrix和array在很多时候都是通用的,你用哪一个都一样。但这时候,官方建议大家如果两个可以通用,那就选择array,因为array更灵活,速度更快,很多人把二维的array也翻译成矩阵。但是matrix的优势就是相对简单的运算符号,比如两个矩阵相乘,就是用符号*,但是array相乘不能这么用,得用方法.dot()array的优势就是不仅仅表示二维,还能表示3、4、5…维,而且在大部分Python程序里,array也是更常用的。
(2)利用梯度下降法求解最优的回归系数
(3)迭代求得最优参数
(4)画出决策边界