记录一下机器学习过程
大纲自己大概写写总结及记录一下、
完整看对应链接
===== ===== ===== ===== ===== ===== ===== ===== ===== ===== =====
链接:https://blog.csdn.net/CharlieLincy/article/details/70767791
Logistic 回归(Logistic Regression)
(1)是一种基于最优化算法的分类方法。
(2)优点:计算代价不高,易于理解和实现。
缺点:容易欠拟合,分类精度可能不高。
适用数据类型: 数值型和标称型数据。
基于 Logistic 回归和 Sigmoid 函数的分类
基于 Logistic 回归的分类模型是这样的,给定任意一组输入,然后通过某个函数得到输出,这个输出就是输入数据的分类。比如,在二分类情况下,这个函数就输出 0 或 1。
符合这个性质的函数有很多种,其中一种就是 Sigmoid 函数:
这个函数长这样:
要做的,就是确定这个分类器中的最佳回归系数,即 (w0, w1, w2, ... , wn)
上面这个公式可以写成下面这样的形式。其中 w 是行向量,x 是列向量。x 是分类器的输入数据,w 是回归系数。
顺便说一句,sigmoid 函数的导数挺有趣的:
可以自行验证一下。
梯度上升法
现在我们就去找最佳参数 w。方法用的是 最优化算法,这里首先介绍其中一种:梯度上升法。