机器学习中有非常多的模型,那么模型的原理是什么?参数怎么使用?模型如何选择?这是困扰我比较久的问题,借最近学习sklearn顺便学一学我最近项目里面需要的模型。
----------目录--------------
1. 如何选择合适的模型?
2. 公式与原理
3. 调用sklearn库实现逻辑回归代码详解
1. 如何选择合适的模型?
在sklearn官网上有这样一幅图,标明了数据量小于大于多少时可以参考使用的模型,具体实际操作时可供参考:
http://sklearn.apachecn.org/cn/0.19.0/tutorial/machine_learning_map/index.html
分类模型的选择是这样的:
2. 公式与原理
之所以先介绍逻辑回归,因为它是最简单的线性回归的升级版(这是我自己的理解哈),下面我将官网上的解释和自己的理解融合了一下:
logistic 回归,虽然名字里有 “回归” 二字,但实际上是解决分类问题的一类线性模型。线性问题的模型数学公式简单来说是y=ax+b,x就是输入的特征,可以有多个,a就是x特征的权重,越大代表x这个特征越重要,b是偏置,作用就是input为0时,至少有一个可以用来表示data波动的量。
而逻辑回归是通过odd函数对y=ax&#