逻辑回归(Logistic Regression)
针对因变量为分类变量而进行回归分析的一种统计方法,属于概率性非线性回归。
优点:算法容易实现和部署,执行效率和准确度高。
缺点:离散类型的自变量数据需要通过生成虚拟变量的额方法来使用
2 公式对比
线性回归方程
y=a1x1+a2x2+....+anxn
Sigmoid函数(Sigmoid Function)
3、虚拟变量
哑变量和离散特征编码,可以用来表示分类变量、非数量因素可能产生的影响。
离散特征的取值之间有大小的意义 ,例如:尺寸(L、XL、XXL)
离散特征的取值之间没有大小的意义,例如:颜色(red,Blue,Green)
模块实现: pandas.Series.map(dict)
离散特征的取值之间有大小意义的处理函数。
参数说明:
dict 映射的字典
4、代码案例实现
import pandas
data=pa