文章参考 https://www.cnblogs.com/chamie/p/4876149.html 【Machine Learning in Action --5】逻辑回归(LogisticRegression)从疝气病预测病马的死亡率
文章实例为疝气症预测病马死亡率,实例数据:http://archive.ics.uci.edu/ml/datasets/Horse+Colic
引言
logistic回归,一种广义的线性回归分析模型。常用于做二分类问题(非0即1),但是logsitic回归并不是分类器,是一种概率估计,下文中会做详细解释。
问题提出
给定 个个体 ,对每一组个体求预测值 ,使得 其中 为 维列向量, 中每一个元素都是个体特征,总共 个特征, 取值为0或1。
即是 ,。
对于文章的实例,就是给出300组数据(300个个体),每组数据的 为病马的一些特征,例如年龄,呼吸频率等, 即是病马死亡(0)或病马存活(1)。
logistic函数
上述问题可用拟合的方法进行求解,由于是二分类问题,简单的线性回归 无法满足我们的需求(线性回归的值域为),那么引出了sigmoid函数。
sigmoid函数 ,也称作logistic函数,特殊地 。
图像如图所示,简单可以看出sigmoid函数可以将线性回归 映射到 区间,问题并没有解决,