Datawhale-2020年8月组队学习:机器学习算法梳理(AI入门体验)
Task01:基于逻辑回归的分类预测
1. 算法介绍
逻辑回归(logistic regression)也称逻辑斯蒂回归、对数几率回归,虽然被称为回归,但其实际上是分类模型,常用于二分类,也可用于多分类任务。
逻辑回归的本质是:假设数据服从logsitc分布,通过极大似然估计对参数进行估计,最终得到分类结果。
1.1 Logistic分布
设 X X X(输入数据)是连续随机变量, X X X服从Logistic分布,则 X X X具有下列的分布函数和密度函数:
F ( x ) = P ( X ≤ x ) = 1 1 + e − ( x − μ / γ ) F(x)=P(X\leq x)=\frac{1}{1+e^{-(x-\mu/\gamma)}} F(x)=P(X≤x)=1+e−(x−μ/γ)1 f ( x ) = F ′ ( x ) = 1 + e − ( x − μ / γ ) γ ( 1 + e − ( x − μ / γ ) ) 2 f(x)=F'(x)=\frac{1+e^{-(x-\mu/\gamma)}}{\gamma(1+e^{-(x-\mu/\gamma)})^{2}} f(x)=F′(x)=γ(1+e−(x−μ/γ))21+e−(x−μ/γ)式中, μ \mu μ为位置参数, γ > 0 \gamma>0 γ>0为形状参数。
Logistic分布的密度函数