1.1应用场景:解决二分类问题
- 判断是否为垃圾文件
- 判断是否患病
- 判断是否为金融诈骗
1.2步骤
- 输入:一个线性回归的结果:
y
=
w1x1
+
w2x2
+
w3x3
+
……
+
wnxn
+
b
- 再将输入映射到sigmoid函数(值域[0, 1]) :
1
/
(
1
+
e^(
-
x))
- 输出:[0, 1]区间内的一个概率值,默认0.5为阈值
- 损失函数:对数似然损失
1.3逻辑回归API
1.4癌症分类预测案例
数据准备:
原始数据URL:https://archive.ics.uci.edu/ml/machine-learning-databases/
流程分析:
- 获取数据:读取时加上names
- 数据处理:处理缺失值
- 数据集划分
- 特征工程:标准化实现无量纲处理
- 逻辑回归预估器
- 模型评估