机器学习算法(一): 基于逻辑回归的分类预测
1 逻辑回归的介绍和应用
1.1 逻辑回归的介绍
逻辑回归(Logistic regression,简称LR)逻辑回归为分类模型,最突出的两点就是其模型简单和模型的可解释性强。
逻辑回归模型的优劣势:
- 优点:实现简单,易于理解和实现;计算代价不高,速度很快,存储资源低;
- 缺点:容易欠拟合,分类精度可能不高
1.1 逻辑回归的应用
逻辑回归模型应用领域
1.大多数医学领域和社会科学。例如,最初由Boyd 等人开发的创伤和损伤严重度评分(TRISS)被广泛用于预测受伤患者的死亡率,使用逻辑回归 基于观察到的患者特征(年龄,性别,体重指数,各种血液检查的结果等)分析预测发生特定疾病(例如糖尿病,冠心病)的风险。
2.用于预测在给定的过程中,系统或产品的故障的可能性。还用于市场营销应用程序,例如预测客户购买产品或中止订购的倾向等。
3.在经济学中它可以用来预测一个人选择进入劳动力市场的可能性,
4.在商业应用则可以用来预测房主拖欠抵押贷款的可能性。
5.条件随机字段是逻辑回归到顺序数据的扩展,用于自然语言处理。
逻辑回归模型是很多分类算法的基础组件,也是一个理解数据的好工具。但同时由于其本质上是一个线性的分类器,所以不能应对较为复杂的数据情况。很多时候我们也会拿逻辑回归模型去做一些任务尝试的基线。
2 学习目标
- 了解 逻辑回归 的理论
- 掌握 逻辑回归 的 sklearn 函数调用使用并将其运用到鸢尾花数据集预测
3 代码流程
-
Part1 Demo实践
-
- Step1:库函数导入
-
- Step2:模型训练
-
- Step3:模型参数查看
-
- Step4:数据和模型可视化
-
- Step5:模型预测
-
Part2 基于鸢尾花(iris)数据集的逻辑回归分类实践
-
- Step1:库函数导入
-
- Step2:数据读取/载入
-
- Step3:数据信息简单查看
-
- Step4:可视化描述
-
- Step5:利用 逻辑回归模型 在二分类上 进行训练和预测
-
- Step5:利用 逻辑回归模型 在三分类(多分类)上 进行训练和预测## 新的改变
以上内容来自:阿里云天池