机器学习(九)-逻辑回归理论篇

最新推荐文章于 2019-05-22 16:07:05 发布

gf_lvah

最新推荐文章于 2019-05-22 16:07:05 发布

阅读量630

点赞数

本文链接：https://blog.csdn.net/gf_lvah/article/details/89467790

版权

本文介绍了逻辑回归的基本概念及其在二分类问题中的应用。通过回顾线性回归，讨论了为什么不能直接使用线性回归解决二分类问题，并引出了Sigmoid函数作为解决方案。同时，解释了逻辑回归的决策边界，包括线性和非线性情况。最后，探讨了逻辑回归的损失函数——交叉熵，并解释了为什么使用梯度下降进行参数优化。

摘要由CSDN通过智能技术生成

1 要点知识回顾

集合的划分
训练集（训练集，验证集（交叉验证）/开发集），测试集
机器学习的分类
- 有监督的机器学习：线性回归（提供了y值）
- 无监督的机器学习： KNN算法(没有提供y值)
线性回归
- 线性回归： y = ax +b
- 多元线性回归： y = w0x0 + w1x1 + … + wnwn
- 多项式回归： y = w0x0 + w1x1 + w2x0**2 + w3x1**2

逻辑回归（Logistic Regression）是一种用于解决二分类（0 or 1）问题的机器学习方法，用于估计某种事物的可能性。比如某用户购买某商品的可能性，某病人患有某种疾病的可能性，以及某广告被用户点击的可能性等。

需求：根据肿瘤大小预测是良性肿瘤还是恶性肿瘤?
有家医院希望我们能开发出一款分类器，可以通过数据分析出一块肿瘤到底是良性的，还是恶性的？
- 0：负例 “Negative Class” (良性肿瘤)
- 1：正例 “Positive Class” (恶性肿瘤)
分析:
- 如果只有前8个点，则通过第一条直线拟合数据模型，也就是当肿瘤大小小于10平方毫米时，则认为是良性肿瘤;
- 如果有9个点，则通过第二条直线拟合数据模型，也就是当肿瘤大小小于13平方毫米时，则认为是良性肿瘤;但真实的数据显示11平方毫米已经是恶性肿瘤了，因此传统的线性回归并不能成功的拟合数据模型.