如今的机器学习采用了新的计算技术,因此与过去的机器学习有所不同。它源于模式识别和计算机无需编程即可进行学习以执行特定任务的理论;对人工智能感兴趣的研究人员希望了解计算机是否可以从数据中学习。机器学习的迭代方面很重要,因为当模型接触新数据时,它们能够独立进行适应。它们从以前的计算中学习,以得出可靠、可重复的决策和结果。这不是一门新科学,而是一门获得了崭新动力的科学。
![](https://i-blog.csdnimg.cn/blog_migrate/6c8037ad60d958e067c08ab00cf7f7e6.png)
一、指定阈值
逻辑回归返回的是概率。你可以“原样”使用返回的概率(例如,用户点击此广告的概率为 0.00023),也可以将返回的概率转换成二元值(例如,这封电子邮件是垃圾邮件)。
如果某个逻辑回归模型对某封电子邮件进行预测时返回的概率为 0.9995,则表示该模型预测这封邮件非常可能是垃圾邮件。相反,在同一个逻辑回归模型中预测分数为 0.0003 的另一封电子邮件很可能不是垃圾邮件。可如果某封电子邮件的预测分数为 0.6 呢?为了将逻辑回归值映射到二元类别,你必须指定分类阈值(也称为判定阈值)。如果值高于该阈值,则表示“垃圾邮件”;如果值低于该阈值,则表示“非垃圾邮件”。人们往往会认为分类阈值应始终为 0.5,但阈值取决于具体问题,因此