【Google 机器学习笔记】八、分类模型

【Google 机器学习笔记】

八、分类模型

本节内容较多,有一定难度和较多的数学知识,推荐重复阅读加深理解。


概念
  • 逻辑回归【Logistic Regression】:一种模型,极其高效的概率计算机制。通过将 S 型函数应用于线性预测,生成分类问题中每个可能的离散标签值的概率。虽然逻辑回归经常用于二元分类问题,但也可用于多类别分类问题(其叫法变为多类别逻辑回归或多项回归)。
  • S 型函数【Sigmoid function】:一种函数,可将逻辑回归输出或多项回归输出(对数几率)映射到概率,以返回介于 0 到 1 之间的值。S 型函数的公式如下: y = 1 1 + e − σ y=\frac1{1+e^{-\sigma}} y=1+eσ1  在逻辑回归问题中, σ = b + w 1 x 1 + w 2 x 2 + ⋯ + w n x n \sigma=b+w_1x_1+w_2x_2+\cdots+w_nx_n σ=b+w1x1+w2x2++wnxn  即,S 型函数可将 σ \sigma σ 转换为介于 0 到 1 之间的概率。
  • 对数损失函数【Logarithmic Loss Function】
  • 分类模型【Classification model】:一种机器学习模型,用于区分两种或多种离散类别。例如,某个自然语言处理分类模型可以确定输入的句子是法语、西班牙语还是意大利语。请与回归模型进行比较。
  • 分类阈值【Classification threshold】:也称为判定阈值。一种标量值条件,应用于模型预测的得分,旨在将正类别负类别区分开。将逻辑回归结果映射到二元分类时使用。以某个逻辑回归模型为例,该模型用于确定指定电子邮件是垃圾邮件的概率。如果分类阈值为 0.9,那么逻辑回归值高于 0.9 的电子邮件将被归类为“垃圾邮件”,低于 0.9 的则被归类为“非垃圾邮件”。
  • 混淆矩阵【Confusion matrix】:一种 N×N 表格,用于总结分类模型的预测效果;即标签和模型预测的分类之间的关联。在混淆矩阵中,一个轴表示模型预测的标签,另一个轴表示实际标签。N 表示类别个数。在二元分类问题中,N=2。详情点击此处
  • 准确率【Accuracy】:分类模型的正确预测所占的比例。常规定义如下: 准确率 = 正确的预测数 样本总数 \text {准确率}=\frac {\text {正确的预测数}}{\text {样本总数}}
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值