高偏差、高方差、低精确率与低召回率、混淆矩阵

本文是个人理解1.高偏差(high bias)与方差(high variance)    偏差,可以理解为样本与模型预测结果的差距,可以使用平方差计算    方差是样本y值与模型期望的差的平方和。    模型对实验数据欠拟合(underfitting) 是会出现搞偏差,而过拟合(overfitting)会造成高方差    解决方法:直接的方法是将实验数据一分为二:训练集和测试集
摘要由CSDN通过智能技术生成


本文是个人理解

1.高偏差(high bias)与方差(high variance)

    偏差,可以理解为样本与模型预测结果的差距,可以使用平方差计算

    方差是样本y值与模型期望的差的平方和。

    模型对实验数据欠拟合(underfitting) 是会出现搞偏差,而过拟合(overfitting)会造成高方差

    解决方法:直接的方法是将实验数据一分为二:训练集和测试集。模型在训练集和测试集上都达到高正确率才说明偏差和方差都可以接受

                       增加体征的数量可以降低偏差;减少特征数量可以降低方差


2. 精确率(precision)与召回率(recall)

      ,  '真正' 与 '真负'总和中'真正'的比例。

     , 即 '真正' 与'假负'总和中真正的比例


     以新闻推荐举例。

      精确率可以理解为,所有推荐了的新闻中该推荐的新闻的比例。 比如,推荐了10篇新闻,其中8篇是应该推荐的

      召回率可以理解为,所有应该推荐的新闻中实际推荐了的新闻的比例。比如应该推荐10篇感兴趣的新闻,只推荐了其中的8篇。

      要平衡精确率和召回率,可以调节区分正负类别的概率临界值。 为提高精确率,可以提高概率临界值,使得正类别的判断更加

       保守;为了提高召回率,可以降低概率临界值,以增加正类别的数量

       

3. 混淆矩阵

   

机器学习人工智能领域),混淆矩confusionmatrix)是可
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值