交叉验证的得分怎么分析_「译」 对比归一化和标准化——量化分析

本文通过实验探讨归一化和标准化在特征压缩中的应用,以及它们如何影响不同分类器的性能。实验涉及多种分类器和数据集,包括Sonar数据集,结果显示,特征压缩方法的选择可能显著影响模型准确率,而且StandardScaler并不总是最佳选择。文章还介绍了其他压缩方法和PCA的影响,并提出压缩方法应被视为重要超参数。
摘要由CSDN通过智能技术生成

[译] 对比归一化和标准化 —— 量化分析

  • 原文地址:Normalization vs Standardization — Quantitative analysis
  • 原文作者:Shay Geller
  • 译文出自:翻译计划
  • 本文永久链接:github.com/xitu/gold-m…
  • 译者:ccJia
  • 校对者:Fengziyin1234, portandbridge

停止使用 Sklearn 提供的 StandardScaler 作为你的特征压缩方法甚至可以让你训练好的模型有 7% 的准确率提升。

5693790a462aa3e89271dc1636247601.png

每一个 ML 的从业者都知道特征的压缩是一个重要的议题(更多)

两个最热议的方法就是归一化和标准化。归一化通常来说是将数值压缩到 [0,1] 范围内。标准化指的是重新调整数据,使数据到均值为 0,标准差为 1。

本篇博客希望通过一些实验回答以下的问题:

  1. 我们总是需要压缩特征吗?
  2. 是否有一个最好的压缩方法?
  3. 不同的压缩技术是如何影响不同的分类器?
  4. 压缩方法是否也应该被考虑为一个重要的超参?

我将分析多个不同压缩方法作用于不同特征的实验结果。

内容总览

    • 0
      点赞
    • 0
      收藏
      觉得还不错? 一键收藏
    • 0
      评论
    评论
    添加红包

    请填写红包祝福语或标题

    红包个数最小为10个

    红包金额最低5元

    当前余额3.43前往充值 >
    需支付:10.00
    成就一亿技术人!
    领取后你会自动成为博主和红包主的粉丝 规则
    hope_wisdom
    发出的红包
    实付
    使用余额支付
    点击重新获取
    扫码支付
    钱包余额 0

    抵扣说明:

    1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
    2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

    余额充值