数据标准化

意义:

     1. 数据的量纲不同,数量级别差别很大

     2. 平衡各特征的贡献:距离、协方差,是因为要使各特征贡献一致所以使用标准化

     3. 加快梯度下降求最优解的速度

方法:

   1.min-max标准化:

               比较适用在数值比较集中的情况

               不涉及距离度量、协方差计算、数据不符合正太分布的时候

    2. z-score标准化:

              在分类、聚类,算法中需要使用距离来度量相似性的时候

              使用PCA(协方差分析)技术进行降维的时候

   3. 非线性归一化:

          在数据分化比较大的场景,有些数值很大

           log、指数,正切

适用场景:

       1.分类:KNN

       2.计算距离:聚类,K-means

       3. 梯度优化来获得最优解:   支持向量机(SVM),

                                                    逻辑回归(logistic regression)

                                                    感知器(perception)

                                                    神经网络(neural networks 

        4.协方差:主成分分析(principal component analysis)

                          线性判别回归(linear discriminant analysis)

                         核主成分分析kernel principal component analysis

          

   

         

转载于:https://www.cnblogs.com/hapyygril/p/9963613.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值