Python数据分析——数据变换和数据规约(主成分分析)

数据变换

简单变换

1、数据变换的目的是将数据转化为更方便分析的数据

2、简单变换通常使用函数变换的方式进行,常见的函数变换包括:开方,平方,对数等

数据规范化

1、离差标准化--消除量纲(单位)影响以及变异大小因素的影响(最小最大标准化)

    x1 = (x-min) / (max-min)  # 将大数据转为小数据

2、标准差标准化--消除单位影响以及变量自身变异影响。

    x1 = (x-平均数) / 标准差  # 一半数据大于0,一半数据小于0

3、小数定标规范化--消除单位影响(除以10的倍数)

    x1 = x/10**(k)

    k = log10(x的绝对值的最大值)

离散化

1、等宽离散化,将属性的值分为相同宽度的区间

pd.cut() # 第一个参数是数据  第二个参数是区间  第三个参数是标签,每一份代表什么

2、等频率离散化,将相同数量的数据放入每个区间

3、一维聚类离散化,将连续的值通过聚类算法聚类,

属性构造

通过原属性得到新属性

数据规约

属性规约与数值规约概述

规约的核心就是精简

1、属性规约,

2、数值规约

主成分分析(属性规约)

PCA算法,主要用于数据的降维

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

General_单刀

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值