数据分析与挖掘笔记(七)------数据预处理之python主要数据预处理函数

函数名

所属库

功能

使用格式

实例

interpolate

Scipy

一维、高维数据插值。

interpolate是Scipy的一个子库,包含了大量的插值函数,如拉格朗日插值、样条插值、高维插值等。使用前需要用 from scipy.interpolate import * 引入相应的插值函数

 

f = scipy.interpolate.lagrange(x,y)。

这里展示了一维数据的拉格朗日插值的命令,其中x,y为对应的自变量和因变量数据。插值完成后,可以通过f(a)计算新的插值结果。类似的还有样条插值、多维数据插值等。

 

unique

Pandas/Numpy

去除数据中的重复元素,得到单值元素列表。它既是Numpy库的一个函数(np.unique()),也是Series对象的一个方法

[]np.unique(D),D是一维数据,也可以是list、array、Serise;

[]D.unique(), D是Pandas的Serise对象。

isnull

Pandas

判断是否为空值/非空值

D.isnull()/D.notnull()。这里的D要求是Series对象,返回一个布尔Series。可以通过找出D中的空值/非空值。

 

notnull

Pandas

 

PCA

Scikit-Learn

对指标变量矩阵进行主成分分析。使用前需要用from sklearn.decomposition import PCA引入该函数

random

Numpy

生成随机矩阵

random是Numpy的一个子库,可以用该库下的各种函数生成服从特定分布的随机矩阵,抽样时可以使用。

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值