数据分析处理库Pandas常用语句

本文主要参考天池同名直播课程。网址为:https://tianchi.aliyun.com/forum/videoStream.html?spm=5176.11510288.4851101.12.31f62042EnWwrg&postsId=5315#postsId=5315

目录

1 数据读取与导出

1.1 数据读取

1.2 数据构造

1.3 数据导出

2 数据查看

3 数据选取

4 数据整理

4.1 空值处理

4.2 替换

4.3 重命名

4.4 索引重置


1 数据读取与导出

1.1 数据读取

上图中,“csv”是文件的后缀,可更换,如:

“sep”用于指定数据分隔符,默认为逗号分隔;

“header=none”表示文件没有头,可以通过df.columns进行指定。

1.2 数据构造

自行构造数据有三种方法,如下三行:

第一种:list构造,如上图中二行三列的数据,后给每一列命名f1, f2, f3。输出结果为:

第二种:按列构造(字典dict型),user_id和item_id分别为一列。输出结果为:

第三种:按行构造,每一列一个字典。输出结果为:

1.3 数据导出

上图中,“csv”是文件的后缀,可更换;“index”为索引;“sep”用于指定数据分隔符,默认为逗号分隔。


2 数据查看

df.describe: 得到数据的统计结果,如下:

df[].value_counts: 查看某一列有几种取值,分别多少个,结果如下:
(四种取值)
df[].unique: 查看某一列有多少不同取值,结果如下:


3 数据选取

以下四种:

第一种:输出结果如下:

也可单独选取一列,如:

第二种:也可指定看多少行多少列,如下:

看第0到2行(0已省略),第0列(即user_id那一列)

第三种:选取指定行and列

第四种:对数据进行采样,采样频率为0.5

除了指定采样频率意外,还可以:df.sample(n=):采样时指定采样个数


4 数据整理

4.1 空值处理

对空值进行替换:

 

4.2 替换

4.3 重命名

 

4.4 索引重置

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值