Pandas库常用命令汇总——自用备查(挖坑,持续更新)

目录

引入库(数据分析常用三件套)

读取文件(excel、csv)

查看数据集

填充缺失值

查看,截取(切片)数据集

分组:groupby命令

聚合:agg命令

聚合:transform命令

聚合:apply命令

删除操作

导出文件


引入库(数据分析常用三件套)

import pandas as pd

import numpy as np

from matplotlib import pyplot as plt

%matplotlib inline

读取文件(excel、csv)

//读取excel文件

data = pd.read_excel("C:\del\desktop\111.xlsx",sheet_name="Sheet1")

//读取csv文件

data = pd.read_csv("Data_Path")

Tips:注意,由于python语言会将“\”当作转义字符,因此在填写文件地址时,一定要将“\”字符转换成“/”,特别是当出现下面这个报错的时候,那就是地址写错了!!!

SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escapec

查看数据集

df.head(10)  //查看前10行的数据
df.shape    //显示数据集的大小,如行和列的总数
df.info()   //查看每个变量的数据类型,返回变量、数据类型、内存使用量和关于每个变量的缺失值情况

也可以使用isnull方法检查 "Age" 和 "Cabin" 两列中缺失的数值

 

填充缺失值

很多时候我们需要将缺失值替换成有效的数值。
虽然可以通过 isnull() 方法建立掩码来填充缺失值,但是 Pandas 为此专门提供了一个fillna() 方法,它将返回填充了缺失值后的数组副本。

用一个单独的值来填充缺失值:

data.fillna(0)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值