Pandas库常用命令汇总——自用备查（挖坑，持续更新）

啊金曼

已于 2022-11-30 14:55:45 修改

阅读量563

点赞数

分类专栏：数据分析基础工作文章标签： python 数据挖掘

于 2022-06-17 16:21:53 首次发布

本文链接：https://blog.csdn.net/weixin_43726651/article/details/125335045

版权

import pandas as pd

import numpy as np

from matplotlib import pyplot as plt

%matplotlib inline

//读取excel文件

data = pd.read_excel("C:\del\desktop\111.xlsx",sheet_name="Sheet1")

//读取csv文件

data = pd.read_csv("Data_Path")

Tips：注意，由于python语言会将“\”当作转义字符，因此在填写文件地址时，一定要将“\”字符转换成“/”，特别是当出现下面这个报错的时候，那就是地址写错了！！！

SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escapec

df.head(10)  //查看前10行的数据
df.shape    //显示数据集的大小，如行和列的总数
df.info()   //查看每个变量的数据类型，返回变量、数据类型、内存使用量和关于每个变量的缺失值情况

也可以使用isnull方法检查 "Age" 和 "Cabin" 两列中缺失的数值

很多时候我们需要将缺失值替换成有效的数值。
虽然可以通过 isnull() 方法建立掩码来填充缺失值，但是 Pandas 为此专门提供了一个fillna() 方法，它将返回填充了缺失值后的数组副本。

用一个单独的值来填充缺失值：

data.fillna(0)

关注

专栏目录