Pandas的22种核心操作

最新推荐文章于 2022-09-29 17:35:06 发布

AG9GgG

最新推荐文章于 2022-09-29 17:35:06 发布

阅读量339

点赞数

分类专栏：笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/AG9GgG/article/details/100738833

版权

笔记专栏收录该内容

30 篇文章 0 订阅

订阅专栏

基本数据集操作

读取CSV格式的数据集

pd.DataFrame.from_csv("csv_file")
pd.read_csv("csv_file")

读取excel数据集

pd.read_excel("excel_file")

将DataFrame直接写入CSV文件

df.to_csv("data.csv", sep=",", index=False)

基本的数据集特征信息

df.info()

基本的数据集统计信息

df.describe()

将 DataFrame 打印成表格的样子

print(tabulate(print_table, headers=headers))

列出所有列的名字

df.colums

基本数据处理

删除缺失数据

df.fropna(axis=0, how='any')

替换缺失数据

df.replace(to_replace=None, value=None)

检查空值 NaN

pd.isnull(object)

删除特征

df.drop('feature_variable_name', axis=1)
axis=1表示列
axis=0表示行

将目标类型转换为浮点型

pd.to_numeric(df["feature_name"], error='coerce')

将DataFrame转换为NumPy数组

df.as_matrix()

取 DataFrame 的前面「n」行

df.head(n)

通过特征名取数据

df.loc[feature_name]

DataFrame操作

对 DataFrame 使用函数]

def multiply(x):
	return x*2
df["height"].apply(multiply)

重命名行

df.rename(columns = {df.columns[2]:'size'}, inplace=True)

子DataFrame

new_df = df[["name", "size"]]

总结数据

df.sum()
df.min()
df.max()
df.idxmin()
df.idxmax()
df.mean()
df.median()
df.corr()
df["size"].median()

排序

df.sort_values(ascending=False)

布尔型索引

df[df["size"] == 5]

按行、列取值

df.loc([0], ['size'])

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Pandas的22种核心操作

基本数据集操作读取CSV格式的数据集pd.DataFrame.from_csv("csv_file")pd.read_csv("csv_file")读取excel数据集pd.read_excel("excel_file")将DataFrame直接写入CSV文件df.to_csv("data.csv", sep=",", index=False)基本的数据集特征信...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。