Python中Pandas库 Dataframe的基本操作

最新推荐文章于 2024-08-14 18:22:26 发布

kissazhu

最新推荐文章于 2024-08-14 18:22:26 发布

阅读量808

点赞数

本文链接：https://blog.csdn.net/kissazhu/article/details/78114196

版权

本文详细介绍了Python中Pandas库的Dataframe数据结构，包括创建、读取、筛选、排序、聚合及数据清洗等基本操作，是Python数据处理初学者的必备知识。

摘要由CSDN通过智能技术生成

Python中Pandas库 Dataframe的基本操作：

import numpy as np
import pandas as pd

# 创建一个dataframe
df = pd.DataFrame(np.arange(9).reshape(3,3),index=list('abc'),columns=['c1','c2','c3'])

df['c1'] , df.c1 # 选择表格中的c1列，返回的是Series类型
df[['c1']] # 选择表格中的c1列，返回的是dataframe类型

df[['c1','c2']] # 选择c1, c2列，返回dataframe，注意是[['列名1','列名2']]

df[0:2] # 返回第1行到第2行的所有行，前闭后开
df[1:2] # 返回第1行，如果用df[1]会报错，返回的是dataframe

df.iloc[1:2] #返回第1行，dataframe类型
df.iloc[-1] #返回最后1行，Series类型

df.head()  # 返回df的前几行数据，默认为前五行，需要前十行则df.head(10)
df.tail()  # 返回df的后几行数据，默认为后五行，需要后十行则df.tail(10)

df.index # 索引
df.columns # 列名
df.values # 以nparray返回df内的数据
df.describe() # 描述性统计
df.T # 转置


# 输出到Excel
writer1 = pd.ExcelWriter('quote2.xlsx')
feeder1.dataframe.to_excel(writer1, sheet_name =