Pandas常用函数

最新推荐文章于 2024-07-04 16:47:20 发布

Cryueh

最新推荐文章于 2024-07-04 16:47:20 发布

阅读量559

点赞数

分类专栏： Pandsa ETL 文章标签： python pandas

本文链接：https://blog.csdn.net/icer2/article/details/110128902

版权

本文详细介绍了Pandas库中用于导入数据、选择数据、操作数据和分组聚合的常用函数，包括pd.read_csv、drop_duplicates、fillna、astype、groupby等，帮助读者掌握Pandas在数据处理中的核心功能。

摘要由CSDN通过智能技术生成

Pandas常用函数

一、导入数据

导入Pandas包和打印版本号

import pandas as pd
pd.__version__

从列表创建

s = pd.Series([0,1,2,3,4])
s

从字典创建

s = pd.Series({
   'a':1,'b':2,'c':3,'d':4,'e':5})
s

从Numpy数组创建DataFrame

import numpy as np
s = pd.DataFrame(np.random.randn(3,4), index=pd.date_range('today',periods=3), columns = ['A','B','C','D'])
s

传入索引

s = pd.Series(['a','b','c','d'],index = [1,2,3,4])
s

指定行列索引

s = pd.DataFrame([['a','A'],['b','B'],['c','C'],['d','D']],columns = ["列一","列二"],index =["一","二","三","四"])
s

pd.read_csv导入文件数据

df = pd.read_excel(r"excel.xlsx",sheet_name = "Sheet1") #指定sheet
df = pd.read_excel(r"excel.xlsx",sheet_name = 0) #指定sheet顺序
df = pd.read_excel(r"excel.xlsx",index_col = 0) #指定行索引
df = pd.read_excel(r"excel.xlsx",header = 0) #指定列索引
df = pd.read_excel(r"excel.xlsx",usecols = [0.3]) #指定指定列
df = pd.read_csv(r"csv.csv",sep = ' ') #空格为间隔符
df = pd.read_csv(r"csv.csv",sep = ' ',nrows = 30) #指定读取行数
df = pd.read_csv(r"csv.csv",sep = ' ',encoding = 'gbk') #指定gbk编码
df = pd.read_table(r"txt.txy",sep = " ")	#导入txt，空格为间隔符