Pandas常用函数

本文详细介绍了Pandas库中用于导入数据、选择数据、操作数据和分组聚合的常用函数,包括pd.read_csv、drop_duplicates、fillna、astype、groupby等,帮助读者掌握Pandas在数据处理中的核心功能。
摘要由CSDN通过智能技术生成

Pandas常用函数

一、导入数据

导入Pandas包和打印版本号
import pandas as pd
pd.__version__
从列表创建
s = pd.Series([0,1,2,3,4])
s
从字典创建
s = pd.Series({
   'a':1,'b':2,'c':3,'d':4,'e':5})
s
从Numpy数组创建DataFrame
import numpy as np
s = pd.DataFrame(np.random.randn(3,4), index=pd.date_range('today',periods=3), columns = ['A','B','C','D'])
s
传入索引
s = pd.Series(['a','b','c','d'],index = [1,2,3,4])
s
指定行列索引
s = pd.DataFrame([['a','A'],['b','B'],['c','C'],['d','D']],columns = ["列一","列二"],index =["一","二","三","四"])
s
pd.read_csv导入文件数据
df = pd.read_excel(r"excel.xlsx",sheet_name = "Sheet1") #指定sheet
df = pd.read_excel(r"excel.xlsx",sheet_name = 0) #指定sheet顺序
df = pd.read_excel(r"excel.xlsx",index_col = 0) #指定行索引
df = pd.read_excel(r"excel.xlsx",header = 0) #指定列索引
df = pd.read_excel(r"excel.xlsx",usecols = [0.3]) #指定指定列
df = pd.read_csv(r"csv.csv",sep = ' ') #空格为间隔符
df = pd.read_csv(r"csv.csv",sep = ' ',nrows = 30) #指定读取行数
df = pd.read_csv(r"csv.csv",sep = ' ',encoding = 'gbk') #指定gbk编码
df = pd.read_table(r"txt.txy",sep = " ")	#导入txt,空格为间隔符
head()查看前10行数据
df.head(10) #默认5行
info()查看数据类型、缺失值
df.info()
describe()查看数据分布
df.describe()
columns查看列名称
df.columns
index查看索引

                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Cryueh

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值