pandas基础

本文介绍了Pandas库在处理非数值型数据时的使用方法,包括Series和DataFrame的数据操作,如切片、索引及时间类型转换。通过示例展示了如何创建Series和DataFrame,以及如何进行数据选取、设置行索引。强调了loc和iloc的区别,loc通过显式索引取行,iloc则通过隐式索引进行操作。
摘要由CSDN通过智能技术生成

pandas可用于处理非数值型数据
常用类:
series——类似一维数组,可有各种类型 ,series算术运算会补空
values 数据可以是列表,np,字典
index 显示索引用来增强可读性
dataframe——表格形式

切片:
		df[index1:index2]
		df.iloc[:,col1:col3]				
索引:
		df[col]
		df.loc[index]
		df.iloc[index,col]
时间类型转换:
			pd.to_datetime(col)
将某列设为行索引
			df.set_index()
loc与iloc的区别:
			iloc:通过隐式索引取行,返回标题外的行
			loc:通过显示索引取行
import numpy as np
s=Series(data=np.random.randint(60,100,size=(10,)))
s.head() #显示前5行数据
s.tail()
s.unique()
s.isnull()

df=DataFrame(data=np.random.randint(60,100,size=(8,4)),columns=['a','b','c','d'])
df
df['a']  #取单列,根据索引
df[['a','c']] #取多列
df.iloc[[1,3,5],2]  #取出3行2列值

dic={
    'time':['2010-10-10','2011-11-20','2020-01-10'],
    'temp':[33,31,30]
}
df=DataFrame(data=dic)
df
df['time']=pd.to_datetime(df['time'])
df
df.set_index('time',inplace=True)
df
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值