python pandas 基本【1】

数据类型

pandas中最基本的数据类型是DataFrame,二维的表格
其中每一列的数据类型是Series,列表

import pandas as pd
df = pd.DataFrame({'name':['Kang','Xi','Pei'],'age':[18,22,23]})
#可以将字典类型的数据作为参数创建DataFrame

sr = df['name']
#通过每列的label来得到每列的数据series

sr1 = pd.Series([18,22,23],name='age')
#创建series,name即设定标签

显示相关信息

#有许多的方法
df.head()#默认显示前四行数据
df.head(15)#显示前15行数据
df.tail(3)#显示倒数3行数据
df['age'].max()
df['age'].describe() #返回算数信息,数量,均值等
df.dtypes#返回每一列的数据类型
df.info()#返回程序数据结构信息
df.shape()#返回维数

读取、存储

#可以读取非常多格式的文件
pd.read_excel('file\data.xslx',sheet_name='person_info')
pd.to_excel('file\data1.xslx',sheet_name='personInfoNew',index=False)  #store as a file.xslx
#index指是否存入0123这样的索引列表

切片、判断

df1 = df[['age','name']]
df2 = df[df['age']>20]
#方括号里面的表达是条件表达语句,是bool值类型的series类型
df['age'].isin([18,65])#获取年龄在18到65之间的项目的条件语句
df['name'].notna()  #返回name为非null的项
df.loc[df['age']>35,'name']  #loc为组合操作,
df.iloc[9:25,2:5] #第9-24行和第2-4列的数据

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值