pandas的使用

这篇博客展示了如何使用Python的Pandas库进行数据帧的创建、修改、筛选和分析。内容包括创建DataFrame,添加列,追加行,替换值,选择特定行,条件筛选,删除列和行,处理重复数据,计算分组平均值,应用函数以及统计唯一值出现的次数。通过这些基本操作,可以有效地管理和处理数据。
摘要由CSDN通过智能技术生成

记录一些pandas的常用功能,见代码和注释,以备日后查阅。

import pandas as pd
#创建数据帧
dataframe=pd.DataFrame()
#增加列
dataframe['Name']=['Jacky Jackson','Steven Stevenson']
dataframe['Age']=[38,25]
dataframe['Driver']=[True,False]
#查看数据帧
dataframe

#在底部添加新的行
#创建一行
new_person=pd.Series(['Molly Mooney',40,True],index=['Name','Age','Driver'])
#附加一行
dataframe=dataframe.append(new_person,ignore_index=True)
dataframe

dataframe['Driver'].replace(True,1,inplace=True)#值替换
dataframe['Driver'].replace(False,0,inplace=True)
dataframe

dataframe.iloc[0] #选择第一行

dataframe[dataframe['Driver']==1].head(1)#条件筛选

dataframe['Driver'].replace([1.0,0.0],[True,False],inplace=True)#替换
dataframe

dataframe.drop('Age',axis=1)#删除列

dataframe.drop([0,1],axis=0)#删除行

dataframe.drop_duplicates(subset=['Driver'])#删除重复行,默认保留先出现的行

dataframe.groupby('Driver').mean()#根据Driver分组,并计算每组平均值

dataframe

def uppercase(x):  #对一列的所有元素应用某个函数
    return x.upper()
dataframe['Name'].apply(uppercase)

dataframe.groupby('Driver').apply(lambda x:x.count())#对所有分组应用一个函数

dataframe['Age'].value_counts()#显示所有的唯一值以及出现的次数

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值