Python中Pandas常用函数及案例详解


7. 使用value\_counts()查看值的分布



查看某一列中不同值的计数

print(df[‘A’].value_counts())


8. 使用unique()查看唯一值



查看某一列中唯一的出现的值

print(df[‘A’].unique())


9. 使用duplicated()检查重复值



检查DataFrame中的重复行

print(df.duplicated())

检查DataFrame中没有重复行

print(~df.duplicated())


10. 使用sort\_values()对数据进行排序



对某一列进行升序排序

print(df.sort_values(by=‘A’))

对某一列进行降序排序

print(df.sort_values(by=‘A’, ascending=False))


通过这些方法,可以快速地了解和检查DataFrame中的数据,帮助我们在进行数据处理之前对数据有一个基本的认识。


**第四、数据选取**


在Pandas中,数据选取是通过索引来实现对DataFrame或Series中数据的选择。索引可以是标签(label-based)或整数(integer-based)。以下是一些常用的数据选取方法:


1. 使用标签索引(Label-based Indexing)



import pandas as pd

创建一个DataFrame

df = pd.DataFrame({
‘A’: [1, 2, 3, 4, 5],
‘B’: [6, 7, 8, 9, 10],
‘C’: [11, 12, 13, 14, 15]
})

使用列标签名称选取整列数据

print(df[‘A’])

使用列标签名称和行标签选取单个值

print(df.loc[0, ‘A’])

使用行标签列表和列标签名称选取多个值

print(df.loc[[0, 2], [‘A’, ‘C’]])

使用布尔索引选取满足条件的数据

print(df[df[‘A’] > 2])


2. 使用整数索引(Integer-based Indexing)



使用整数索引选取单个值

print(df.iloc[0])

使用整数索引选取单个列

print(df.iloc[:, 0])

使用整数索引和布尔索引选取满足条件的数据

print(df.iloc[df[‘A’] > 2, :])

使用整数索引和切片选取数据

print(df.iloc[0:3, 1:3])


3. 使用行和列的混合格式索引



使用行列混合格式索引选取数据

print(df.loc[0:2, ‘A’:‘C’])

使用行列混合格式索引和布尔索引选取数据

print(df.loc[df[‘A’] > 2, ‘A’:‘C’])


4. 使用at()和iat()选取单个值



使用at()根据行标签和列标签选取单个值

print(df.at[0, ‘A’])

使用iat()根据整数索引选取单个值

print(df.iat[0, 0])


5. 使用query()方法查询数据



使用query()方法查询满足条件的数据

print(df.query(‘A > 2’))


6. 使用xs()方法跨越多级索引选取数据



使用xs()方法选取某列或某行

print(df.xs(2, level=‘A’)) # 选取

  • 11
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值