numpy pandas基础知识笔记7.pandas选择数据

选择指定某一列的数据

例:

import pandas as pd
import numpy as np
dates = pd.date_range('20210101',periods=6)
df = pd.DataFrame(np.random.randn(6,4),index = dates,columns = ['a','b','c','d'])
print(df['a'])

输出:

2021-01-01   -0.415802
2021-01-02    0.490348
2021-01-03   -1.571324
2021-01-04    0.039819
2021-01-05    0.529255
2021-01-06   -2.143084
Freq: D, Name: a, dtype: float64

 

也可使用df.a

 

可以使用切片来进行一个批量选择数据

例:

print(df[0:3],df['20210101':'20210103'])

输出:               

   a         b         c         d
2021-01-01 -0.095138 -0.068294  1.373945 -0.034439
2021-01-02 -0.239562 -1.308063  1.040556  0.192526
2021-01-03 -0.128735 -0.325076  1.055459 -0.272415                    a         b         c         d
2021-01-01 -0.095138 -0.068294  1.373945 -0.034439
2021-01-02 -0.239562 -1.308063  1.040556  0.192526
2021-01-03 -0.128735 -0.325076  1.055459 -0.272415

 

 

使用loc来根据标签具体选中数据

例:

print(df.loc['20210101'])

输出

a   -0.387100
b    0.975240
c   -0.316284
d    0.497838
Name: 2021-01-01 00:00:00, dtype: float64

 

例:print(df.loc[:,['a','b']])

输出

                   a         b
2021-01-01  0.583856  0.106514
2021-01-02  1.605995 -1.851906
2021-01-03  0.293042  0.224254
2021-01-04  1.490479  0.529301
2021-01-05  0.672468  0.412965
2021-01-06  0.333422 -0.314745

 

iloc根据位置来选择

例:

print(df.iloc[3:5,1:3])

 

输出:

                   b         c
2021-01-04  0.902933 -0.044430
2021-01-05 -0.009414  1.414929

 

通过条件来选取

例:

print(df[df.a > 1])

输出:

                   a         b         c         d
2021-01-06  1.146327 -1.005401  0.317588 -2.041618

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值