Pandas是一个非常好用的工具,可以用来处理各种格式的数据,本文主要介绍Pandas中的四种选择数据的方法:
简单的筛选类型有四种,按照标签索引、元素位置以及综合筛选,具体如下:
#select by label : loc
#select by position : iloc
#mixed selection : ix
#使用判断
建立一个DataFrame表,程序如下:
<<<
import pandas as pd
import numpy as np
dates = pd.date_range(‘20160101’, periods=6)
df = pd.DataFrame(np.random.randn(6,4), index=dates, columns=[‘A’, ‘B’, ‘C’, ‘D’])
print(df[‘A’])
print(df.A)
输出如下:
A B C D
2016-01-01 0 1 2 3
2016-01-02 4 5 6 7
2016-01-03 8 9 10 11
2016-01-04 12 13 14 15
2016-01-05 16 17 18 19
2016-01-06 20 21 22 23
(1)简单的筛选
选择名称为’A’的这一列,有两种输出方式;
(2)选择跨越多行或多列:
<<< print(df[0:3])
输出:
“”"
A