python dataframe切片_Pandas DataFrame切片

先来创建一个pandas数据框:

testdf3 = pd.DataFrame(

{"A": np.arange(5),

"B": pd.Timestamp("20171129"),

"C": pd.Series(1, index =np.arange(5), dtype = "float32"),

"D": np.array([3]*5),

"E": pd.Categorical(["test", "train", "test", "train","test"]),

"F": 'foo'})示例表只取行的时候,不对列进行筛选

1.1 第一种情况是只取某一行。用df.iloc[行号],也可以直接df.iloc[[行号]]。前者是个series;后者是个df;但不能直接df[行号],df[]里如果要直接引用,只能是列名。

testdf3.iloc[0] # pandas series

testdf3.iloc[[0]] # dataframe

1.2 第二种情况是取连续的某几行。用df.iloc[行号:行号],也可以偷懒用df[行号:行号]。得到的都是df.

testdf3[2:3] # data frame

testdf3.iloc[2:3] # data frame

1.3 第三种情况是不连续的多行,则是df.iloc[[行号,行号]],注意是两个方括号。得到的是df。

testdf3.iloc[[1,3]]

一定要注意,方括号里的方括号,不能用冒号。用冒号的时候是连续的索引,这个时候可以直接在第一层方括号里做。

只取行的时候,上面三种情况都相当于省略了后面的',:'

2. 只取列的时候,不对行做筛选

2.1 只取一列,可以偷懒不用.loc

testdf3['A'] # 单独一列是个series

testdf3.loc[:,'A'] # 同上,但比较复杂,一般不用

testdf3.iloc[:,0] # 同上,可以在不知道列名的时候用

testdf3[['A']] #单独一列是个df

testdf3.loc[:,['A']] # 同上,但比较复杂,一般不用

testdf3.iloc[:,[0]] # 同上,可以在不知道列名的时候用

2.2 取指定的某几列,可以偷懒不用.loc

testdf3[['A','C']] # DF, 指定某几列,直接用列名

testdf3.loc[:,['A','C']] # 同上,但比较复杂,一般不用

testdf3.iloc[:,[0,2]] # 同上,可以在不知道列名的时候用

2.3 取指定的连续几列,不能偷懒了,必须用.loc

testdf3.loc[:,'A':'D'] #指定连续列,用列名

testdf3.iloc[:,0:4] # 指定连续列,用数字

3. 取行的同时,也取列。一个原则是行偷懒的方式和列偷懒的方式都不能用了。必须用.loc或.iloc。

第一种情况是列索引用数字表示, df.iloc[行索引表达,列索引表达],规则跟上面行索引一模一样。

testdf3.iloc[[1,3],[0]] # dataframe

testdf3.iloc[[1,3],0] # series

testdf3.iloc[[1,3],1:3] # dataframe

testdf3.iloc[[1,3],[1,3]]

第二种情况是列索引直接引列名(行索引不存在这个问题,因为pandas没有所谓'行名'),就要用df.loc[行索引,列名索引。

testdf3.loc[1,["A","D"]] # series 对应上述1.1

testdf3.loc[[1],["A","D"]] # df 对应上述1.1

testdf3.loc[[1,3],"A":"D"] # df 对应上述1.2

testdf3.loc[[1,3],["A","D"]] # df 对应上述1.3

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值