python选取特定列——pandas的iloc和loc以及icol使用(列切片及行切片)

假设df是一个dataframe,列名为A B C D
具体如下:
A    B    C    D

0    ss   小红  8
1    aa   小明  d
4    f         f
6    ak   小紫  7
dataframe里的属性不是指定的,空值默认为NA。
一、选取标签为A和C的列,并且选完的对象类型还是dataframe
df = df.loc[:, ['A', 'C']]
df = df.iloc[:, [0, 2]]
二、选取标签为C并且只取前两行,并且选完的对象类型还是dataframe
df = df.loc[0:2, ['A', 'C']]
df = df.iloc[0:2, [0, 2]] 
聪明的朋友已经看出iloc和loc的不同了:loc是根据dataframe的具体标签选取列,而iloc是根据标签所在的位置,从0开始计数。",
"前面的":"表示选取整列,第二个示例中的的0:2表示选取第0行到第二行,这里的0:2相当于[0,2)前闭后开,2是不在范围之内的。

需要注意的是,如果是
df = df.loc[0:2, ['A', 'C']]
或者
df = df.loc[0:2, ['A', 'C']]
,切片之后类型依旧是dataframe,不能直接进行加减乘除等操作的。
比如dataframe的一列是数学成绩(shuxue),另一列为语文成绩(yuwen),现在需要求两门课程的总和,可以使用
df['shuxue'] + df['yuwen'] # 选取完之后类型为series
来获得总分,而不能使用
df.iloc[:,[2]]+df.iloc[:,[1]]
df.iloc[:,['shuxue']]+df.iloc[:,['yuwen']]
,这会产生错误结果。

还有一种方式是使用df.icol(i)来选取列,选取完的也不是dataframe而是series,i为该列所在的位置,从0开始计数。

如果你想要选取某一行的数据,可以使用df.loc[[i]]或者df.iloc[[i]]。
  • 32
    点赞
  • 128
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值