python dataframe切片_Pandas DataFrame切片

最新推荐文章于 2024-07-03 03:50:11 发布

weixin_39593061

最新推荐文章于 2024-07-03 03:50:11 发布

阅读量200

点赞数

文章标签： python dataframe切片

先来创建一个pandas数据框：

testdf3 = pd.DataFrame(

{"A": np.arange(5),

"B": pd.Timestamp("20171129"),

"C": pd.Series(1, index =np.arange(5), dtype = "float32"),

"D": np.array([3]*5),

"E": pd.Categorical(["test", "train", "test", "train","test"]),

"F": 'foo'})示例表只取行的时候，不对列进行筛选

1.1 第一种情况是只取某一行。用df.iloc[行号]，也可以直接df.iloc[[行号]]。前者是个series；后者是个df；但不能直接df[行号],df[]里如果要直接引用，只能是列名。

testdf3.iloc[0] # pandas series

testdf3.iloc[[0]] # dataframe

1.2 第二种情况是取连续的某几行。用df.iloc[行号：行号]，也可以偷懒用df[行号：行号]。得到的都是df.

testdf3[2:3] # data frame

testdf3.iloc[2:3] # data frame

1.3 第三种情况是不连续的多行，则是df.iloc[[行号，行号]],注意是两个方括号。得到的是df。

testdf3.iloc[[1,3]]

一定要注意，方括号里的方括号，不能用冒号。用冒号的时候是连续的索引，这个时候可以直接在第一层方括号里做。

只取行的时候，上面三种情况都相当于省略了后面的',:'

2. 只取列的时候，不对行做筛选

2.1 只取一列，可以偷懒不用.loc

testdf3['A'] # 单独一列是个series

testdf3.loc[:,'A'] # 同上，但比较复杂，一般不用

testdf3.iloc[:,0] # 同上，可以在不知道列名的时候用

testdf3[['A']] #单独一列是个df

testdf3.loc[:,['A']] # 同上，但比较复杂，一般不用

testdf3.iloc[:,[0]] # 同上，可以在不知道列名的时候用

2.2 取指定的某几列，可以偷懒不用.loc

testdf3[['A','C']] # DF, 指定某几列，直接用列名

testdf3.loc[:,['A','C']] # 同上，但比较复杂，一般不用

testdf3.iloc[:,[0,2]] # 同上，可以在不知道列名的时候用

2.3 取指定的连续几列，不能偷懒了，必须用.loc

testdf3.loc[:,'A':'D'] #指定连续列，用列名

testdf3.iloc[:,0:4] # 指定连续列，用数字

3. 取行的同时，也取列。一个原则是行偷懒的方式和列偷懒的方式都不能用了。必须用.loc或.iloc。

第一种情况是列索引用数字表示, df.iloc[行索引表达，列索引表达]，规则跟上面行索引一模一样。

testdf3.iloc[[1,3],[0]] # dataframe

testdf3.iloc[[1,3],0] # series

testdf3.iloc[[1,3],1:3] # dataframe

testdf3.iloc[[1,3],[1,3]]

第二种情况是列索引直接引列名（行索引不存在这个问题，因为pandas没有所谓'行名'），就要用df.loc[行索引，列名索引。

testdf3.loc[1,["A","D"]] # series 对应上述1.1

testdf3.loc[[1],["A","D"]] # df 对应上述1.1

testdf3.loc[[1,3],"A":"D"] # df 对应上述1.2

testdf3.loc[[1,3],["A","D"]] # df 对应上述1.3

weixin_39593061

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python dataframe切片_Pandas DataFrame切片

先来创建一个pandas数据框：testdf3 = pd.DataFrame({"A": np.arange(5),"B": pd.Timestamp("20171129"),"C": pd.Series(1, index =np.arange(5), dtype = "float32"),"D": np.array([3]*5),"E": pd.Categorical(["test", "tra...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。