pythonpandas读取多列数据为一列_python – 在pandas数据框中选择多个列

列名称(字符串)无法以您尝试的方式进行切片.

在这里你有几个选择.如果您从上下文中了解要切出哪些变量,则只需通过将列表传递给__getitem__语法([]的)来返回仅包含这些列的视图.

df1 = df[['a','b']]

或者,如果以数字方式而不是按名称对它们进行索引很重要(假设您的代码应该在不知道前两列的名称的情况下自动执行此操作),那么您可以这样做:

df1 = df.iloc[:,0:2] # Remember that Python does not slice inclusive of the ending index.

此外,您应该熟悉Pandas对象视图与该对象副本的概念.上述方法中的第一个将在所需子对象(所需切片)的存储器中返回新副本.

但是,有时候,Pandas中的索引约定不会执行此操作,而是为您提供一个新变量,它只引用与原始对象中的子对象或切片相同的内存块.这将通过第二种索引方式发生,因此您可以使用copy()函数对其进行修改以获得常规副本.发生这种情况时,更改您认为切片对象的内容有时会改变原始对象.总是很高兴看到这个.

df1 = df.iloc[0,0:2].copy() # To avoid the case where changing df1 also changes df

要使用iloc,您需要知道列位置(或索引).由于列位置可能会发生变化,而不是硬编码索引,您可以使用iloc和dataframe对象的columns方法的get_loc函数来获取列索引.

{df.columns.get_loc(c):c for idx, c in enumerate(df.columns)}

现在,您可以使用此字典通过名称和使用iloc访问列.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值