pandas去掉html标签,pandas 过滤列(选择“有趣的”,删除不需要的内容,使用RegEx等)...

示例

生成样本DF

In [39]: df = pd.DataFrame(np.random.randint(0, 10, size=(5, 6)), columns=['a10','a20','a25','b','c','d'])

In [40]: df

Out[40]:

a10  a20  a25  b  c  d

0    2    3    7  5  4  7

1    3    1    5  7  2  6

2    7    4    9  0  8  7

3    5    8    8  9  6  8

4    8    1    0  4  4  9

显示包含字母“ a”的列

In [41]: df.filter(like='a')

Out[41]:

a10  a20  a25

0    2    3    7

1    3    1    5

2    7    4    9

3    5    8    8

4    8    1    0

使用RegEx过滤器显示列(b|c|d)-b或c或d:

In [42]: df.filter(regex='(b|c|d)')

Out[42]:

b  c  d

0  5  4  7

1  7  2  6

2  0  8  7

3  9  6  8

4  4  4  9

显示除以开头的列以外的所有列a(换句话说,删除/删除所有满足给定RegEx的列)

In [43]: df.ix[:, ~df.columns.str.contains('^a')]

Out[43]:

b  c  d

0  5  4  7

1  7  2  6

2  0  8  7

3  9  6  8

4  4  4  9

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值