awk处理带有空格的字符串_Python 如何像 awk一样分割字符串?

本文探讨了Python中处理包含多个连续空格的字符串的方法,并与Shell的awk工具进行了对比。文中提供了两种有效的方法:一是直接使用split()方法(不带参数),适用于将连续空格视为单一分隔符;二是结合filter()函数使用,适用于各种分隔符。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

v2-c85b00677069972552f970538b6fa788_b.jpg


若你使用过 Shell 中的 awk 工具,会发现用它来分割字符串是非常方便的。特别是多个连续空格会被当做一个处理。
[root@localhost ~]# cat demo.txt
hello world
[root@localhost ~]#
[root@localhost ~]# awk '{print$1,$2}' demo.txt
hello world
可是转换到 Python 上面来呢?结果可能是这样的。
>>> msg='hello world'
>>> msg.split(' ')
['hello', '', '', '', 'world']
与我预想的结果不符,多个空格会被分割多次。
那有什么办法可以达到 awk 一样的效果呢?
有两种方法。第一种方法
不加参数,这种只适用于将多个空格当成一个空格处理,如果不是以空格为分隔符的场景,这种就不适用了。
>>> msg='hello world'
>>> msg.split()
['hello', 'world']第二种方法
使用 filter 来辅助,这种适用于所有的分隔符,下面以 - 为分隔符来举例。
>>> msg='hello----world'
>>> msg.split('-')
['hello', '', '', '', 'world']
>>>
>>> filter(None, msg.split('-'))
['hello', 'world']
是不是很神奇,filter 印象中第一个参数接收的是 函数,这里直接传 None 居然有奇效。
查看了注释,原来是这个函数会适配 None 的情况,当第一个参数是None的时候,返回第二个参数(可迭代对象)中非空的值,非常方便。

v2-b8f13ca88761e7d26f0ac46300825ca8_b.jpg

换用函数的写法,可以这样
>>> msg='hello----world'
>>> msg.split('-')
['hello', '', '', '', 'world']
>>>
>>> filter(lambda item: True if item else False, msg.split('-'))
['hello', 'world']

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值