python用正则表达式提取中文_用正则表达式从Python中的字符串中提取数字

对于这样的事情,re.findall工作得很好:>>> import re

>>> myString = "Test1 [cm]: -35.00/-34.99/-34.00/0.09"

>>> re.findall(r'([+-]?\d+\.\d+)',myString)

['-35.00', '-34.99', '-34.00', '0.09']

您可以通过列表理解直接获取浮动:>>> [float(f) for f in re.findall(r'([+-]?\d+\.\d+)',myString)]

[-35.0, -34.99, -34.0, 0.09]

或者像这样的第二个:>>> re.findall(r'([+-]?\d+\.\d+)',myString)[1]

'-34.99'

问题是你会接受多大范围的文本浮点数?有些没有小数点?指数?>>> myString = "Test1 [cm]: -35.00/-34.99/-34.00/0.09/5/1.0e6/1e-6"

哎哟!--使用regex越来越难了。

实际上,最好使用Python的字符串操作:>>> ''.join([s for s in myString.split() if '/' in s]).split('/')

['-35.00', '-34.99', '-34.00', '0.09', '5', '1.0e6', '1e-6']

你可以用同样的方法得到第n个:>>> n=2

>>> ''.join([s for s in myString.split() if '/' in s]).split('/')[n]

'-34.00'

那么所有奇怪的情况都没有更难的regex:>>> map(float,''.join([s for s in myString.split() if '/' in s]).split('/'))

[-35.0, -34.99, -34.0, 0.09, 5.0, 1000000.0, 1e-06]

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值