Python正则表达式之提取字符串中中文和数值

提取中文

import re
pattern=re.compile("[\u4e00-\u9fa5]+")
pattern.findall("士力架花生夹心巧克力全家桶460g/+40克(20克*2)500g")

输出:
[‘士力架花生夹心巧克力全家桶’, ‘克’, ‘克’]

提取数值

提取整型数值

import re
pattern=re.compile("[0-9]+")
pattern.findall("士力架花生夹心巧克力全家桶460g/+40克(20克*2)500g")

输出:
[‘460’, ‘40’, ‘20’, ‘2’, ‘500’]

#提取全家桶之后出现的两位整型字符
import re
pattern=re.compile("(?<=全家桶)\d{2}")
pattern.findall("士力架花生夹心巧克力全家桶460.7g/+40克(20克*2)500.8g")

输出:
[‘46’]

#提取出现的克数信息
import re
pattern=re.compile("[0-9]+g|[0-9]+克")
pattern.findall("士力架花生夹心巧克力全家桶460g/+40克(20克*2)500g")

输出:
[‘460g’, ‘40克’, ‘20克’, ‘500g’]

提取浮点型数值

import re
pattern=re.compile("\d+\.\d*")#\d+匹配整型数值,\.匹配小数点,\d*匹配小数点后的整型数值
pattern.findall("士力架花生夹心巧克力全家桶460.7g/+40克(20克*2)500.8g")

输出:
[‘460.7’, ‘500.8’]

提取整型和浮点型数值

#提取数值
import re
pattern=re.compile("\d+\.?\d*")#因为不确定是否有小数点,所以此处使用\.?来匹配
pattern.findall("士力架花生夹心巧克力全家桶460.7g/+40克(20克*2)500.8g")

输出:
[‘460.7’, ‘40’, ‘20’, ‘2’, ‘500.8’]

#提取"全家桶"之后出现的数值
import re
pattern=re.compile("(?<=全家桶)\d+\.?\d*")
pattern.findall("士力架花生夹心巧克力全家桶460.7g/+40克(20克*2)500.8g")

[‘460.7’]

参考链接

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值