【python】使用正则匹配判断字符串中含有某些特定子串 及 正则表达式详解

文章目录一、判断字符串中是否含有字串1. `in`,`not in`2.正则匹配`re.findall`二、正则表达式(一)基本内容1.正则表达式修饰符——可选标志2.正则表达式模式(二)常见表达式函数1. `re.match`2.`re.search`3. `re.sub`4.`re.compile`5.`re.findall`6.`re.aplit`...
摘要由CSDN通过智能技术生成

一、判断字符串中是否含有字串

1. innot in

判断字符串中是否含有某些关键词,方法比较多
例如分词后对词向量和关键词进行==匹配,但这种方法以来分词的准确性,不太推荐;
其次使用成员运算符in,not in可以较好的判断字符串中是否包含某关键词,即特定字串

a = '这个暑假我读了红楼梦和三国演义'
b= ['三国演义','水浒传','西游记','红楼梦']
n = 0
for i in b:
    if i in a:
        n += 1
print(f'四大名著暑假读了{
     n}本')

这种遍历算法虽然可以成功得到想要的结果,但是当数据量很大的时候,程序执行效率将会很低。正则匹配作为专业的查找工具,在判断字符串中含有特定字串的事情上可以大大提高工作效率。

2.正则匹配re.findall

import re
def is_in(fullstr,substr):
    if re.findall(substr,fullstr):
        return 1
    else:
        return 0

a = '这个暑假我读了红楼梦和三国演义'
b= ['三国演义','水浒传','西游记','红楼梦']
n = 0
for i in b:
    n = is_in(a,i)
    n += 1
print(f'四大名著暑假读了{
     n}本')

findall:返回string中所有与pattern匹配的全部字符串,返回形式为数组

re.findall(pattern, string, flags=0)

示例如下:

line = []
n = 0
for i in b:
    num = is_in(a,i)
    n += num
    res = re.findall(i,a)
    line = line + res 

print(f'四大名著暑假读了
  • 19
    点赞
  • 100
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值