正则表达式

正则表达式

正则表达式,又称规则表达式**。**(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。

  • 给定的字符串是否符合正则表达式的过滤逻辑(匹配)
  • 通过正则表达式,从字符串中获得完美想要的特定的部分

使用场景

  • 爬虫
  • 数据挖掘和分析

因为Python是一门高级语言,程序员在使用时无需关心内存的分配和释放,因为此工作都是交给Python解释器来执行,所以,析构函数的调用是由解释器在进行垃圾回收时自动触发执行的。

在Python中使用正则需要导入re

import re

首先我们来看两个例子来体验一下正则表达式的威力吧:

### 引入案例1

比如,已知一个列表:

​ li = [“Chinese”, “China”, “English”, “Britain”, “Canada”, “New Zealand”]

找出以Ch开头的字串。

# 法1
li = ["Chinese", "China", "English", "Britain", "Canada", "New Zealand"]
lt = []
for i in li:
	if i[0:2] == "Ch":
		lt.append(i)
print(lt)
# 法2
li = ["Chinese", "China", "English", "Britain", "Canada", "New Zealand"]
print([i for i in li if i[0:2]=="Ch"])
# 在a中,提取出23 5 67
import  re
a='ab23fd5g67'
m = r'[0-9]+'
num = re.findall(m,a)
print(num)
#23 5 67

python 正则表达式的基础

单字符匹配规则

字符功能
.匹配任意一个字符(除了\n)
[]匹配[]中列举的字符
\d匹配数字(0-9)
\D匹配非数字(\d取反)
\w匹配字,A-Z,a-z,0-9,_
\W\w取反
\s匹配空白字符,比如空格 \tab
\S取反
  • re.math(pattern,string,flags=0 )

    作用:从字符串的开头匹配一个模式

  • 匹配成功返回一个匹配成功的对象

  • 否则,返回None

​ 参数说明:

  • pattern:匹配的正则表达式

  • string:要匹配的字符串

  • flags:标志位,用于控制正则表达式非匹配方式。比如是否匹配多行,是否区分大小写。

  • re.group([group1,…]字符串或者元组

    • 作用:获得一个或者多个分组截获的字符串
    • 指定多个参数时就会以元组形式返回
    • group1可以使用编号,也可以使用别名
    • 编号0代表匹配整个子串,默认返回group(0)
    • 如果没有截获字符串,返回None。
    • 如果截获多次的组,返回最后一次截获的子串。
  • re.groups([default=None])tuple

    • 作用:以元组形式返回全部分组截获的字符串。类似调用re.group(1,2,3…,last)
    • 如果没有截获字符串的组,默认返回None

demo(.):

import re
m = re.match('.','\n')  # \n报错
print(m.group())
m = re.match('.','s')  # match 匹配开头的
print(m.group()) #s
m = re.match('.','city')  # match 匹配开头的
print(m.group()) #c

demo([ ]):

m = re.match('[Cc]','city')
print(m.group()) #c
m = re.match('[Cc]','City')  # match 匹配开头的
print(m.group()) #C
m = re.match('[0123456789]', '595') 
print(m.group())
m = re.match('[0-9]', '595')  # [0123456789]<--->[0-9]
print(m.group())

demo(\d,\D):

m = re.match(r'\D', 'i234')
print(m.group()) #i
m = re.match(r'\d', '234')
print(m.group()) #2

demo(\w,\W):

m = re.match(r'\w', 'we234')
print(m.group()) #w
m = re.match(r'\w', '234')
print(m.group()) #2
m = re.match(r'\W', ' 234')
print(m.group()) #空格

demo(\s,\S):

m = re.match(r'\s', ' 234')
print(m.group()) # 空格
m = re.match(r'\S', 'w234')
print(m.group()) #w
数量匹配规则
字符功能
*匹配前一个字符出现0次多次或者无限次,可有可无,可多可少
+匹配前一个字符出现1次多次或者无限次,直到出现一次
匹配前一个字符出现1次或者0次,要么有1次,要么没有
{m}匹配前一个字符出现m次
{m,}匹配前一个字符至少出现m次
{m,n}匹配前一个字符出现m到n次

demo(*):

m = re.match('[A-Z][a-z]*', 'SccitySAAsss')
print(m.group()) #Sccity
m = re.match('[A-Z]*[a-z]', 'SSSSSSccitySAAsss')
print(m.group())#SSSSSSc

demo(+):

m = re.match('[A-Z][a-z]+', 'Sccity')
print(m.group()) #Sccity
pattren = input('输入匹配规则')
sr = input('输入匹配的字符串')
m=re.match(pattren,sr)
print(m.group())
#输入匹配规则1[35678]\d{9}
#输入匹配的字符串189677200162626264464
#18967720016
表示边界
字符功能
^匹配字符串开头
$匹配这字符的结尾
\b匹配一个单词的边界 boundary
\B匹配非单词边界
匹配分组
字符功能
|
(ab)将括号中的字符作为一个分组
\num引用分组num匹配到的字符串
(?p)分组起别名
(?p=name)引用别名为name分组匹配到的字符串
str = '<h1>hello world!</h1>'
pat = '<h1>(.*)</h1>'
res =re.match(pat,str)
print(res.group())
print(res.group(1))
print(res.groups())
#<h1>hello world!</h1>
#hello world!
#('hello world!',)

re.search(pattern,str,flags=0)

  • 作用:扫描整个字符串,返回第一次成功匹配的对象
  • 如果匹配失败,返回None
  • 参数:
    • pattern:匹配的正则表达式
    • string:要匹配的字符串
    • flags:标志位,用于控制正则表达式非匹配方式。比如是否匹配多行,是否区分大小写。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Go语言(也称为Golang)是由Google开发的一种静态强类型、编译型的编程语言。它旨在成为一门简单、高效、安全和并发的编程语言,特别适用于构建高性能的服务器和分布式系统。以下是Go语言的一些主要特点和优势: 简洁性:Go语言的语法简单直观,易于学习和使用。它避免了复杂的语法特性,如继承、重载等,转而采用组合和接口来实现代码的复用和扩展。 高性能:Go语言具有出色的性能,可以媲美C和C++。它使用静态类型系统和编译型语言的优势,能够生成高效的机器码。 并发性:Go语言内置了对并发的支持,通过轻量级的goroutine和channel机制,可以轻松实现并发编程。这使得Go语言在构建高性能的服务器和分布式系统时具有天然的优势。 安全性:Go语言具有强大的类型系统和内存管理机制,能够减少运行时错误和内存泄漏等问题。它还支持编译时检查,可以在编译阶段就发现潜在的问题。 标准库:Go语言的标准库非常丰富,包含了大量的实用功能和工具,如网络编程、文件操作、加密解密等。这使得开发者可以更加专注于业务逻辑的实现,而无需花费太多时间在底层功能的实现上。 跨平台:Go语言支持多种操作系统和平台,包括Windows、Linux、macOS等。它使用统一的构建系统(如Go Modules),可以轻松地跨平台编译和运行代码。 开源和社区支持:Go语言是开源的,具有庞大的社区支持和丰富的资源。开发者可以通过社区获取帮助、分享经验和学习资料。 总之,Go语言是一种简单、高效、安全、并发的编程语言,特别适用于构建高性能的服务器和分布式系统。如果你正在寻找一种易于学习和使用的编程语言,并且需要处理大量的并发请求和数据,那么Go语言可能是一个不错的选择。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值