python自动化中正则表达式提取(适用于提取文本结果)

对于结果是json格式的我们经常使用jsonpath,但是很多时候我们需要从一些文本中提取数据,这个时候正则表达式的提取就很重要,这边主要分享一些正则表达式的提取方法和应用场景的实践,主要介绍两种用法re.search()跟re.findall()

1.re.search()

    re.search() 函数用于在字符串中查找匹配的第一个子串,并返回一个匹配对象。如果找到了匹配,可以通过匹配对象的方法和属性来获取相关信息

例如:在一下文本中找到value对应的值

re.search('name="csrf token" value:"(.*?)"',result)

 写法:将上面文本中的复制下来,然后将value对应的值直接换成"(.*?)"即可

2.re.findall()

re.findall() 函数用于在字符串中查找所有匹配的子串,并返回一个包含所有匹配结果的列表。

import re

pattern = r'\d+' # 匹配一个或多个数字

text = "I have 3 apples and 5 bananas. Total 8 fruits."

# 查找所有匹配的子串

matches = re.findall(pattern, text)

if matches:
    print("Matches:", matches)  # 获取所有匹配的子串列表
else:
    print("No matches found.")

 

  • 7
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python正则表达式是一种强大的工具,用于在字符串进行模式匹配和搜索。Python提供了re模块来支持正则表达式操作。 以下是Python正则表达式的一些常用功能和用法: 1. 匹配字符串:使用re.match()函数可以从字符串的起始位置开始匹配一个模式。如果匹配成功,返回一个匹配对象;否则返回None。 2. 搜索字符串:使用re.search()函数可以在整个字符串搜索匹配一个模式。如果匹配成功,返回一个匹配对象;否则返回None。 3. 查找所有匹配:使用re.findall()函数可以查找字符串所有匹配一个模式的子串,并返回一个列表。 4. 替换字符串:使用re.sub()函数可以将字符串匹配一个模式的子串替换为指定的字符串。 5. 切分字符串:使用re.split()函数可以根据一个模式将字符串切分成多个子串,并返回一个列表。 6. 匹配对象的属性和方法:匹配对象具有一些属性和方法,如group()、start()、end()等,可以获取匹配到的子串、匹配子串的起始位置和结束位置等信息。 正则表达式的语法非常灵活,可以用于匹配各种复杂的模式。以下是一些常用的正则表达式元字符: - . :匹配任意字符(除了换行符) - ^ :匹配字符串的起始位置 - $ :匹配字符串的结束位置 - * :匹配前面的字符零次或多次 - + :匹配前面的字符一次或多次 - ? :匹配前面的字符零次或一次 - [] :匹配括号内的任意一个字符 - () :标记一个子表达式的开始和结束位置 - | :匹配两个或多个表达式之一 正则表达式还支持一些特殊的字符类别和转义字符,用于匹配数字、字母、空白字符等特定类型的字符。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值