python从文件中提取特定文本_python利用正则表达式提取文本中特定内容

最新推荐文章于 2023-06-15 00:26:26 发布

weixin_39607240

最新推荐文章于 2023-06-15 00:26:26 发布

阅读量3.2k

点赞数 8

文章标签： python从文件中提取特定文本

正则表达式是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配。

Python 自1.5版本起增加了re 模块，它提供 Perl 风格的正则表达式模式。

re 模块使 Python 语言拥有全部的正则表达式功能。

compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。

re 模块也提供了与这些方法功能完全一致的函数，这些函数使用一个模式字符串做为它们的第一个参数。

如何利用正则表达式提取文中特定内容呢？

函数介绍：

1.re.compile():该函数用于生成一个正则表达式，也就是匹配的核心部分，用来定义你需要怎么匹配，匹配什么内容，更多细节可以去参看菜鸟教程。

2.re.findall():该函数用于在指定的字符串中进行匹配。

提取特定内容：

1.在一段文本或字符串中提取从某一位置XXX开始到某一位置X结束的特定内容：re.compile('XXX.+X')，示例：

import re

str='abcd1234efg'

pattern=re.compile('ab.+ef') #匹配从ab开始，到ef结束的内容

result=pattern.findall(str)

print(result)

运行结果如下

['abcd1234ef']

2.在一段文本或字符串中提取从某一位置XXX之后到某一位置X之前的特定内容：re.compile('XXX（.+）X')

import re

str='abcd1234efg'

pattern=re.compile('ab(.+)ef') #匹配ab与ef之间的内容

result=pattern.findall(str)

print(result)

运行结果如下

['cd1234']

所以从这两个匹配可以看出，两者的主要区别就在于有无（），很实用的一种方法~~

weixin_39607240

关注

8
点赞
踩
46

收藏

觉得还不错? 一键收藏
0
评论
python从文件中提取特定文本_python利用正则表达式提取文本中特定内容

正则表达式是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配。Python 自1.5版本起增加了re 模块，它提供 Perl 风格的正则表达式模式。re 模块使 Python 语言拥有全部的正则表达式功能。compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。re 模块也提供了与这些方法功能完全一致的函数，这...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。