解析文件名：使用正则表达式提取点分隔的文件扩展名

最新推荐文章于 2024-02-03 14:00:45 发布

Leon_Jinhai_Sun

最新推荐文章于 2024-02-03 14:00:45 发布

阅读量388

点赞数 9

文章标签：正则表达式

本文链接：https://blog.csdn.net/Leon_Jinhai_Sun/article/details/135451156

版权

本文详细解释了正则表达式`(?s:.*.)Z`的工作原理，包括DOTALL模式、贪婪量词和转义字符的使用，通过一个实例展示了如何使用这个正则表达式从文本中提取文件名。

摘要由CSDN通过智能技术生成

这个正则表达式 `'(?s:.*\\..*)\\Z'` 包含了一些特殊的元素，让我们逐一解析：

1. `(?s)`：这是一个模式修饰符，称为“DOTALL”模式。在这种模式下，`.` 匹配包括换行符在内的所有字符。默认情况下，`.` 不匹配换行符。
2. `.*`：这是一个贪婪量词，表示匹配任意数量的任何字符（除了换行符，考虑到 `(?s)` 模式）。
3. `\\.`：这匹配实际的点字符（`.`）。在许多编程语言中，反斜杠 `\` 是一个转义字符，所以要用两个反斜杠来表示一个实际的反斜杠。然后，点字符 `.` 在正则表达式中也是一个特殊字符，表示匹配任何字符，所以我们需要再使用一个反斜杠进行转义。
4. `.*`：再次是一个贪婪量词，表示匹配任意数量的任何字符（考虑到 `(?s)` 模式，这会包括换行符）。
5. `\\Z`：这匹配字符串的结束位置。在许多编程语言中，`Z` 或 `z` 是正则表达式中的一个特殊字符，表示字符串的结束位置。因此，我们需要使用两个反斜杠来进行转义。

现在，让我们通过一个例子来理解这个正则表达式的用途。假设我们有一个文本文件，其中包含一些以点分隔的文件名，如下所示：

file1.txt
file2.jpg
anotherfile.pdf
somefile.log

如果我们想要提取这些文件名（即每个文件的点之前的部分），我们可以使用这个正则表达式：

import re

text = """file1.txt
file2.jpg
anotherfile.pdf
somefile.log"""

matches = re.findall(r'(?s:.*\.)(.*)\Z', text)
print(matches)  # ['txt', 'jpg', 'pdf', 'log']

在这个例子中，正则表达式会找到每行的点字符并捕获它后面的部分，直到该行的末尾。结果是一个包含每个匹配部分的列表：`['txt', 'jpg', 'pdf', 'log']`。

Leon_Jinhai_Sun

关注

9
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
解析文件名：使用正则表达式提取点分隔的文件扩展名

解析文件名：使用正则表达式提取点分隔的文件扩展名
复制链接

扫一扫

解析文件名：使用正则表达式提取点分隔的文件扩展名

“相关推荐”对你有帮助么？