re --- 正则表达式操作

最新推荐文章于 2024-06-03 20:29:46 发布

yoyo_573

最新推荐文章于 2024-06-03 20:29:46 发布

阅读量117

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/yoyo_573/article/details/117199279

版权

python 专栏收录该内容

10 篇文章 1 订阅

订阅专栏

引用 https://docs.python.org/zh-cn/3/library/re.html#
re.sub(u"([^abc])", "", cell)表示将cell中内容除了abc其他都替换成空
u是Unicode的编码，r是原始字符

u'你好'        #这里是把‘你好’用Unicode编码
r'\nabdcd\rds'    #这里加上r表示 把\nabdcd\rds看做原始字符，忽略一切转意字符。

这个模块提供了与 Perl 语言类似的正则表达式匹配操作。

模式和被搜索的字符串既可以是 Unicode 字符串 (str) ，也可以是8位字节串 (bytes)。但是，Unicode 字符串与8位字节串不能混用：也就是说，你不能用一个字节串模式去匹配 Unicode 字符串，反之亦然；类似地，当进行替换操作时，替换字符串的类型也必须与所用的模式和搜索字符串的类型一致。

正则表达式使用反斜杠字符 (’’) 来表示特殊形式或是允许在使用特殊字符时不引发它们的特殊含义。这会与 Python 的字符串字面值中对相同字符出于相同目的的用法产生冲突；例如，要匹配一个反斜杠字面值，用户可能必须写成 ‘\\’ 来作为模式字符串，因为正则表达式必须为 \，而每个反斜杠在普通 Python 字符串字面值中又必须表示为 \。而且还要注意，在 Python 的字符串字面值中使用的反斜杠如果有任何无效的转义序列，现在将会产生 DeprecationWarning 并将在未来改为 SyntaxError。此行为即使对于正则表达式来说有效的转义字符同样会发生。

解决办法是对于正则表达式样式使用 Python 的原始字符串表示法；在带有 ‘r’ 前缀的字符串字面值中，反斜杠不必做任何特殊处理。因此 r"\n" 表示包含 ‘’ 和 ‘n’ 两个字符的字符串，而 “\n” 则表示只包含一个换行符的字符串。样式在 Python 代码中通常都会使用这种原始字符串表示法来表示。

绝大部分正则表达式操作都提供为模块函数和方法，在编译正则表达式. 这些函数是一个捷径，不需要先编译一个正则对象，但是损失了一些优化参数。

yoyo_573

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
re --- 正则表达式操作

引用 https://docs.python.org/zh-cn/3/library/re.html#re.sub(u"([^abc])", "", cell)表示将cell中内容除了abc其他都替换成空u是Unicode的编码，r是原始字符u'你好' #这里是把‘你好’用Unicode编码r'\nabdcd\rds' #这里加上r表示把\nabdcd\rds看做原始字符，忽略一切转意字符。这个模块提供了与 Perl 语言类似的正则表达式匹配操作。模式和被搜索的字符串既
复制链接

扫一扫

专栏目录