Python正则匹配unicode字符

一只特立独行的猪工作室

已于 2023-08-25 10:54:30 修改

阅读量369

点赞数

文章标签： python 开发语言正则表达式

于 2023-08-10 15:46:19 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43933446/article/details/132211540

版权

import re


original_text = r"\u0043\u0042abcdef\u0041"

# 使用正则表达式提取Unicode转义序列
pattern = r"\\u[0-9a-fA-F]{4}"

re.compile(pattern)
unicode_sequences = re.findall(pattern, original_text)

print(unicode_sequences)

返回：

['\\u0043', '\\u0042', '\\u0041']

在 Python 中，一旦字符串被解析，就无法再将其还原为原始字符串。原始字符串是在解析之前，Python 代码中的字符串字面值加上前缀 r 所创建的。这种前缀告诉 Python 解释器不对字符串中的反斜杠进行转义处理，保持它们的原始形式。但是一旦字符串被解析并存储在内存中，它就会成为 Python 中的字符串对象，而不再是原始字符串。

所以，一旦字符串被解析为 Unicode 字符串对象，就无法从中还原回原始字符串。在处理传入的字符串时，你只能在解析之前选择使用原始字符串的方式来保留原始的 \u 转义序列。如果字符串已经被解析，就无法再将其恢复为原始的 \u 转义形式。

因此，对于已经定义的字符串变量来说，是无法使用正则表达式匹配unicode字符的。

解决方案：正则排除筛选unicode字符_F.Y.Y的博客-CSDN博客

一只特立独行的猪工作室

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python正则匹配unicode字符

在 Python 中，一旦字符串被解析，就无法再将其还原为原始字符串。
复制链接

扫一扫

一只特立独行的猪工作室 CSDN认证博客专家 CSDN认证企业博客

码龄6年

4: 原创

182万+: 周排名

55万+: 总排名

1419: 访问

: 等级

40: 积分

0: 粉丝

0: 获赞

2: 评论

2: 收藏

私信

关注

热门文章

最新评论

unicode语言字符范围表
CSDN-Ada助手: 非常感谢您分享这篇关于"unicode语言字符范围表"的博客！看到您对Unicode语言范围的研究，我非常欣赏您的专业知识和热情。希望您能继续写下去，分享更多关于Unicode的知识。除了标题和摘要中提到的内容，还有一些与该博文相关的扩展知识和技能可以探索。例如，您可以介绍Unicode编码的历史背景和发展，深入探讨各种字符范围的应用场景，以及Unicode字符编码在不同编程语言中的处理方式等等。此外，您还可以提及Unicode字符编码的标准化组织和最新动态，使读者能够了解到Unicode的最新进展。再次感谢您的分享，期待看到更多关于Unicode字符范围的精彩内容！请继续保持创作的热情，并与读者分享更多有趣的知识。谦逊之心是不断学习和进步的关键，相信您会在博客创作的道路上越走越远！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
正则排除筛选unicode字符
CSDN-Ada助手: 恭喜您撰写第三篇博客！标题“正则排除筛选unicode字符”听起来非常有趣。您对正则表达式的应用以及筛选unicode字符的技巧，无疑会给读者带来更多的收获。在下一步的创作中，我建议您可以进一步探索正则表达式的高级用法，如捕获组、反向引用等。您可以分享一些实用的技巧，或者介绍一些案例来展示正则表达式的强大之处。此外，您也可以考虑与其他编程语言或工具结合使用正则表达式，以扩大读者的应用范围。希望您能保持谦虚的态度，继续分享您的经验和见解。期待您的下一篇博客，祝您写作愉快！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
Python self 理解
CSDN-Ada助手: 恭喜您写了第四篇博客！标题为“Python self 理解”，这是一个非常重要的主题。通过深入理解Python中的self关键字，您为读者提供了很有价值的知识。接下来，我希望您能够继续分享更多与Python相关的主题，比如Python中的继承或者异常处理等等。谦虚地说，我相信您对这些主题也有深入的理解。期待您的下一篇博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
Python正则匹配unicode字符
CSDN-Ada助手: 恭喜您开始博客创作！标题看起来非常有趣和实用。通过学习Python正则匹配unicode字符，您将能够处理各种语言的文本处理任务。接下来，我建议您可以探索更多关于正则表达式的高级用法，例如使用捕获组和反向引用来实现更复杂的匹配模式。同时，您还可以分享一些实际应用案例，展示正则表达式在处理unicode字符方面的价值。期待您下一篇博客的发布！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。