正则表达式 匹配点号_【实用技能分享】Python正则表达式详解

本文详细介绍了Python中的正则表达式,包括原子、非打印字符、通用字符、元字符、模式修正符、贪婪与懒惰模式,以及正则表达式在实际应用中的例子,如网页数据抓取。通过实例解析了如何使用正则表达式进行字符串匹配和处理。
摘要由CSDN通过智能技术生成

97f7aea1646d671b9b40ef8b4525e6cc.gif

说在前面

正则表达式是一个很强大的字符串处理工具,几乎任何关于字符串的操作都可以使用正则表达式来完成,作为一个爬虫工作者,每天和字符串打交道,正则表达式更是不可或缺的技能。

正则表达式在不同的语言中使用方式不尽相同,不过只要学会了任意一门语言的正则表达式用法,其他语言中大部分也只是换了个函数的名称而已,本质都是一样的。

注:本文摘自 i 春秋社区(bbs.ichunqiu.com),欢迎更多优秀作者去社区投稿,帮助更多萌新们快速掌握新技能。文章阅读用时约10分钟。

原子

原子是正则表达式中最基本的单位,每个正则表达式中至少要包含一个原子。常见的原子类型:

  • 普通字符作为原子

  • 非打印字符作为原子

  • 通用字符作为原子

  • 原子表

普通字符作为原子

演示代码:

import re

输出

<_sre.SRE_Match object; span=(7, 10), match='yun'>

非打印字符作为原子

什么是非打印字符,如\n,\t(换行,制表),代表一些操作的字符也可以作为原子

操作代码与小知识

'''shentouyun
nuibi
'''

运行后

<_sre.SRE_Match object; span=(10, 11), match='\n'>

小知识

#在这里解释一个基础,我没有提到过

通用字符作为原子

什么是通用字符?

1. \w匹配任意一个字母数字或下划线;

2. \W匹配除去字母数字或下划线任意一个字符;

3. \d匹配十进制数;

4. \D除十进制以外的任意一个字符;

5. \s匹配一个空白字符;

6. \S除去空白字符。

简单的例子

"shentouyun3215454biji"

运行后

<_sre.SRE_Match object; span=(10, 14), match='3215'>

也可以混合使用

"shentouyun3215454biji"

运行后

<_sre.SRE_Match object; span=(9, 14), match='n3215'>
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值