正则表达式学习笔记

动机:

要从字符串“民国22年8月(1933-08)”中提取出年份1933.

最初是直接从字符串中提取,后来发现还有其他形式的字符串,如“民国29年(1940)”。

总之会带来不准确,提取出现误差。所以要使用正则表达式准确描述这类模式。


何为正则表达式?

简单地说,正则表达式(简称为regex)是一些由字符和特殊符号组成的字符串,它们描述了模式的重复或者表述多个字符,于是正则表达式能按某种模式匹配一系列由相似特征的字符串。

正则表达式为高级的文本模式匹配、抽取与/或文本形式的搜索和替换功能提供了基础。


Python中的正则表达式使用

Python通过标准库中的re模块来支持正则表达式。


正则表达式模式是指表示一类具有共性字符串的表达式。

最简单的正则表达式如“foo”,表示包含字符串“foo”。不过这个并没有什么共性的抽取。


match与search的区别

match从开头开始匹配,search不仅从开头开始匹配而且从中间中开始匹配

re.match('foo','afoo')#匹配失败

re.search('foo','afoo')#匹配成功








来源:《Python核心编程(第三版)》30页。


  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值