大坡3D软件开发

因我而不同--用软件来改变世界

python里使用正则表达式的非捕获模式实例二

在前面学习了非捕获模式,也许有些同学还是很不了解它的应用,那么我们就来一个具体一些的例子,这样就会更加深入地了解它的应用意图。比如有一天自己兴趣来了,想写一个爬虫,去爬https://stackoverflow.com网站,发现需要分析这个网站地址,也就是把这些地址进行分离,判断那一些已经是重复了。比如下面两个地址:
'https://stackoverflow.com/'
'https://stackoverflow.com/questions/tagged/regex'
可以使用前面学习过的正则表达式来分析,比如要求如下:
 'https://stackoverflow.com/'  ('https', 'stackoverflow.com', '/')
 就是把地址分析不同的子串,这时你就会想到使用分组正则表达式的功能。但是你也许不关心https,需要把这串丢掉它,怎么办呢?这时就需要使用非捕获模式了(?:)。例子如下:
#python 3.6
#蔡军生 
#http://blog.csdn.net/caimouse/article/details/51749579
#
from re_test_patterns_groups import test_patterns

test_patterns(
    'https://stackoverflow.com/',
    [(r'(https?|ftp)://([^/\r\n]+)(/[^\r\n]*)?', 'capturing'),
     (r'(?:https?|ftp)://([^/\r\n]+)(/[^\r\n]*)?', 'non-capturing')],
)

test_patterns(
    'https://stackoverflow.com/questions/tagged/regex',
    [(r'(https?|ftp)://([^/\r\n]+)(/[^\r\n]*)?', 'capturing'),
     (r'(?:https?|ftp)://([^/\r\n]+)(/[^\r\n]*)?', 'non-capturing')],
)


 结果输出如下:
 '(https?|ftp)://([^/\\r\\n]+)(/[^\\r\\n]*)?' (capturing)


  'https://stackoverflow.com/'
  'https://stackoverflow.com/'  ('https', 'stackoverflow.com', '/')


'(?:https?|ftp)://([^/\\r\\n]+)(/[^\\r\\n]*)?' (non-capturing)


  'https://stackoverflow.com/'
  'https://stackoverflow.com/'  ('stackoverflow.com', '/')


'(https?|ftp)://([^/\\r\\n]+)(/[^\\r\\n]*)?' (capturing)


  'https://stackoverflow.com/questions/tagged/regex'
  'https://stackoverflow.com/questions/tagged/regex'  ('https', 'stackoverflow.com', '/questions/tagged/regex')


'(?:https?|ftp)://([^/\\r\\n]+)(/[^\\r\\n]*)?' (non-capturing)


  'https://stackoverflow.com/questions/tagged/regex'
  'https://stackoverflow.com/questions/tagged/regex'  ('stackoverflow.com', '/questions/tagged/regex')

 这样就达到实现的目标了,很轻松就完成了任务。

深入浅出Numpy
http://edu.csdn.net/course/detail/6149 

Python游戏开发入门

你也能动手修改C编译器

纸牌游戏开发

http://edu.csdn.net/course/detail/5538 

五子棋游戏开发

http://edu.csdn.net/course/detail/5487
RPG游戏从入门到精通
http://edu.csdn.net/course/detail/5246
WiX安装工具的使用
http://edu.csdn.net/course/detail/5207
俄罗斯方块游戏开发
http://edu.csdn.net/course/detail/5110
boost库入门基础
http://edu.csdn.net/course/detail/5029
Arduino入门基础
http://edu.csdn.net/course/detail/4931
Unity5.x游戏基础入门
http://edu.csdn.net/course/detail/4810
TensorFlow API攻略
http://edu.csdn.net/course/detail/4495
TensorFlow入门基本教程
http://edu.csdn.net/course/detail/4369
C++标准模板库从入门到精通 
http://edu.csdn.net/course/detail/3324
跟老菜鸟学C++
http://edu.csdn.net/course/detail/2901
跟老菜鸟学python
http://edu.csdn.net/course/detail/2592
在VC2015里学会使用tinyxml库
http://edu.csdn.net/course/detail/2590
在Windows下SVN的版本管理与实战 
http://edu.csdn.net/course/detail/2579
Visual Studio 2015开发C++程序的基本使用 
http://edu.csdn.net/course/detail/2570
在VC2015里使用protobuf协议
http://edu.csdn.net/course/detail/2582
在VC2015里学会使用MySQL数据库
http://edu.csdn.net/course/detail/2672


阅读更多

扫码向博主提问

去开通我的Chat快问

caimouse

博客专家

非学,无以致疑;非问,无以广识
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/caimouse/article/details/78366096
个人分类: milang(小语)
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭