![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
正则表达式
时光机丶
伪文艺理工男
展开
-
Python 3爬虫网易云(四)—— 正则表达式上篇之匹配法则
学完Request库的BeautifulSoup库的基本用法后,现在有必要学习一下正则表达式才能更好的解决自己遇到的爬虫问题,当然如果会Selenium基于自动化测试爬虫、BeautifulSoup分析网页DOM节点,这就更方便了,但本文更多的是介绍基于正则的底层爬取分析。那些再后续的文章中会提到啦。 详细的正则表达式可以戳: 这里写链接内容正则表达式首先,我们用一个小小的实例来了解认识正则表达原创 2017-09-17 09:35:47 · 868 阅读 · 0 评论 -
Python 3爬虫网易云(五)—— 正则表达式下篇之HTML标签
上篇详细介绍了一下正则表达式的常用知识点。这一篇我们开启正则表达式里的search()方法和一些其他的方法。search()我们在前一篇提到过match()方法是从字符串的开头开始匹配,一旦开头不匹配,那么整个匹配就失败了。我们看下面的例子:import recontent = 'Extra stings Hello 1234567 World_This is a Regex Demo Extra原创 2017-09-18 13:16:07 · 1808 阅读 · 0 评论