黑板客爬虫闯关----第一关

最新推荐文章于 2019-07-20 13:21:00 发布

--onono--

最新推荐文章于 2019-07-20 13:21:00 发布

阅读量260

点赞数

分类专栏： python 之路文章标签： python 爬虫

本文链接：https://blog.csdn.net/xue_hua_king/article/details/86290121

版权

python 之路专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本人使用的是正则匹配的方法：

代码如下：

import re
import requests

url = 'http://www.heibanke.com/lesson/crawler_ex00/'
num = ""

while True:
    curl = url + num
    print(curl)
    r = requests.get(curl).text
    title = re.findall(r'数字(.*)</h3>', r)
    if title:
        title = "".join(title)
        print(title)
        num = re.findall("\d+", title)[0]
    else:
        break