Python 黑板客爬虫闯关的第一关

黑板客爬虫闯关的第一关

附一下网址:      http://www.heibanke.com/lesson/crawler_ex00/

自己手动的填了几个发现太多,填补过来。

只好巧妙地利用了python爬虫技术,百度了不少资料,最后终于成功了!

具体说一下步骤:

1.安装python

去官网下载即可。

2.安装selenium

win键 + R 运行 cmd , 在cmd里输入 pip install selenium

3.下载chromedriver

http://chromedriver.storage.googleapis.com/index.html

把下载好的chromedriver放在python的安装目录下

测试一下能不能用,打开idle,新建一个文件:

from selenium import webdriver
browser = webdriver.Chrome()
browser.get('http://www.baidu.com/')

可以成功打开百度说明成功。

4.代码运行

# coding=utf-8

import requests, re
from selenium import webdriver

url = 'http://www.heibanke.com/lesson/crawler_ex00/'

browser = webdriver.Chrome()

while True:
    # download the page
    print("Forward to page %s ..." % url)
    browser.get(url)
    elem = browser.find_element_by_tag_name('h3')

    # get the url of the for the next page
    print(elem.text)
    number = re.findall("\d+", elem.text)
    if number == []:
        print('The end.')
        #browser.quit()
        break;
    else:
        url = 'http://www.heibanke.com/lesson/crawler_ex00/' + number[0] # 拼接新地址

最终成功了,谢谢大家的阅读。

py二进制文件https://www.lfd.uci.edu/~gohlke/pythonlibs/

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Admini$trat0r

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值