使用selenium爬取百度阅读的图书信息

1、安装selenium

在CMD输入pip install selenium即可,pip(包管理器)相关请阅读https://blog.csdn.net/u010622242/article/details/84979705

2、在py文件中写如下代码,注意代码的缩进,python对代码缩进要求很严格。

#coding:utf-8
from selenium import webdriver
self = webdriver.Chrome()  #指定selenium进行自动化操作时选用谷歌浏览器
self.get('https://yuedu.baidu.com/book/list/3001?show=0')  #要打开的网页
total_book = self.find_element_by_id('bd')
books = total_book.find_elements_by_class_name('book ')   #找到已经定位到的div盒子里的每一个包含图书介绍的子div
for book in books:  #通过for循环依次把每一本图书的内容取出来
	print (book.text + '\n')    #将爬取到的内容打印
self.quit() #爬取数据完成后关闭浏览器

3、下载并使用谷歌浏览器驱动chromedriver

移步https://blog.csdn.net/u010622242/article/details/84979997

4、执行py文件

在cmd中输入:python 爬取.py

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值