爬虫(六)- selenium控制浏览器,自动打开运行点击评论

安装selenium
pip install selenium
selenium的脚本可以控制所有常见浏览器的操作,在使用之前,需要安装浏览器的驱动
这里使用的是Chrome浏览器
下载驱动及安装方法:
https://localprod.pandateacher.com/python-manuscript/crawler-html/chromedriver/ChromeDriver.html
设置浏览器引擎

from selenium import webdriver    #从selenium库中调用webdriver模块
impot time

driver = webdriver.Chrome()       # 设置引擎为Chrome,真实地打开一个Chrome浏览器

driver.get('https://h5.ele.me/login/#redirect=https%3A%2F%2Fwww.ele.me%2F') # 访问页面
time.sleep(2)  #等待2秒让页面加载完
driver.close() # 关闭浏览器

解析与提取数据
driver是实例化浏览器会自动解析数据。
提取数据方法如下:
在这里插入图片描述
在这里插入图片描述


# 以下方法都可以从网页中提取出'你好,蜘蛛侠!'这段文字

find_element_by_tag_name:通过元素的名称选择
# 如<h1>你好,蜘蛛侠!</h1> 
# 可以使用find_element_by_tag_name('h1')

find_element_by_class_name:通过元素的class属性选择
# 如<h1 class="title">你好,蜘蛛侠!</h1>
# 可以使用find_element_by_class_name('title')

find_element_by_id:通过元素的id选择
# 如&l
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值