使用Selenium自动登陆豆瓣网站 & Selenium 和 requests + BeautifulSoup的对比

最新推荐文章于 2024-01-18 02:11:41 发布

baby_in_car

最新推荐文章于 2024-01-18 02:11:41 发布

阅读量434

点赞数

分类专栏：工作分享编程开发

本文链接：https://blog.csdn.net/Mr_Gorgre/article/details/99010868

版权

编程开发同时被 2 个专栏收录

26 篇文章 0 订阅

订阅专栏

工作分享

25 篇文章 0 订阅

订阅专栏

通过最近对Selenium的学习发现它其实是一个非常强大的爬虫工具，同时又是一个强大的自动化脚本工具，在使用的过程中我们会发现它的几个函数功能：

find_element_by_id 通过id来查找元素，一般都是唯一的

find_element_by_tag_name

find_element_by_class_name（）通过class名去查找，通常是不唯一的

find_element_by_xpath() 通过路径去进行查找

#encoding = utf-8

from selenium import webdriver
import time

u = 'https://accounts.douban.com/passport/login?source=book'

browser = webdriver.Firefox(executable_path = "/Users/StevenGao/geckodriver")
browser.get(u)

browser.find_element_by_xpath('/html/body/div[1]/div[2]/div[2]/div/div[1]/ul[1]/li[2]').click()
browser.find_element_by_id('username').clear()
browser.find_element_by_id('username').send_keys('123456@qq.com')
browser.find_element_by_id('password').clear()
browser.find_element_by_id('password').send_keys('seagull')
browser.find_element_by_xpath('/html/body/div[1]/div[2]/div[2]/div/div[2]/div[1]/div[4]/a').click()

time.sleep(3)
browser.quit()

Selenium 和 requests & BeautifulSoup的区别：

1⃣️ Selenium 可以对动态页面进行抓取

2⃣️

未完待续

关注博主即可阅读全文