day23semenium的基本操作

最新推荐文章于 2024-07-22 15:15:29 发布

柴柴要干饭

最新推荐文章于 2024-07-22 15:15:29 发布

阅读量293

点赞数

文章标签： python

本文链接：https://blog.csdn.net/chaichaishufen/article/details/123560258

版权

这篇博客介绍了如何利用Selenium进行网络数据获取。首先，讲解了寻找接口的方法，包括观察网络请求并使用requests库。然后详细阐述了Selenium的基本操作流程，包括导入模块、创建浏览器对象、打开网页以及通过CSS选择器进行元素定位和点击操作。最后提到了解析网页内容时使用BeautifulSoup的步骤，以爬取实时疫情数据为例。

摘要由CSDN通过智能技术生成

day23semenium的基本操作

1获取网络数据

1，找接口（在network,tetch,刷新列表，展开preview右边的列表。

有接口只有用requesets对接口（headers,requests）发送请求（可能是get或者host)

2,直接用requests对网址发送请求，加user_agent,cookie

3，用selenium

4，放弃

2selenuim流程

1导包

from selenium.webdriver import Chrome
from bs4 import BeautifulSoup
import csv, time

2创建一个浏览器对象

b=Chrome

3开口网页

b.get(‘url’)

选取网页操作

select=b.find_element_by_css_selector(css)

点击按钮

select.click()

4解析网页

soup=BeautifulSoup(b.pagesource,‘lmxl’)

爬取实时疫情数据

all_li=soup.select('.index_1-1-328_2IAAkE>div:nth-child(2)>a')
other_li=soup.select('#foreignTable > t

最低0.47元/天解锁文章

柴柴要干饭

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
day23semenium的基本操作

day23semenium的基本操作1获取网络数据1，找接口（在network,tetch,刷新列表，展开preview右边的列表。有接口只有用requesets对接口（headers,requests）发送请求（可能是get或者host)2,直接用requests对网址发送请求，加user_agent,cookie3，用selenium4，放弃2selenuim流程1导包from selenium.webdriver import Chromefrom bs4 import Beaut
复制链接

扫一扫