基于selenium框架爬取国家药品监督总局化妆品生产许可证信息（python）

最新推荐文章于 2022-10-19 14:24:05 发布

6点就起床

最新推荐文章于 2022-10-19 14:24:05 发布

阅读量1.1k

点赞数 1

分类专栏：爬虫文章标签： selenium python

本文链接：https://blog.csdn.net/ygdwb/article/details/109966840

版权

本文介绍如何利用selenium框架抓取国家药品监督总局化妆品生产许可证的首页数据。由于数据动态加载，需通过selenium模拟浏览器行为。教程中详细展示了爬取首页公司详情信息的步骤，并提供了爬取结果。

摘要由CSDN通过智能技术生成

#首页截图
在这里插入图片描述
f12查看网页源码，网页中的数据是动态加载出来的，所以用selenium框架进行进行操作。（可根据需求进行分页操作），在这里我只爬取了首页中的化妆品公司的详情信息。

这是要进行爬取的信息截图
在这里插入图片描述

from selenium import webdriver
from lxml import etree
import time
#导入类 实现让selenium规避被检测到的风险
from selenium.webdriver import ChromeOptions
#实现让selenium规避被检测到的风险
option=ChromeOptions()
option.add_experimental_option('excludeSwitches', ['enable-automation'])

最低0.47元/天解锁文章

6点就起床

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
基于selenium框架爬取国家药品监督总局化妆品生产许可证信息（python）

#首页截图f12查看网页源码，网页中的数据是动态加载出来的，所以用selenium框架进行进行操作。（可根据需求进行分页操作），在这里我只爬取了首页中的化妆品公司的详情信息。这是要进行爬取的信息截图from selenium import webdriverfrom lxml import etreeimport time#导入类实现让selenium规避被检测到的风险from selenium.webdriver import ChromeOptions#实现让selenium规避被
复制链接

扫一扫

专栏目录