通过python爬取动态加载的网页数据，并写入pandas用于后面分析

最新推荐文章于 2022-07-06 21:51:58 发布

大橘九九

最新推荐文章于 2022-07-06 21:51:58 发布

阅读量770

点赞数

分类专栏：爬虫文章标签：爬虫 python pandas

本文链接：https://blog.csdn.net/weixin_46539246/article/details/119521013

版权

本文介绍如何使用Python爬取化妆品生产许可信息管理系统服务平台上的动态加载数据，通过查找真实URL并发起请求获取数据，然后将数据存入pandas进行后续分析。学习过程受到B站波波老师的指导。

摘要由CSDN通过智能技术生成

通过python爬取动态加载的网页数据，并写入pandas用于后面分析
最近开始学习爬虫，通过博客记录自己的学习成果，在此特别感谢B站的波波老师，B站账号：路飞学城IT
这次爬取的网站是：化妆品生产许可信息管理系统服务平台（http://scxk.nmpa.gov.cn:81/xk/#）
这个网站的数据是动态加载出来的
在这里插入图片描述使用request请求这个网站是得到不了数据的，我们可以通过调出网页的相关代码之后，利用ctrl+f 搜寻网页数据的存放地址
找到真正的可以请求得到的url，对其发起请求可以得到里面的数据，打开这个url对应的相应数据response，我们可以发现需要的数据在里面。

接下来是代码的呈现

import requests
import pandas as pd

url = 'http://scxk.nmpa.gov.cn:81/xk/itownet/portalAction.do?method=getXkzsList' # 真正需要发起的url
headers = {
   
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:90.0) Gecko/20100101 Firefox/90.0'  #设置请求头
}
df = pd.DataFrame(columns=['企业名称','发证机关','发证日期','有效期至'

最低0.47元/天解锁文章

大橘九九

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
通过python爬取动态加载的网页数据，并写入pandas用于后面分析

通过python爬取动态加载的网页数据，并写入pandas用于后面分析最近开始学习爬虫，通过博客记录自己的学习成果，在此特别感谢B站的波波老师，B站账号：路飞学城IT这次爬取的网站是：化妆品生产许可信息管理系统服务平台（http://scxk.nmpa.gov.cn:81/xk/#）这个网站的数据是动态加载出来的使用request请求这个网站是得到不了数据的，我们可以通过调出网页的相关代码之后，利用ctrl+f 搜寻网页数据的存放地址找到真正的可以请求得到的url，对其发起请求可以得到里面的数据，
复制链接

扫一扫

专栏目录