文章目录
前言
目标:获取企业的详情数据
药监总局网址:http://scxk.nmpa.gov.cn:81/xk/
方法一:requests
1. 分析思路
- 首页的数据是动态加载的
- 首页中对应的企业的数据是通过ajax动态请求到的
- 详情页的url域名都是一样的,只是携带的参数(id)不一样
- id可以从首页对应的ajax请求到的json串中获取
- 详情页的企业详情信息也是动态加载出来的
2. 实现代码
#!/usr/bin/env python
# -*- coding:utf-8 -*-
import requests
import json
# 批量获取不同企业的id值
url = 'http://scxk.nmpa.gov.cn:81/xk/itownet/portalAction.do?method=getXkzsList'
headers ={
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:98.0) Gecko/20100101 Firefox/98.0'
}
id_list = []
all_data_list = [