-
导入所需的库和模块,如requests、json等。这些库可以帮助你发送HTTP请求和解析HTML页面。
-
使用requests库发送一个GET请求到新发地的网站,获取网页的内容。
-
提取所需的价格信息,并进行处理或存储,以便后续使用。
-
完整代码
#导入需要的库 import requests import json import pandas as pd #获取网页 rq=requests.get('http://www.xinfadi.com.cn/getCat.html').content.decode('utf-8') rq type(rq) data=json.loads(rq) data data['list'] #提取需要的信息 b=[i['prodName'] for i in data['list']] b c=[i['pubDate'] for i in data['list']] c d=[i['avgPrice'] for i in data['list']] d e=[i['highPrice'] for i in data['list']] e f=[i['lowPrice'] for i in data['list']] f python=pd.DataFrame({'菜名':b,'发布日期':c,'平均价':d,'最高价':e,'最低价':f}) python
Jupyder爬取动态网页(北京新发地)
最新推荐文章于 2024-07-20 17:12:48 发布