python爬虫之爬取新发地数据并保持

最新推荐文章于 2024-01-21 23:27:44 发布

哩语

最新推荐文章于 2024-01-21 23:27:44 发布

阅读量870

点赞数 1

文章标签： python 爬虫开发语言

本文链接：https://blog.csdn.net/weixin_47805767/article/details/122105665

版权

首先加载库，找到包含数据的网址，拿到页码源代码

import json2
import requests
from bs4 import BeautifulSoup
import csv
import os

url = "http://www.xinfadi.com.cn/getCat.html"
resp=requests.get(url)
resp.encoding = "utf-8"  # 修改源代码编码格式

使用json2解析数据，并保存

print(resp.text)
page = json2.loads(resp.text)
path=os.path.exists("D:/case/菜价")
if not path:
    os.makedirs("D:/case/菜价")
f=open("D:/case/菜价/data.csv",'a')
csvwrite=csv.writer(f)
for row in page["list"]:
    name=row["prodName"]
    cat = row["prodCat"]
    lowPrice = row["lowPrice"]
    highPrice = row["highPrice"]
    avgPrice = row["avgPrice"]
    place = row["place"]
    csvwrite.writerow([name,cat,lowPrice,highPrice,avgPrice,place])
f.close()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

哩语

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python爬虫之爬取新发地数据并保持

首先加载库，找到包含数据的网址，拿到页码源代码import json2import requestsfrom bs4 import BeautifulSoupimport csvimport osurl = "http://www.xinfadi.com.cn/getCat.html"resp=requests.get(url)resp.encoding = "utf-8" # 修改源代码编码格式使用json2解析数据，并保存print(resp.text)page =
复制链接

扫一扫