新发地蔬菜价格下载代码

from bs4 import BeautifulSoup
import requests
import json
import pandas as pd
url = "http://www.xinfadi.com.cn/getCat.html"
resp = requests.get(url)

startIndex =resp.text.find("list")
print("获取起始索引," , startIndex)
# 找到最后一个”】“的位置
endIndex = resp.text.find("]") + 1
print("截取索引结束," , endIndex)
# 通过起始位置和结束位置找到[]之间的数据
str = resp.text[startIndex:endIndex].replace("list" , "")
# 将获取的数据解析成json列表
jsonlist = json.loads(str[2:])
print(jsonlist)
first_bond_data = pd.DataFrame(jsonlist)
pd.set_option("display.max_columns" , None)
pd.set_option("display.max_rows" , None)
pd.set_option("display.width" , 500)
pd.set_option("display.unicode.ambiguous_as_wide" , True)
pd.set_option("display.unicode.east_asian_width" , True)
print(first_bond_data)

运行效果

发地是中国北京市的蔬菜批发市场,每天都有大量的蔬菜价格行情更。想要用Python爬取发地价格行情,可以通过以下几个步骤来实现。 首先,需要导入相关的Python库,包括requests和beautifulsoup库。requests库用于发送HTTP请求获取网页的内容,beautifulsoup库用于解析网页的内容。 接下来,需要分析发地价格行情所在的网页结构。可以通过打开发地价格行情网页,查看网页的源代码来分析。一般来说,每个蔬菜价格信息都会包含在一个HTML标签中,可以通过查找这个标签来筛选出所需的信息。 然后,使用Python编写代码来发送HTTP请求并获取价格行情网页的内容。可以使用requests库的get方法来发送GET请求,并使用其返回的response对象的text属性来获取网页的内容。 接着,使用beautifulsoup库来解析网页的内容。可以使用beautifulsoup库的BeautifulSoup类来初始化一个解析器对象,并使用其find_all方法来查找指定的HTML标签。通过查找所需标签,可以获取到蔬菜的名称和对应的价格信息。 最后,将获取到的价格信息进行整理和格式化,并保存到文件中或者打印出来。 需要注意的是,爬取网页的过程中需要注意遵守相关的法律法规,并尊重网站的使用规则,不要对网站进行过多的频繁请求,以免给网站带来压力。 通过以上步骤,就可以用Python爬取发地价格行情了。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值