Jupyder爬取动态网页（北京新发地）

最新推荐文章于 2024-07-20 17:12:48 发布

山山唯落晖.239

最新推荐文章于 2024-07-20 17:12:48 发布

阅读量178

点赞数

分类专栏： python爬虫文章标签： python pandas

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_72091051/article/details/132844987

版权

python爬虫专栏收录该内容

2 篇文章 0 订阅

订阅专栏

导入所需的库和模块，如requests、json等。这些库可以帮助你发送HTTP请求和解析HTML页面。
使用requests库发送一个GET请求到新发地的网站，获取网页的内容。
提取所需的价格信息，并进行处理或存储，以便后续使用。

完整代码

#导入需要的库
import requests
import json
import pandas as pd

#获取网页
rq=requests.get('http://www.xinfadi.com.cn/getCat.html').content.decode('utf-8')
rq

type(rq)

data=json.loads(rq)
data

data['list']

#提取需要的信息
b=[i['prodName'] for i in data['list']]
b

c=[i['pubDate'] for i in data['list']]
c

d=[i['avgPrice'] for i in data['list']]
d

e=[i['highPrice'] for i in data['list']]
e

f=[i['lowPrice'] for i in data['list']]
f

python=pd.DataFrame({'菜名':b,'发布日期':c,'平均价':d,'最高价':e,'最低价':f})
python

山山唯落晖.239

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Jupyder爬取动态网页（北京新发地）

Jupyder爬取动态网页（北京新发地）
复制链接

扫一扫

专栏目录

山山唯落晖.239 CSDN认证博客专家 CSDN认证企业博客

码龄2年

2: 原创

129万+: 周排名

109万+: 总排名

1119: 访问

: 等级

26: 积分

142: 粉丝

5: 获赞

2: 评论

12: 收藏

私信

关注

热门文章

分类专栏

python爬虫 2篇

最新评论

jupyter进行翻页爬取（人民邮电出版社）
qq_34852427: 大佬厉害本人纯小白，想问一下第2步那个网址是怎么来的呀，我从北邮出版社进去的网址不是这样的呀
jupyter进行翻页爬取（人民邮电出版社）
CSDN-Ada助手: 非常棒的博客！你的标题和摘要给人一种探索新知识的感觉。继续创作下去，你一定能收获更多的技能和知识。在你的博文中，你提到了分页爬取网页信息的技巧，这是非常实用的。除了这个技巧，还有一些扩展的知识和技能可以帮助你更好地进行爬取。例如，你可以学习如何使用代理IP来应对反爬机制，或者学习如何使用多线程或异步操作来提高爬取效率。此外，了解如何处理动态加载的网页内容也是很有用的，可以使用Selenium等工具来模拟浏览器行为进行爬取。希望你能在未来的博文中分享更多关于爬虫的技巧和经验。加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

jupyter进行翻页爬取（人民邮电出版社）

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。