python 爬虫系列（二）网站特定json列表获取

最新推荐文章于 2025-02-19 09:00:00 发布

小墨工作室

最新推荐文章于 2025-02-19 09:00:00 发布

阅读量1.6k

点赞数

分类专栏：爬虫 python 文章标签： python 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kkshuaicc/article/details/105761031

版权

python 同时被 2 个专栏收录

16 篇文章

订阅专栏

3 篇文章

订阅专栏

python爬虫爬取特定网址，主要是为了获取相应的数据，之前是介绍的如何获取网站源码，然而，特定的数据是通过的特定的json格式保存在相应的链接中，所以，找到相应的链接获取

我们以WEGAME为例，网址为：https://www.wegame.com.cn/store/26/lol

随便打开一个英雄联盟的商店，然后右键+检查，点击Network，ctrl+R

搜索到游戏评论的json链接，按照Request URL打开链接，得到

相应的爬取代码

import requests
from bs4 import BeautifulSoup as BS

import re
import json


headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36'}
url ='https://www.wegame.com.cn/api/webd/comment/game_top_tags.fcg?topicid=26&appid=100'
h = 'https://www.wegame.com.cn'
response = requests.get(url, headers=headers)
json_page = json.loads(response.text)
print(json_page)
print(json_page['data'][0]['gameid'])

相应的输出结果如下

小墨工作室

博客等级

码龄12年

38
原创

100
点赞

841
收藏

67
粉丝

关注

私信

分类专栏

moviepy 1篇
flask 5篇
centos7 1篇
云开发 1篇
php 1篇
爬虫 3篇
openid 1篇
微信小程序 21篇
python 16篇

最新评论

python 爬虫系列（二）网站特定json列表获取
m0_69469527: 在request URL打开链接，得到‘不支持的请求方法怎么办’？
微信小程序云数据库实现登录
Bayern Yang: 找到问题了你改一下你的数据库name字段的类型用string就可以了
微信小程序云数据库实现登录
Bayern Yang: 我也遇到了这个问题你现在解决了吗？？？
微信小程序云数据库实现登录
深蓝色渐入海洋: 你好，我运行输入账号密码后一直显示用户名错误，控制台提示创建数据库索引，创建之后也不能实现页面跳转，这是查询语句的问题还是数据库连接的问题
微信小程序云数据库实现登录
Griffin5: 想请问一下，登录实验以后小程序后台关闭后重启小程序，就又要重新登录，也样可以实现一次登录就可以一直记得账号

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。