python 宝可梦_python爬虫（一）

最新推荐文章于 2024-06-18 09:36:52 发布

weixin_39586649

最新推荐文章于 2024-06-18 09:36:52 发布

阅读量655

点赞数

文章标签： python 宝可梦

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39586649/article/details/113495446

版权

举个栗子，试着爬一下宝可梦图鉴的图片，在https://cn.portal-pokemon.com/play/pokedex/

数据是前后端分离的便于获取数据。

在PM图鉴上取到json数据，形容下图，file_name是我们需要的图片地址，但是缺少文件头

837ff53bbe8d

image.png

于是查看图片，发现图片的前部拼接头。

837ff53bbe8d

image.png

于是把图片前部拼接头加上域名前缀，就获得了图片的原始路径，形如https://cn.portal-pokemon.com/play/resources/pokedex/img/pm/cf47f9fac4ed3037ff2a8ea83204e32aff8fb5f3.png

这边采用的方法先决定用保存的json文件，提取数据保存，再做图片下载，代码如下：

import json

构造对象

class pokemons(object):

def init(self,zukan_id,zukan_sub_id,pokemon_name,pokemon_sub_name,weight,height,file_name,pokemon_type_id,pokemon_type_name):

self.zukan_id = zukan_id

self.zukan_sub_id = zukan_sub_id

self.pokemon_name = pokemon_name

self.pokemon_sub_name = pokemon_sub_name

self.weight = weight

self.height = height

self.file_name = file_name

self.pokemon_type_id = pokemon_type_id

self.pokemon_type_name = pokemon_type_name

打开json文件，解析file_name

with open('pp1.json', 'r', encoding='utf-8') as f:

data = json.load(f)

拼接图片文件头，存放在list里面

headurl = 'https://cn.portal-pokemon.com/play/resources/pokedex'

result = ""

for i in range(len(data)):

data[i]['file_name'] = headurl + data[i]['file_name']

result = result + data[i]['file_name'] + '\n'

把读取到的result写入文件中

with open('bf.txt', 'a', encoding='utf-8') as bf:

print(bf.write(result))

提取数据后，保存的文件效果

837ff53bbe8d

image.png

weixin_39586649

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python 宝可梦_python爬虫（一）

举个栗子，试着爬一下宝可梦图鉴的图片，在https://cn.portal-pokemon.com/play/pokedex/数据是前后端分离的便于获取数据。在PM图鉴上取到json数据，形容下图，file_name是我们需要的图片地址，但是缺少文件头image.png于是查看图片，发现图片的前部拼接头。image.png于是把图片前部拼接头加上域名前缀，就获得了图片的原始路径，形如https:/...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。