关于爬虫爬取图片时,url地址中有转义字符/的处理方法。

从昨晚开始我就开始在爬取某个壁纸网站,一直到刚才才成功了。代码写的很快。但是,到了解析代码时遇到了问题。首先就是解析出源码中的url,这里我有点犯懵,好不容易得到了url,却发现了这个。。。。(经验不够,花的时间太多)
在这里插入图片描述
这里是的问题就是url中出现了转义。当时没注意源码中的url,运行后就出现了这样的错误。

在这里插入图片描述
当时还不知道这个问题所在,只知道url出来问题,一查,知道了,其中的转义不能被执行访问,有趣的是我用那个url在浏览器中是可以访问的。至于原因,大概就是浏览器可以解析吧。。。

今天早上在查找资料和思考之后,找到了解决办法。

url = src.replace('\/','/') # 通过对转义字符的替换,获取到正常的图片地址

通过replace对得到的url字符串进行替换。当然这里的替换值可以换成其他的转义字符等等。

替换后,成功得到自己想要的可以直接访问的url地址。

在这里插入图片描述

至此,问题解决。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值