从昨晚开始我就开始在爬取某个壁纸网站,一直到刚才才成功了。代码写的很快。但是,到了解析代码时遇到了问题。首先就是解析出源码中的url,这里我有点犯懵,好不容易得到了url,却发现了这个。。。。(经验不够,花的时间太多)
这里是的问题就是url中出现了转义。当时没注意源码中的url,运行后就出现了这样的错误。
当时还不知道这个问题所在,只知道url出来问题,一查,知道了,其中的转义不能被执行访问,有趣的是我用那个url在浏览器中是可以访问的。至于原因,大概就是浏览器可以解析吧。。。
今天早上在查找资料和思考之后,找到了解决办法。
url = src.replace('\/','/') # 通过对转义字符的替换,获取到正常的图片地址
通过replace对得到的url字符串进行替换。当然这里的替换值可以换成其他的转义字符等等。
替换后,成功得到自己想要的可以直接访问的url地址。
至此,问题解决。