需求分析
昨天和妹子聊天,她说她现在很苦恼,“仙草哥哥,我最近没有头像可以用了。”
我感到了非常不可思议,我说,“你不是天天都换头像吗?怎么会没有头像用了呢?”
她说,“仙草哥哥你是笨蛋吗?就是因为天天都要换新头像,好看的头像都用光了,所以才没有头像可以用了啊!”
我说,“那也不要紧啊,你把去年的历史头像每个再用一天,不就又可以够用一年了吗?”
妹子非常不开心,“哼,和你这种直男没什么可聊的。”,然后她就不理我了
怎么办,为了能让妹子开心起来,就做一个能够爬取头像的爬虫程序吧!
实现分析
虽然我之前在文章中还从没写过图片的爬取,但是实际上图片的爬取也很简单,和普通的爬虫程序没有很大的区别
最大的不同在于,一般在爬取一个页面的时候,都是通过r.text直接获取到解码后的文本内容。但是如果你要保存一个图片,就不需要对其解码了,只要把二进制的响应内容,原封不动的保存下来就可以了,使用r.content就可以满足了
其他的和普通的爬虫程序一样,也还是先发起请求,提取出图片地址,然后对图片发起请求,保存二进制的响应内容
不过这次在爬取的时候,也遇到了一点小的困难。直接使用r.text的解码是错误的,也就是说,我们的requests错误的判断了编码,这种时候怎么办呢?不要着急,我们可以先去查看一下浏览器是使用什么编码去解析的,如图所示