bee君一直以来,对选用一个合适的微信头像,感到比较头疼。
今天bee君为大家推荐1000多张,非常惊艳的能用做微信头像的图片,都已按照类别分好类,文末提供下载方法,相信大家一定能从中找到一款自己喜欢的。
1 requests失败
使用requests请求微信表情图片网址https://www.zhihu.com/question/335825565, 同时使用web网页提取包:lxml,提取想要的所有图片链接地址,也就是下面的代码:
import requests
from lxml import etree
import pandas as pd
import re
url = 'https://www.zhihu.com/question/335825565'
with requests.get(url) as res:
content = res.content
print(content)
html = etree.HTML(content)
imgs = html.xpath('//figure//img/@src')
print(imgs)
这样直接运行,content的打印显示如下,并没有请求到想要的结果。
b'\r\n
400 Bad Request\r\n\r\n400 Bad Request
2 直接提取
换种直接的方法,打开网页https://www.zhihu.com/question/335825565,F12查看网页结构:
直接把此标签的全部内容copy到本地,并提取出所有图片的地址。
选中上面标签,右键->copy->copy element 直接把此标签的全部内容copy到本地,保存为wechat_pic.html
下一步,提取出所有图片的地址,直接使用python的正则模块提取就行。
第一步:导入用到的包
import os
import re
from urllib.request import urlopen
第二步~最后一步:读入上面复制的标签内容,使用正则表达式提取出需要的图片url,再使用urlopen从这个url下载图片文件,并保存到本地。这里面有一些细节问题,建议读者把代码下载后,跑跑试试。
with open('./data/wechat_pic.html',mode='r',errors='ignore') as f:
lines = f.readlines()
pic_urls = re.findall(r'
pic_urls = [pic for pic in pic_urls if pic.startswith('https')] # 只保留以https开头的地址
#pic_urls = set(pic_urls) # 直接使用set会打破原来顺序,因为原网页按照图片分类,所以直接使用set去重,效果不佳
downloaded = []
for i,url in enumerate(pic_urls):
if url in downloaded:
continue
print(f'{url}')
q=urlopen(url+'.jpg')
pic=q.read()
save = open('./data/wechat_pic/%d.jpg'%(i,),mode='w+b')
save.write(pic)
q.close()
save.close()
print(f'pic{i} saved!')
downloaded.append(url)