前不久才接触python语言,随着学习的加深,才接触到爬虫这个东西。以前就听过实用工具就可以下载bing首页的背景图片,然后设置成墙纸,但一直不清楚是怎么实现的,现在才知道用python语言很容易据可以实现。网上找了很多,大多都是python2的,有些模块用不了,所以就用python3试了下,结果很满意。
通过观察,首页图片都是通过一个js加载的,http://cn.bing.com/HPImageArchive.aspx?format=js&idx=0&n=1&nc=1490537646012&pid=hp&video=1
idx=0表示第一站,可以更改数字,n必须等于1,否则就加载不了,后面的值就随便了。
打开这个链接就可以看到图片的真正地址
#!/usr/bin/python3
# coding:utf-8
# python3抓取bing主页所有背景图片
import urllib.request,re,sys,os
def get_bing_backphoto():
if (os.path.exists('pictures')== False):
os.mkdir('pictures') #设置图片下载路径,默认是文件的当前路径
for i in range(0,10):
url = 'http://cn.bing.com/HPImageArchive.aspx?format=js&idx='+str(i)+'&n=1&nc=1361089515117&FORM=HYLH1'
html = urllib.request.urlopen(url).read()
if html == 'null':
print( 'open & read bing error!')
sys.exit(-1)
html = html.decode('utf-8')
html = html.replace('/az/','http://cn.bing.com/az/')
reg = re.compile('"url":"(.*?)","urlbase"',re.S)
text = re.findall(reg,html)
for imgurl in text :
right = imgurl.rindex('/')
print(imgurl)
name = imgurl.replace(imgurl[:right+1],'')
savepath = 'pictures/'+ name
urllib.request.urlretrieve(imgurl, savepath)
print (name + ' save success!')
get_bing_backphoto()
下面有图有真相!