都0202年了,还在找电脑壁纸资源吗?还在右键另存图片吗?还要自己费事费力做这些事情吗?好啦,现在有这个python程序,都省了。
因为我之前也在为找电脑壁纸资源而苦恼,一是没有好看的图片,二是没有什么特别好的固定地方让我下载图片,听说bing(必应)的首页好看,我这去一看,果不其然,漂亮,所以我就编写一个小爬虫来爬取这个图片,但是转念一想,每天都要手动运行吗?太难为人了(好吧,是我懒了),我就去找办法看看能不能每天定时执行这个程序,皇天不负有心人,找到了方法,而且不止一种,废话不多说了,下面进入正题。
手动分割线:
emm,昨天刚发的就要微调一下,我今天早上8点上电脑看看效果,然鹅突然发现国内版的bing要比国际版的bing更新的早,于是乎,我微调一下哈,大体结构是不会变的,就是 url 改了一下,代码已修改。——2020.01.03
文章目录
使用到的库,requests库 和 lxml库需要自己在cmd窗口里安装,下载安装命令在后面的括号里
requests (pip install requests)
lxml (pip install lxml)
datetime
time
运行环境
python版本:Anaconda3(python3)
编辑器:PyCharm
浏览器:Chrome
1.分析网页
bing有国际版和国内版之分,其实网页结构没有什么区别,只是一个中文一个英文而已,我这选择了国内版,国内版要比国际版更新更早,更符合国人的时间。
下面打开开发者工具(F12),分析具体的结构
下面这是正常的分析情况
但是那个背景图太难标记到了,换种思路
我们想个办法复制上图左侧列表中所找到的正确文件名,然后点击Elements这个按钮,接着按Ctrl+F键查找,得到其网页结构的位置
在上图箭头指着的位置右键,然后依次点击Copy —> Copy Xpath,复制它的Xpath路径。这样我们的代码就来了
2.爬取图片
首先请求主页面
url = "https://cn.bing.com"
rs =