爬取官网必应壁纸
简单的爬取https://cn.bing.com/
。
业余python学习,单纯脚本式一行一行执行而已,没有什么函数结构,也没有判断执行是否成功。
环境:
64位 Python 3.7.9
64位 Win10
查看源码,分析图片链接地址
看出链接地址在link标签href属性中,通过soup.find_all(name="link",attrs={"as":"image"})[0]['href']
获取到href内容。
链接地址的拼接
将https://cn.bing.com/
与href
属性内容拼接,得到完整图片地址链接。
第三方库
requests
beautifulsoup
完整代码