Java使用正则表达式抓取Bing首页每日图片

本文介绍了使用Java通过正则表达式从Bing首页抓取每日特色图片的过程。首先分析网页结构,发现图片链接隐藏在JS脚本中。通过正则表达式`g_img={url: "(.+?)"}`提取链接,并添加前缀`http://cn.bing.com`获取完整URL。然后学习并应用Java文件操作,如判断文件是否存在、新建文件及写入二进制内容,将图片保存至本地。作者也提到,用Python的字符串查找方法能更简洁地实现相同功能。
摘要由CSDN通过智能技术生成

Java学习到了正则表达式,总想做点有用的东西,这两天想给电脑换壁纸,看到Bing每天的主页图片挺好看的,就寻思着抓下来。
第一步就是分析主页的结构了这个Bing的主页图片直接使用小箭头抓是抓不到的,在Network的Img里我们可以找到图片所在处:
找图片
把链接copy下来,在Element里面搜索我们边可以看到链接是在一个JS脚本里面的,这个时候就比较清楚我们要怎么搞了,
链接所在处
链接所在的那一片弄出来就是这个样子了

g_img={url: “/az/hprichbg/rb/LoxodontaAfricana_ZH-CN10434704249_1920x1080.jpg”}
把这个东东里的链接搞出来加上 http://cn.bing.com 就是我们需要的图片链接了,那么这个正则表达式写出来就是

"g_img=\\{
   url: \"([\\w_\\-/]+?\\.jpg)\""

我开始找的时候把后面的”}”加上去发现找不到链接&

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值