如何批量获取网页中的下载链接

tips:下载 chrome json 正则表达式


前言

我们经常会遇到要批量下载网页中的某些内容的需求,挨个机械的点击,会浪费我们宝贵的生命,下边交大家如何批量获取网页中的下载链接。


提示:需要chrome浏览器

打开你要下载的网页

示例:
在这里插入图片描述
可以看到 点击下载按钮会获取一个下载的链接。

二、获取网页的json数据

1.获取网页的源码

按ctr+u 调取到网页的源代码

2、选取json

选择all里面的listUserMaterialByGroupId…… 有右键点击 并选择 open in new tab
在这里插入图片描述

3、获取json字符串

将新tab里的字符串复制出来
并将json字符串外边包裹的函数去掉
在这里插入图片描述
如图片中删除函数的头部,在字符串的最后要删除“)”

4、使得字符串更易读取

打开网页 json.cn
将去掉外包函数的json字符串,粘贴到左侧。右侧会显示出来整齐划一的代码
在这里插入图片描述

5、正则表达式获取下载链接

打开正则表达式在线使用网站 https://c.runoob.com/front-end/854
将json整理好的代码复制过来,并填上正则表达式过滤,在输出栏 就是想要的下载链接了
在这里插入图片描述

总结

获取链接之后,就可以用下载工具批量直接下载所需要的问题件了。

如果觉得上述操作太麻烦,可以使用现有的下载工具 chrono,在网页上直接嗅探,选取文件类型,就可以直接下载了。
在这里插入图片描述

只是举例说明,请自行理解 1 下载1-79shtml文件 2 从shtml文件中提取所有swf文件的路径,到生成的“格temp.txt”文件中 3 替换这些shtml文件中的swf路径为本目录路径,即用“src="http://images.enet.com.cn/eschool/dogame1/”替换为“” 用“"movie" value="http://images.enet.com.cn/eschool/dogame1/”替换为“” 4 将“格temp.txt”文件更名为““格temp.lst”文件,并且用快车或者迅雷导入,下载到shtml文件所在的目录 5 将主目录页下载到shtml文件所在的目录,并且替换主目录页中的shtml文件的地址 6 可以点击主目录页,享受本地观看教程的方便 看我的操作吧,个人比较懒,别介意,哈哈! 你就下载贝 继续下,我就不点确定了,这里已经下载好了,请看 接下载提取类似这个地址“http://images.enet.com.cn/eschool/dogame1/764599.swf” 实际上就是在每个文件中提取了“764599”这个数字,不过要先定位他的位置,并且加上前缀“http://images.enet.com.cn/eschool/dogame1/”和后缀".swf" 然后就去下载这些文件吧,不过之前我们再来替换掉这些shtml文件中的字符串,请看 注意先把格temp.txt放到其他地方去,因为替换的时候可能会破毁掉它原来提取出来的东西 ok了,去下载swf文件吧,这里我也下载好了,然后就是看效果了 对了还要替换主目录页中的shtml文件的地址 后面这些忘了下了。。。 所以没有对应的文件。。。,swf文件当然也没有了 zhangyb 20080905
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值