前几天,笔者从一个网站上下载了几千行图片的超链接EXCEL,上网寻找各种方法试着批量提取图片,总结网上的方法如下:
1、比较麻烦的方法(技术含量高)
用python写批量提取照片的程序语言,python读取excel中的图片超链接,批量下载到本地。python+excel_m0_46442609的博客-CSDN博客_批量下载excel超链接图片。这个方法对于审计人员来说,需要安装python,且要调试代码。这种方法不太推荐。
2、利用Excel自身宏进行提取
笔者看了一下,这种编写宏进行提取也是需要对程序进行调试,短期内不太科学。对于审计人员来说,用最少时间,达到最理想的效果才是最佳的途径,
3、利用数据抓取工具进行提取
笔者突然想到之前经常利用八爪鱼进行数据抓取。
链接:https://pan.baidu.com/s/1YmHqtb3zmS7hCFHsmjuZ8A
提取码请加我微信:xiaoguo20111101。
利用这个工具能快速批量提取照片,并且能够按照设定好的文件夹进行分裂整理。
4、使用图像比对软件进行批量比对。
按照传统的方式,图形比对需要逐个进行比对,比如1000张照片,需要比对1+2+3+...+999次,速度较慢。利用软件VSDuplicateImageFinderPro可以快速比对出图形相似程度,并且可以设置相似度比例。
不过这款软件是收费版,想要免费版的,可以加我微信。
具体审计使用场景:
在大数据审计中,利用图像批量提取技术以及批量进行图象比对,可以在费用真实性审查中进行使用,比如对于广告投放发生较大的项目,进行图象比对,发现图片存在重复利用。常见的舞弊场景有:
1、两张一模一样的照片。
2、一张照片是另外原图的局部。
3、用手机拍摄另外一部手机照片。
通过批量提取以及图象比对,可以在大数据审计中对费用的真实性进行审查。