在收集资料的时候,经常会碰到一些带水印的资料
很难受
emmmmm怎么办
用matlab!
首先将pdf转换成图片
然后
上网上找了一个代码改了一下
for page=1:44
filename = strcat('2019张宇基础班讲义高数上_',num2str(page),'.bmp');
img=imread(filename);
img3=im2bw(img,220/255);
imwrite(img3,strcat('F:\考研\01 高等数学【完】\00 讲义\',filename));
disp(strcat('去水印完成第',num2str(page),'张'));
end
原理是阈值分割
但是转化效果不行,因为水印太深,导致无法正常分割
调整了一下阈值参数
175/255
大量字体被锐化,模糊不清
然后我就想到了一个办法
我找到了一张字体和水印不连在一起的
用ps吧多余字体抹掉了
就是这样
然后改代码
img_2 = imread('水印.bmp');
for page=1:44
filename = strcat('2019张宇基础班讲义高数上_',num2str(page),'.bmp');
img=imread(filename);
img3=255-(img_2-img);
imwrite(img3,strcat('F:\考研\01 高等数学【完】\00 讲义\',filename));
disp(strcat('去水印完成第',num2str(page),'张'));
end
搞定!!!
嘻嘻
到这里我突然又想到,如果没有字和水印分开的呢
于是我选了个字和水印沾在一起的图片
强行p了一下
可以看见部分像素已经失去了
再去用matlab跑一下
emmm效果还行
成功!