扫描双面打印纸张文档所创建的PDF可能包含空白页面,有时候空白页也可能是有意插入的。 在本文中,您将学习如何使用Spire.PDF检测并删除PDF文件中的空白页面。
空白页面通常被定义为不包含任何内容的页面。 Spire.PDF提供了一个方法IsBank来检测PDF页面是否绝对空白。 但是,一些“空白页”实际上可以包含白色图像,使用IsBank方法不会将其视为空白。 要检测这些白色但不是空白页面,我们创建了自定义方法IsImageBlank。
注意:此解决方案必须应用许可证才能完成,如果你没有授权,请联系客服获取临时的许可证。static void Main(string[] args)
{
//应用许可证(license)
Spire.License.LicenseProvider.SetLicenseFileName("license.elic.xml");
//创建PdfDocument对象
PdfDocument document = new PdfDocument();
//加载PDF文档
document.LoadFromFile("sample.pdf");
//遍历每一页
for (int i = document.Pages.Count - 1; i >= 0; i--)
{
//判读是否为空白页
if (document.Pages[i].IsBlank())
{
//删除空白页
document.Pages.RemoveAt(i);
}
else
{
//若非空白页,将页面转换为图片
Image image = document.SaveAsImage(i, PdfImageType.Bitmap);
//判断图片是否为空白
if (IsImageBlank(image))
{
//若图片为空白,删除对应的PDF页
document.Pages.RemoveAt(i);
}
}
}
//保存文档
document.SaveToFile("output.pdf", FileFormat.PDF);
}
//判断图片是否为空白
/public static bool IsImageBlank(Image image)
{
Bitmap bitmap = new Bitmap(image);
for (int i = 0; i
{
for (int j = 0; j
{
Color pixel = bitmap.GetPixel(i, j);
if (pixel.R
{
return false;
}
}
}
return true;
}
效果图:
标签:文档管理PDF文档处理
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,尊重他人劳动成果
0
好文不易,鼓励一下吧!