【NETCore】检查pdf第几页是否包含字符串

业务需要,谷歌翻译了一批pdf文章,存在部分因网络等不可抗因素的原因没翻译起的情况

[平台] Net 6.0

[插件]Spire.Pdf

以下是主要代码

/// <summary>
        /// 检查PDF
        /// </summary>
        /// <param name="pdfPath">需要检查的PDF完整路径</param>
        /// <param name="searchText">需要检查的字符串</param>
        /// <returns>文件中是否存在该字符串</returns>
        static bool ContainsTextOnFirstPage(string pdfPath, string searchText)
        {
            using (PdfDocument pdfDocument = new PdfDocument())
            {
                pdfDocument.LoadFromFile(pdfPath);

                PdfPageBase firstPage = pdfDocument.Pages[0];
                PdfTextFindCollection result = firstPage.FindText(searchText, TextFindParameter.WholeWord);
                // 检查是否找到指定文字
                return result.Finds.Count() > 0;
            }
        }

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我是小白一个

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值