从包含大量以数字编号的pdf论文中找到想要的论文

import os
import fitz  # PyMuPDF

def find_paper(directory, target_title):
    for filename in os.listdir(directory):
        if filename.endswith('.pdf'):
            file_path = os.path.join(directory, filename)
            print(f"Reading file: {filename}")  # 添加调试信息
            try:
                doc = fitz.open(file_path)
                first_page = doc.load_page(0)
                text = first_page.get_text()
                #print(f"Text from the first page of {filename}:\n{text}\n")  # 打印第一页的文本
                if text and target_title.lower() in text.lower():
                    print(f"Found '{target_title}' in file: {filename}")
                    return filename
            except Exception as e:
                print(f"Could not read file {filename}: {e}")
    print(f"'{target_title}' not found in any PDF file.")
    return None

directory = 'path_to_your_pdf_files'  # 替换为你存储PDF文件的目录路径
target_title = 'ABC_Net'  #替换为你要找的文章名
found_file = find_paper(directory, target_title)

if found_file:
    print(f"Paper found: {found_file}")
else:
    print("Paper not found.")

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值