使用 easyofd 解析ofd 文件

本文介绍了OFD格式作为PDF的国产替代,在国内特定场景中应用广泛。文章详细展示了如何通过easyofd库进行OFD文件的读取、转换为PDF和图片,并提到了easyofd提供的Windows客户端程序,无需编程即可使用。
摘要由CSDN通过智能技术生成

使用 easyofd 解析ofd 文件

关于 OFD 格式

OFD 格式简单来说是PDF的国产替代。目前只有国内一定范围内在用,所以相对应的工具库还比较少。

安装easyofd

pip 安装

pip install easyofd

github 源码地址

git clone https://github.com/renoyuan/easyofd.git

使用easyofd

ofd 转pfd

import base64
import json
from PIL import Image

from easyofd.ofd import OFD

with open(r"增值税电子专票5.ofd","rb") as f:
    ofdb64 = str(base64.b64encode(f.read()),"utf-8")
    ofd = OFD() # 初始化OFD 工具类
    ofd.read(ofdb64,save_xml=False, xml_name="testxml") # 读取ofdb64
    # print(ofd.data) # ofd.data 为程序解析结果
    pdf_bytes = ofd.to_pdf() # 转pdf
   
    ofd.del_data()
    
    with open(r"增值税电子专票5.pdf","wb") as f:
        f.write(pdf_bytes)

ofd转图片

import base64
import json
from PIL import Image

from easyofd.ofd import OFD


with open(r"增值税电子专票5.ofd","rb") as f:
        ofdb64 = str(base64.b64encode(f.read()),"utf-8")
    ofd = OFD() # 初始化OFD 工具类
    ofd.read(ofdb64,save_xml=False, xml_name="testxml") # 读取ofdb64
    # print(ofd.data) # ofd.data 为程序解析结果
    img_np = ofd.to_jpg() # 转图片
    ofd.del_data()
    for idx, img in enumerate(img_np):
        im = Image.fromarray(img)
        im.save(f"test_img{idx}.jpg")

客户端

easyofd 有一个windows客户端 程序可以不需要代码直接使用

下载地址:https://github.com/renoyuan/easyofd/releases

在这里插入图片描述

  • 9
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
你可以使用第三方库来解析OFD(Open Financial Data)文件。一个常用的Java库是Apache PDFBox,它支持解析和处理PDF文件,而OFD文件可以通过将其转换为PDF格式来解析。 首先,你需要将OFD文件转换为PDF格式。这可以通过使用OFD转换工具来完成,例如OFD Reader(https://github.com/Trisia/ofdReader)。 一旦你将OFD文件转换为PDF格式,你就可以使用Apache PDFBox来解析和提取其中的内容。你可以使用PDFBox的文档对象模型(DOM)来访问文本、图像等元素。 下面是一个简单示例,演示如何使用Apache PDFBox解析PDF文件: ```java import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.text.PDFTextStripper; public class OFDParser { public static void main(String[] args) { try { PDDocument document = PDDocument.load(new File("path/to/your/converted/pdf/file.pdf")); PDFTextStripper stripper = new PDFTextStripper(); String text = stripper.getText(document); System.out.println(text); document.close(); } catch (IOException e) { e.printStackTrace(); } } } ``` 这个示例将打开转换后的PDF文件并提取其中的文本内容。你可以根据需要进一步处理和解析这些内容。 请注意,OFD文件可能包含更复杂的结构和元素,如表格、图形等。你可能需要使用更高级的PDF处理库来处理这些元素,或者自行编写代码来解析OFD文件的结构。 希望这个示例能帮助到你开始解析OFD文件。如果你需要更详细的解析或其他功能,建议查阅相关文档或寻找更专业的OFD处理库。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值