ceb转pdf

格式简介

CEB格式是由北大方正公司独立开发的电子书格式,由于在文档转换过程中采用了“高保真”技术,
从而可以使CEB格式的电子书最大限度地保持原来的样式。正是基于这种特点,不少电子书发行机构
和数字化图书馆都已经开始采用这种格式,国家有关部门还把CEB格式作为电子公文传递的标准格
式。方正Apabi Reader(阿帕比)是CEB格式的指定阅读软件,Apabi Reader还具有字体缩放、书签、
作笔记、书籍管理、翻译和文字部分拷贝功能,能尽量符合广大读者传统的阅读习惯。
(备注:方正的加密过了。所以方正的CEB文件只能找方正要。本文只对未加密的ceb转换)

ceb转pdf

using (Process myPro = new Process()){
                        myPro.StartInfo.FileName = @"cmd.exe";
                        myPro.StartInfo.UseShellExecute = false;
                        myPro.StartInfo.RedirectStandardInput = true;
                        myPro.StartInfo.RedirectStandardOutput = true;
                        myPro.StartInfo.RedirectStandardError = true;
                        myPro.StartInfo.CreateNoWindow = true;
                        myPro.Start();
                        //如果调用程序路径中有空格时,cmd命令执行失败,可以用双引号括起来 ,在这里两个引号表示一个引号(转义)
                        string str = string.Format(@"C:\Users\admin\Documents\WXWork\1688851570132435\Cache\File\2019-05\ceb2pdf.exe");
                        myPro.StandardInput.WriteLine(str);
                        myPro.StandardInput.AutoFlush = true;
                        //参数格式 “c D:\\1.ceb D:\\1.pdf”
                        myPro.StandardInput.WriteLine(url);
                        myPro.WaitForExit();
                        result = true;
                    }

exe文件链接

https://download.csdn.net/download/q_17600689511/11175064

Python中有一些库可以帮助你将PDF文件转换CEB(Comma Separated Values)格式,这是一种文本文件格式,数据以逗号分隔。常用的库包括`tabula-py`和`pdfplumber`。 `tabula-py`主要用于从PDF表格中提取数据,而`pdfplumber`则可以解析PDF文档的文本内容。下面是使用这两个库进行PDFCEB的基本步骤: **使用`tabula-py`:** 1. 安装tabula-py: `pip install tabula-py` 2. 读取PDF转换: ```python from tabula import read_pdf # 假设pdf_path是PDF文件路径 tables = read_pdf(pdf_path, pages='all') # 如果需要特定页面,替换'all'为页码 data = [] for table in tables: data.extend(table.to_csv(index=False)) # 将每张表的数据添加到列表中 with open('output_ceb.csv', 'w', newline='') as f: writer = csv.writer(f) writer.writerow(['Column1', 'Column2', ...]) # 根据实际表头写入列名 writer.writerows(data) ``` **使用`pdfplumber`:** 1. 安装pdfplumber: `pip install pdfplumber` 2. 解析PDF文本: ```python from pdfplumber import PDF with PDF(pdf_path) as pdf: data_rows = [] for page in pdf.pages: text = page.extract_text() # 提取页面文本 # 在这里,你可以使用正则表达式或字符串处理方法将文本分割成行,并转换为CSV格式 # 示例:row_data = [text.strip().split(',') for text in text.split('\n')] row_data = process_text(text) # 自定义函数处理文本 data_rows.extend(row_data) with open('output_ceb.csv', 'w', newline='') as f: writer = csv.writer(f) writer.writerow(['Column1', 'Column2', ...])
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值