忙活了一天,PDF转epub基本成功

本文分享了作者如何从互联网获取有价值信息,通过使用epublib和PDFbox库将非扫描、带书签的PDF文件转换为适合移动设备阅读的Epub格式电子书的过程。成功生成并上传到网站后,通过手机端下载,实现正常阅读,迈出知识库建设的重要一步。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前人肯定做过,从github上找了几个类似的项目,java的,python的,C++和ruby的都有。我扒了一个Java的下来,几乎很难不费任何吹灰之力的跑起来,总得看看改改,一个个坑趟过去。大致明白过程后,还是决定自己写一个,方便以后不断修改完善。

于是采用epublib和PDFbox,200行代码,基本逻辑实现了,目前只支持非扫描的、带书签的PDF文件,我称之为规范PDF。成功生成后,上传到网站,然后从手机端下载,能正常打开阅读。实现了第一步。

以后需要对PDF中的代码格式化,epub需要支持图片和css。

总而言之,我的目标是从网上扒拉那些有价值的信息,进行加工整理,称为适合在移动终端上阅读的电子书。

让知识库强大起来,把知识装进口袋里。


转载于:https://www.cnblogs.com/xiuquan/p/5483674.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值