【GitHub探索】ebook-boilerplate——批量转markdown为PDF和电子书

正值十一假期,近期准备把自己的python笔记精编整理,做一个pdf电子书。在调研如何把多个markdown文档转化为单个pdf的时候,试了很多种方法。最后找到了最佳方案,也就是本文的主角,由phodal前辈整理的电子书生成项目ebook-boilerplate。这个项目不仅支持批量转markdownpdf,而且还支持转成ebook等多种格式。

使用这个项目的时候,也踩了一些坑,需要做一些额外的配置。以笔者的场景为例,电子书生成环境是Ubuntu22,需要转化一堆中文的markdownclone了这个项目之后,除了ebook-boilerplate本身README.md里描述的内容之外,实际还需要留意以下环节:

第一块是pandoctexlive的环境,最好是官网下载最新的版本,apt里面的版本已经过时了。尤其是texliveapt拿到的版本很多宏库都没有,得要用官网最新的install脚本才会自动把各种package都装上。

然后是生成pdf的操作里,需要指定一种支持中文的tex-engine,笔者是选择了xelatex。需要在makefilepandoc生成pdf那块做修改:

pdf: markdown
	pandoc -s $(filename).md -o $(filename).pdf \
		--title-prefix $(title) \
		--listings -H listings-setup.tex \
		--template=template/template.tex \
		--pdf-engine=xelatex \  # 加这一行,声明pdf-engine
		--toc

之后,markdown生成pdf的步骤,实际是把所有markdown内容按文件名顺序(可以用数字标识组织一下)拼接在一起,然后用toc按照markdown的标题文本(h1h2之类)生成目录,最后再生成pdf。这里有一个问题,就是我们每一章都要分页,而在markdown里标识分页的html标签<div STYLE="page-break-after: always;"></div>tex-engine下面,是没法出分页的效果的。这种情况下的解决方案是:把这个标签换成\newpage,这样tex-engine就能识别了。也就是说,你的md文件的内容应该是:

# 1.1 xxx.md

# 上面忽略你的markdown正文

\newpage

再之后,我们可以修改listings-setup.tex以及template/template.tex里的内容,去修改代码高亮跟正文的排版参数。以笔者的观感为例,这里面的内容编辑了以下几个部分:

  • 代码高亮,即listings-setupbasicstyle设置字号为\small
  • template.tex里,取消对于中文刊物习惯的设置,正文字号为9pt,行距调整为1.1
  • xelatex下,中文字体为Noto Sans CJK SC,默认字体为Helvetica。当然,如果你喜欢衬线Serif字体,也都得调整成衬线的形式。

最后就是各种调试勘误,生成最后的文档了。

当然,一开始所说的,笔者精心整理的python笔记,现在也已出炉。各位读者可以阅读这篇文章以获取资源。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值