mycc-CSDN博客

翻译 calibre的recipe接口(API)之——参数设置

Calibre能够通过用python编写一些简单的recipe，实现抓取网上的RSS，html等页面，生成多种格式的电子书，但有关的说明比较少，在calibre手册中只有英文的，做为学习，本人翻译了这篇东西，对学习calibre的recipe编写有一定帮助。本文翻译了calibre手册中有关recipe的API接口的参数设置部分。由于是直接从BasicNewsRecipe类的源文件news.py中翻译，和接口文档中的按字母排列的顺序不相同，且多一个参数。

2016-03-05 15:03:58 4119

原创处理某些目录网页不能被calibre解析的方法

编写calibre的recipe脚本，来下载并制作电子书是一个很方便而适用的好方法。但有的时候也会让你觉得郁闷的要命。面对一个书的目录页面，无论你如何修改recipe程序，calibre就是无法正确地解析页面，形成下载的种子。　　仔细分析后发现，这些页面多数都是有一些特殊的字符或者处理办法，目的就是干扰使用程序自动下载图书。页面是在网站上的，我们无法进行修改和处理。那么是不是就没有办法还下载了

2016-07-20 09:22:13 1177 1

原创抓取的图片的URL中有中文字的问题

在reader365网站抓取电子书，编写了一个recipe，运行calibre后，抓下的书中只有文字，而没有图片，而对文物而言，图片也是重要的内容，于是花了很大的力气去查找recipe编写的问题，经过跟踪程序的执行，终于发现，网页中的图片，都使用了中文名，如：http://www.readers365.com/wenhua/wh095/图1 仰韶文化蚌壳摆塑龙虎与人骨平面图.jpg，而calibr

2016-05-04 11:42:52 1077

原创用calibre脚本抓取ipdf的epub 3.0.1规范

用calibre脚本抓取ipdf的epub 3.0.1规范转载▼　　Epub规范已经更新到了3.0.1版本，一直以来都有是在ipdf网站在线浏览，该网站没有提供下载，有时阅读和查找时总觉不是很方便。　　该规范包含EPUB 3 Overview Publications 3.0.1

2016-04-22 15:40:48 1259

原创 calibre命令行下的编码问题

编写完calibre的recipe后，有两种方法来执行，一种是通过calibre ebook management中的抓取新闻按纽-添加自定义新闻源来，再通过定期新闻下载，选项中添加的recipe来执行。另一种方法是通过cmd命令行来执行。但每次通过命令行执行时，因为编码问题，总是会提示'你必须设置你的控制台的字体为lucida console或consolas或者其它的字体，以便看到到该文本'，

2016-04-19 18:47:22 1361

原创 calibre recipe抓取中没有注意的空格

编写了几次recipe抓取网页上的内容，这次发现抓取中总是出现某些网页下载失败，因为calibre的出错信息比较简单，无法进行进一步的判断。出错信息如图：如果程序有错，那么实际上其它的章节都下载正常。经过反复的查看，发现每次都是每一，五，九章节下载出错，重复性很一致。问题如果不是程序，那么应该是页面的代码有什么不一样，可每次用浏览器打开相应章节页面均正常，没有出错，而且

2016-04-06 09:58:34 1154

原创李峤诗200首的抓取

从网上下载了李峤的200首诗作，做成了电子书。

2016-03-18 09:43:38 781

原创 calibre抓取“爱上中文”网小说的recipe

就是一个用calibre抓取“爱上中文”网的书籍的recipe。

2016-03-14 13:34:22 2461

原创用calibre抓取凤凰网的书评

搞了个recipe，用calibre抓取了凤凰网的书评，生成了epub电子书，当然，也可以生成chm、pdf、mobi等其它格式。

2016-03-09 09:02:59 1431

原创以cochrane抓取recipe为例，谈谈recursions参数的作用

以cochrane抓取recipe为例，谈谈recursions参数的作用转载▼ 前面“calibre抓取cochrance handbook的recipe”一文，用多卷的方式，实现了Cochrane Handbook for Systematic Reviews of Interventions电子书的抓取。其实，如果使用recursions参数

2016-03-05 15:26:22 630