- 博客(11)
- 资源 (7)
- 收藏
- 关注
翻译 calibre的recipe接口(API)之——参数设置
Calibre能够通过用python编写一些简单的recipe,实现抓取网上的RSS,html等页面,生成多种格式的电子书,但有关的说明比较少,在calibre手册中只有英文的,做为学习,本人翻译了这篇东西,对学习calibre的recipe编写有一定帮助。本文翻译了calibre手册中有关recipe的API接口的参数设置部分。由于是直接从BasicNewsRecipe类的源文件news.py中翻译,和接口文档中的按字母排列的顺序不相同,且多一个参数。
2016-03-05 15:03:58 4119
原创 处理某些目录网页不能被calibre解析的方法
编写calibre的recipe脚本,来下载并制作电子书是一个很方便而适用的好方法。但有的时候也会让你觉得郁闷的要命。面对一个书的目录页面,无论你如何修改recipe程序,calibre就是无法正确地解析页面,形成下载的种子。 仔细分析后发现,这些页面多数都是有一些特殊的字符或者处理办法,目的就是干扰使用程序自动下载图书。页面是在网站上的,我们无法进行修改和处理。那么是不是就没有办法还下载了
2016-07-20 09:22:13 1177 1
原创 抓取的图片的URL中有中文字的问题
在reader365网站抓取电子书,编写了一个recipe,运行calibre后,抓下的书中只有文字,而没有图片,而对文物而言,图片也是重要的内容,于是花了很大的力气去查找recipe编写的问题,经过跟踪程序的执行,终于发现,网页中的图片,都使用了中文名,如:http://www.readers365.com/wenhua/wh095/图1 仰韶文化蚌壳摆塑龙虎与人骨平面图.jpg,而calibr
2016-05-04 11:42:52 1077
原创 用calibre脚本抓取ipdf的epub 3.0.1规范
用calibre脚本抓取ipdf的epub 3.0.1规范 转载▼ Epub规范已经更新到了3.0.1版本,一直以来都有是在ipdf网站在线浏览,该网站没有提供下载,有时阅读和查找时总觉不是很方便。 该规范包含EPUB 3 Overview Publications 3.0.1
2016-04-22 15:40:48 1259
原创 calibre命令行下的编码问题
编写完calibre的recipe后,有两种方法来执行,一种是通过calibre ebook management中的抓取新闻按纽-添加自定义新闻源来,再通过定期新闻下载,选项中添加的recipe来执行。另一种方法是通过cmd命令行来执行。但每次通过命令行执行时,因为编码问题,总是会提示'你必须设置你的控制台的字体为lucida console或consolas或者其它的字体,以便看到到该文本',
2016-04-19 18:47:22 1361
原创 calibre recipe抓取中没有注意的空格
编写了几次recipe抓取网页上的内容,这次发现抓取中总是出现某些网页下载失败,因为calibre的出错信息比较简单,无法进行进一步的判断。出错信息如图: 如果程序有错,那么实际上其它的章节都下载正常。经过反复的查看,发现每次都是每一,五,九章节下载出错,重复性很一致。问题如果不是程序,那么应该是页面的代码有什么不一样,可每次用浏览器打开相应章节页面均正常,没有出错,而且
2016-04-06 09:58:34 1154
原创 用calibre抓取凤凰网的书评
搞了个recipe,用calibre抓取了凤凰网的书评,生成了epub电子书,当然,也可以生成chm、pdf、mobi等其它格式。
2016-03-09 09:02:59 1431
原创 以cochrane抓取recipe为例,谈谈recursions参数的作用
以cochrane抓取recipe为例,谈谈recursions参数的作用 转载▼ 前面“calibre抓取cochrance handbook的recipe”一文,用多卷的方式,实现了Cochrane Handbook for Systematic Reviews of Interventions电子书的抓取。其实,如果使用recursions参数
2016-03-05 15:26:22 630
从www.mtime.com按分类批量生成电影资料库的脚本
2008-10-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人