自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (7)
  • 收藏
  • 关注

翻译 calibre的recipe接口(API)之——参数设置

Calibre能够通过用python编写一些简单的recipe,实现抓取网上的RSS,html等页面,生成多种格式的电子书,但有关的说明比较少,在calibre手册中只有英文的,做为学习,本人翻译了这篇东西,对学习calibre的recipe编写有一定帮助。本文翻译了calibre手册中有关recipe的API接口的参数设置部分。由于是直接从BasicNewsRecipe类的源文件news.py中翻译,和接口文档中的按字母排列的顺序不相同,且多一个参数。

2016-03-05 15:03:58 4039

原创 处理某些目录网页不能被calibre解析的方法

编写calibre的recipe脚本,来下载并制作电子书是一个很方便而适用的好方法。但有的时候也会让你觉得郁闷的要命。面对一个书的目录页面,无论你如何修改recipe程序,calibre就是无法正确地解析页面,形成下载的种子。  仔细分析后发现,这些页面多数都是有一些特殊的字符或者处理办法,目的就是干扰使用程序自动下载图书。页面是在网站上的,我们无法进行修改和处理。那么是不是就没有办法还下载了

2016-07-20 09:22:13 1136 1

原创 抓取的图片的URL中有中文字的问题

在reader365网站抓取电子书,编写了一个recipe,运行calibre后,抓下的书中只有文字,而没有图片,而对文物而言,图片也是重要的内容,于是花了很大的力气去查找recipe编写的问题,经过跟踪程序的执行,终于发现,网页中的图片,都使用了中文名,如:http://www.readers365.com/wenhua/wh095/图1 仰韶文化蚌壳摆塑龙虎与人骨平面图.jpg,而calibr

2016-05-04 11:42:52 1044

原创 用calibre脚本抓取ipdf的epub 3.0.1规范

用calibre脚本抓取ipdf的epub 3.0.1规范 转载▼  Epub规范已经更新到了3.0.1版本,一直以来都有是在ipdf网站在线浏览,该网站没有提供下载,有时阅读和查找时总觉不是很方便。  该规范包含EPUB 3 Overview                         Publications 3.0.1           

2016-04-22 15:40:48 1228

原创 calibre命令行下的编码问题

编写完calibre的recipe后,有两种方法来执行,一种是通过calibre ebook management中的抓取新闻按纽-添加自定义新闻源来,再通过定期新闻下载,选项中添加的recipe来执行。另一种方法是通过cmd命令行来执行。但每次通过命令行执行时,因为编码问题,总是会提示'你必须设置你的控制台的字体为lucida console或consolas或者其它的字体,以便看到到该文本',

2016-04-19 18:47:22 1328

原创 calibre recipe抓取中没有注意的空格

编写了几次recipe抓取网页上的内容,这次发现抓取中总是出现某些网页下载失败,因为calibre的出错信息比较简单,无法进行进一步的判断。出错信息如图:        如果程序有错,那么实际上其它的章节都下载正常。经过反复的查看,发现每次都是每一,五,九章节下载出错,重复性很一致。问题如果不是程序,那么应该是页面的代码有什么不一样,可每次用浏览器打开相应章节页面均正常,没有出错,而且

2016-04-06 09:58:34 1134

原创 李峤诗200首的抓取

从网上下载了李峤的200首诗作,做成了电子书。

2016-03-18 09:43:38 764

原创 calibre抓取“爱上中文”网小说的recipe

就是一个用calibre抓取“爱上中文”网的书籍的recipe。

2016-03-14 13:34:22 2407

原创 用calibre抓取凤凰网的书评

搞了个recipe,用calibre抓取了凤凰网的书评,生成了epub电子书,当然,也可以生成chm、pdf、mobi等其它格式。

2016-03-09 09:02:59 1397

原创 以cochrane抓取recipe为例,谈谈recursions参数的作用

以cochrane抓取recipe为例,谈谈recursions参数的作用 转载▼       前面“calibre抓取cochrance handbook的recipe”一文,用多卷的方式,实现了Cochrane Handbook for Systematic Reviews of Interventions电子书的抓取。其实,如果使用recursions参数

2016-03-05 15:26:22 603

原创 Python中麻烦的缩进

python缩进

2016-03-05 15:23:56 3103

englishname.xls

5000多个外国人名的excel表格,中文对照

2021-04-22

170万个中国姓名大全.txt

170多万个中国人名大全

2021-04-22

epub 3.0.1 Spec规范

epub规范文档,包含了七个部分。来源idpf网站

2016-02-25

verycd的ant movies catalog脚 本

ant movies catalog程序从www.verycd.com获取电影数据的脚本

2008-10-12

从www.mtime.com按分类批量生成电影资料库的脚本

从时光网按分类直接获取电影资料库的ant movies catalog脚步本。先在ant movies catalog中用makelist.ifs 生成mylist.txt电影名列表,导入ant movies catalog中后用addfilm.ifs直接从mtime获取相关电影资料,生成数据库。

2008-10-04

ant movies catalog 获取时光网mtime电影资料脚本

用ant movies catalog获取时光网mtime电影资料的脚步本

2008-10-04

ANT movies catalog 的imdb.cn脚本

用ant movies catalog 电影管理软件获取imdb.cn电影资料的inner pascal脚本

2008-10-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除