超星图书让人既爱又恨。近来,我一直在琢磨转化超星图书的事儿。在网上看了很多方法,自己也尝试了很多方法,有了一些体会,写出来与大家一起分享,并希望能对大家有帮助。需要说明的是,这只是我的一些经验,以实用为主,并不专业。
为什么要转换呢?
当然要转!原因很明显。首先,超星的书超级好!其次,超星公司的服务超级差。他们很不厚道,搞了太多的限制。不买卡不让检索;买了卡,还是有很多图书不让下载;勉强下载了换台机器又不能看了,并且他们还搞打印限制!(最近他们又在限制虚拟打印,想法很奇特,天下头一份!)另外,超星阅览器非常垃圾,翻几页之后CPU的使用经常达到100%,下载任务稍微一多就会死掉,更主要的是它只能在windows环境下使用,在其他的环境下,比如linux,根本不能用!(超星阅览器的代替品BooX Viewer,虽然在linux下可以使用,但是它支持的超星格式实在有限!)总之,超星有很多好东西,但是他本身很垃圾,所以我们要取其精华,弃其糟粕,就是要转!!
转化成什么格式呢?
我们的原则是转化生成文件的性价比要高。其中“性”是指生成的图书文件文字要清晰,并且阅读要方便,没有那么多的限制;“价”主要是指转换速度要快。一年就转一本书,要疯?!djvu格式是近来网上比较流行的图片格式,它用特殊的技术使图像高压缩而不失真(这个技术将图像分为背景层<纸的纹理和图片>和前景层<文本和线条>,用高分辨率来还原文字,用较低的分辨率来压缩背景图片,从而使整个图像在保证质量的同时尽可能的减小体积)。所以djvu格式是我们转换的首选。遗憾的是,一般的,pdg转化为djvu所需的时间比较长。pdf格式自不用说了,它是Adobe公司推出的图片格式。它虽然没有一统江湖,但至少也是目前这方面的老大!(听说微软的Vista要推出一种新的格式metro来取代pdf,不知道现在怎么样了,希望这次比尔大叔会做的好一些。)但是pdf文件的体积会大一些,我个人感觉清晰度也不如djvu,然而由于它的转换速度快,并且有Adobe公司给我们撑腰,所以pdf也是我们不错的选择。另外,由于mdi格式的转化速度超快,可以在windows下用强大的Microsoft Office自带工具观看,所以也有人转化成这个。其他的,比如jpeg、bmp图像,因为它们要么不清晰,要么体积超大,再不就是阅读不方便,所以很少人会选择这些。有没有更好的图书格式呢?我就不清楚了,真诚盼望各位大虾的教诲。
怎么转化呢?
转化的方法非常多,但在我看来,超星图书的转化的第一步还是以虚拟打印或者抓图为主(尤其是虚拟打印技术,这是一种简单而实用的转化方法,很值得着重介绍一下)。然后结合其他的方法转化为djvu或者pdf。其他的,如果没有特殊的要求而用OCR文字识别技术,无疑是一个很疯狂的想法!(为什么?用用就知道了。)另外,BooX Viewer只能打开一些00H、02H什么的,对于目前流行的66H毫无办法,所以我们一般不用它转化。有些高人也曾经设计了一些其他转化软件,比如本论坛chiputao大虾的Conv(详见http://www.readfree.net/bbs/read-htm-tid-70315-keyword-Conv.html),以及strnghrs大虾的Pdg2Pic(详见http://www.readfree.net/bbs/read ... eyword-Pdg2Pic.html)。好人阿!我举双手赞成!!但是,实事求是的讲这些工具的转化效果并不怎么好,而且运行不稳定。
Ⅰ.抓图
抓图工具我只用过SnagIt。SnagIt结合按键精灵转化效果还是不错的,只是转化速度太慢。本论坛的Kingsnow曾经介绍过。首先把超星阅览器窗口的缩放调为50%(这样可以使抓取的图像更清晰一些。当然也可以调节为“整高”,但是这样抓取得图像不清晰。)打开SnagIt,在“输入”中选择“滚动”、“自定义滚动”(抓图的时候上面有说明的,很傻瓜,容易学会)。对“过滤”进行重新设置:对于单色图书在“颜色深度”选择“单色”或者“灰度”,以减小生成文件的体积;在“图像分辨率”中设置一个比较大的分辨率,比如300或者更高,以提高图像的清晰度。在“输入”、“属性”中,把图像格式设为tif(都说这个好,不知道为什么。实际效果也确实不错)。按键精灵可以在本论坛下载,(见http://www.readfree.net/bbs/read ... 70%20VIP%B0%E6.html)。打开按键精灵,单击“增加”按钮,编辑一个合适的脚本(对于这个我很不在行阿,所以我编的脚本很不好用,就不多说了)。或者选择“录制”按钮,录制鼠标动作,这个很简单,比较适合像我一样喜欢省事儿的同志!这时候SnagIt和超星阅览器可能会有热键冲突,只要在SnagIt“工具”、“程序参数设置”、“热键”中更改热键就行了。接下来开始抓图,保存图像,为下面的转换工作做准备。这个转换方法生成的图像比较清晰,但是转换速度极慢,转换一页图书至少需要10秒钟。对于少量图书可以选择这种方法,但对于稍大量的图书用这种方法就很不划算了。比如我有10多G的图书,所以我在正式转换的时候没有使用这种方法。另外,这种方法还适合将只允许在线阅读的图书抓图。
Ⅱ.虚拟打印
虚拟打印的工具有很多,比如Adobe Acrobat自带的虚拟打印机Adobe Pdf、Microsoft Office自带的打印机Document Image Writer、djvu虚拟打印机LizardTech Virtual Printer、DocConvert、pdfFactory、FinePrint等等。另外,伟大的抓图工具SnagIt、新版的腾讯QQ都具有虚拟打印功能。虽然虚拟打印机转换文件不够专业,但是它足够简单,非常实用。对于一般用户来说完全够用了!
谈到虚拟打印,需要多说一点。超星阅览器的3.9版对打印进行了限制,即限制了每月最多能打印的数量。但是3.9也增加了一些非常有用的功能,比如预估打印多余的部分不进行打印功能,也就是说在打印前你输入的要打印的页数大于实际页数,打印出来的就是实际页数。比如有一本超星图书总共有60页,用超星阅览器3.9打开,从第一页开始打印,在“打印页数”中输入100,而打印出的实际页数为60,多出的40页不被打印。3.8版的超星阅览器没有此功能,如果输入要打印的页数大于实际页数,它将重复打印最后一页。所以用3.8 打印时需要准确无误的数出总页数,很麻烦。但是3.8没有打印限制。所以我们要取二者的长处,而避免它们的短处。网上也有一些破解3.9打印限制的方法,比如重写ssreader.ul文件或者把它设为只读属性等等,但是这些破解方法都不太理想。我在本论坛看了“雾锁寒江”大虾的文章以后(http://www.readfree.net/bbs/read ... E3%CC%E5%BB%E1.html)深受启发,它完美的结合了3.8与3.9二者的优点,而避免了它们的缺点。做法是先安装3.8,然后将安装目录中的全部文件剪切出来,然后再安装3.9的,把3.9目录下的文件直接删除,之后把导出去的3.8的文件再剪切回来,这样就能打印出实际页数了,也消除了打印限制。能出现这个结果的原因,我估计是由于没有完全卸载3.9,所以它在注册表或者系统文件夹中留下了痕迹。无论如何,这都是一个非常实用的方法。
介绍几种虚拟打印方法:
①LizardTech Virtual Printer
Djvu制作工具的企业版下载地址http://www.lizardtech.co.jp/down ... nterprise_5.1.0.zip,解压码enteval,注册码305-050-1364-138-860。(共194M,其中包括LizardTech Virtual Printer、Document Express Enterprise以及djvu阅读工具)它可以直接把超星图书转化成djvu格式。它的默认设置在适合绝大多数情况下,可保证较高的清晰度和较小的体积。如果想打印出的文件更清晰一些可以把分辨率调大一点,比如设为600。用这种方法转化图书非常方便,并且转化生成的文件质量还可以。但是这种方法的转换速度比较慢,即性价比稍低,不适合大批量转化。我用LizardTech Virtual Printer转化尝试转化了一些超星图书,结果如下:
我的电脑信息:CPU 赛扬1.70GHz,内存256M DDR,操作系统windows 2000 SP4。(转化速度与所用的电脑配置关系密切)
工具设置 书名 大小 页数 转化时间 转化一页的时间
默认设置 精神病学(第二版) 66.8M 938 56'32" 3.62"
默认设置 微精神分析学 13.9M 397 13'12" 1.995"
默认设置 脑的十年-由科学研究求答案 2.42M 60 2'53" 2.68"
②Document Image Writer
Document Image Writer是Microsoft Office 2003自带的打印机。(如果你在安装Office 2003的时候没有安装该组件,请使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件。)用Document Image Writer可以将图书转化成mdi和tiff两种格式。虽然tiff格式可以作为超星图书向djvu转化的中间格式,但是由Document Image Writer转化成的tiff质量极差。即使将分辨率选择为超精细的300DPI,效果仍然不好,由此转化成的djvu效果可想而知,所以我们不考虑用Document Image Writer转化tiff。mdi这种图形格式并不常用,支持它的阅览器也不多。由mdi转化的djvu效果一般,并且转化速度较慢,所以不建议把mdi转化成djvu。但是把超星打印成mdi时速度极快,而且效果还可以,所以可以把超星图书直接转化成mdi,用Microsoft Office Document Imaging阅读。我也用Document Image Writer把一些超星图书转化成了mdi,现将结果列表如下:
pdg——>mdi
书名:三国志故事选译,大小:6.04M,页数:192,转化时间:23",转化一页的时间:0.12"
mdi——>djvu
书名:三国志故事选译.mdi,大小:4.06M,转化时间:6'58",转化一页的时间:2.18"
③Adobe Pdf
Adobe Pdf是Adobe Acrobat自带的虚拟打印机。它可以说是制作pdf的官方软件,但是它没有自己的特色。而且与其他同类软件相比,不管是在转化质量还是在转化速度上都没有优势。用Adobe Pdf转化时,如果源文件中只是黑白两色,可以在“纸张/质量”中选择“黑白”,这样可以减小转化后文件的大小。可以在“打印质量”中选择分辨率,一般默认设置即可。另外,我发现选择不同的分辨率对打印出的文件质量影响不大,选择72bpi和选择3600bpi打印出的文件质量基本一样。不知道为什么会这样,期待高人的指点。由于Adobe Pdf名气挺大,所以3.8、3.9版的超星阅览器对它进行了限制。但是限制的方法非常低级,所以破解也非常简单。安装完毕之后在“控制面板”中打开“打印机”文件夹,给刚安装的虚拟打印机改个名字就可以了。比如虚拟打印机的默认名为Adobe Pdf,我们把它改为Adobe就可以了。 用Adobe Pdf转化超星图书的结果如下:
工具设置 书名 大小 页数 转化时间 转化一页的时间
黑白 600dpi 脑的十年-由科学研究求答案 2.42M 60 39" 0.65"
黑白 600dpi 精神病学(第二版) 66.8M 938 2'21" 0.15"
④PdfFactory
PdfFactory也是在网上比较火的pdf虚拟打印机,所以龌龊的超星也对它进行了限制。其破解方法与上面的一样,改名字。它的默认名称为pdf factory printer,我们可以改为factory。pdfFactory 转化的效果较好,而且速度较快。其生成文件的清晰度与位图的压缩关系密切,而与JPEG的压缩关系不大。所以在打印设置时只需把“图像”选项卡中的“位图采样率降到”一项设为300dpi。在“打印大小”选项卡中将“分辨率”设为720dpi即可。这样可以保证生成的文件较清晰,而体积不太大。用PdfFactory转化超星图书的结果如下:
工具设置 书名 大小 页数 转化时间 转化一页的时间
默认设置 微精神分析学 13.9M 397 3'46" 0.57"
默认设置 精神病学(第二版) 66.8M 938 10'24" 1.05"
⑤DocConvert文档转换工具
DocConvert也是一款非常优秀的虚拟打印工具。超星对它没有限制。它不但可以把文件虚拟打印成pdf格式,而且还可以打印成tiff格式。用DocConvert打印pdf并没有优势,但是用它打印成的tiff,与同类软件相比效果较好,转化速度非常快。根据pdg—>tiff—>djvu的转化路线,得到一个清晰的tiff文件是非常重要的一步。在打印tiff时需要进行设置,以保证较高的清晰度和较小的体积。我在多次对比之后,认为这样设置比较好:在“图片文档设置”选项卡中的“Tiff文档图片”一项中选择“2色(黑/白)2维G4传真编码”第二个,在“设置”中将“分辨率”设为1200dpi,其他各项保持默认设置即可。我同时发现用DocConvert打印成pdf文件时,无论如何设置,生成文件的效果都一样!!
Ⅲ. 第二步转化
①workflow manager
用上面提到的方法转化之后,有的就转化完毕,有的需要进一步处理。比如要把pdg转化成djvu,在pdg文件虚拟打印成pdf或者tiff等之后,必需进行第二步转化,这时候常常需要用到workflow manager。
安装Document Express Enterprise5.1.0后会有一个程序workflow manager。workflow manager是专业制作djvu的软件。它的功能非常强大,它可以把pdf、jpeg、bmp、gif、tiff等格式的文件转化为djvu。它使用起来也很方便。打开workflow manager,在右侧的窗口中首先选择“workflow”选项卡,一般的,在“Raster Profile”中选择scaned(600dpi)或者直接用默认设置,如果要将pdf转化为djvu,可在“PDF Profile”中选择highest quality一项,可保证较高的清晰度,但生成的文件体积较大;在“Input”选项卡中点击“choose files”,选择要转化的文件;在“Output” 选项卡中点击“choose folder”,选择生成文件的保存路径。设置完毕之后,在左侧的窗口中选择“job”菜单,点击“start all jobs”或者直接按F5键开始转化。此时在右侧的“log”中可以看到转化的进度。另外,Document Express Enterprise5.1.0作为专业制作djvu文件的软件,应该有很多很精细的设置,但是我至今没有学会,恳请各位大虾多多指教!
②多线程转化
虽然workflow manager是一个非常优秀制作djvu的软件。但是它的转化速度太慢,漫长的等待实在令人难以忍受。看了本论坛7xi0大虾的文章以后(http://www.readfree.net/bbs/read.php?tid=155513&keyword=djvu),觉得在windows的命令提示符下,用多线程进行转化是一个不错的做法。在任务管理器中可以看到,把别的文件转化为djvu格式时,其实只有documenttodjvu或者pdftodjvu等进程(转化的文件格式不同,调用的进程也不一样)在活动。所以我们可以在命令提示符下直接调用相应的进程进行转化,这样可以避免在纯windows下的各种干扰。更重要的是,在命令提示符下面一次打开多个线程,实现多线程同时工作,大大提高了工作效率(而在单纯windows下转化一次只能打开一个进程)。我们可以编写一个脚本实现这个想法。由于本人的电脑水平实在有限,想不出更好的脚本,这里借鉴7xi0大虾的脚本并稍加改动:
move d:/书/*.tiff d:/djvu/
d:
cd d:/djvu/
For /L %%a in (1,1,192) do documenttodjvu %%a.tiff %%a.djvu
move d:/djvu/*.djvu d:/书/
具体操作如下:
安装Document Express Enterprise5.1.0,并在D盘新建2个文件夹“书”和“djvu”。超星图书《三国志故事选译》共192页,用合适的虚拟打印工具把它转化为tiff格式(这样的工具很多,一搜一大堆),共192页,全部放在d:/书。在Document Express Enterprise5.1.0的安装目录中有一个bin文件夹,把其中的文件documenttodjvu复制到d:/djvu。根据上面的内容在d:/djvu中建立脚本文件djvu.bat。双击运行djvu.bat,稍等片刻,“d:/书”中tiff文件是不是都转换成djvu文件了!
另外,如果一本超星图书只转化成了一个大文件(大多数情况下是这样的),那么只要把生成的文件、documenttodjvu、脚本放在同一个文件夹中,然后在脚本中写一条语句就可以了:“documenttodjvu 书名.tiff 书名.djvu”。可以多建几个这样的文件夹,在各个文件夹中同时运行脚本,让几本书同时转换,成倍的提高转化效率。理论上,当我们打开n个线程时,转化时间就缩短为原来的1/n;而实际上转化的工作效率受电脑配置的限制。比如我的电脑配置较低(CPU赛扬1.70,内存256M DDR),当同时运行3个线程时,所用时间比依次转化3个文件所用时间还要长!没有银子升级,很无奈啊!
③关于tiff的转化
pdg—>tiff—>djvu的转化路线号称是pdg转化为djvu的正途。把pdg转化为tiff的工具也很多,比如前面提到的虚拟打印工具Document Image Writer、 DocConvert、 FinePrint以及SK虚拟打印机、SmartPrinter等等,其中不乏优秀的转化工具。我们可以先用虚拟打印工具把pdg转化为tiff,然后用workflow manager把tiff转化为djvu。然而若要得到较清晰的tiff文件,所生成文件的体积非常大。要在我的破电脑上把这么大的tiff文件转化成djvu,要经过漫长的等待,那实在是一件很痛苦的事!所以我只是尝试了几次这种转化方式,并没有大批量的转换。尝试转化结果如下:
pdg——>tiff
转化工具:DocConvert;工具设置:2色(黑/白)2维G4传真编码,1200dpi
书名 页数 转化时间 转化一页的时间
精神病学(第二版) 938 5'05" 0.325"
脑的十年-由科学研究求答案 60 25" 0.42"
tiff——>djvu
转化工具:workflow manager;工具设置:scaned(600dpi)
书名 页数 转化时间 转化一页的时间
精神病学(第二版).tiff 938 80'1" 5.12"
脑的十年-由科学研究求答案.tiff 60 4'31" 4.52"
最后,我积累了一些有关超星的小软件,已经上传到了我的免费空间里,如果需要可以去下载http://free.ys168.com/?shaka2001(至少保存一个月),只希望对大家有所帮助。
我从世界杯开幕以后开始写这篇文章,断断续续,边做边写,写了很长时间。我借鉴了很多别人的方法,对此我万分感谢!
另外,很希望能给些威望,因为威望太低,好多有用的东西看不到。
各位兄弟姐妹,帮忙顶啊!
以上红色是用户对DocConvert的评价