kindle与卫斯理

原创 2011年01月16日 02:37:00

<!-- @page { margin: 0.79in } P { margin-bottom: 0.08in } -->

kindle与卫斯理

 

Kindel者,亚马逊出的电子书阅读器也;卫斯理者,中国写汉字最多的人也。

 

为啥这两者会有联系呢?

 

由于世界还没有大同,各国还在使用不同的文字。更有甚者,同一个国家,可能

还在使用不同的文字。

 

更更有甚者,在计算机世界里,更加混乱。

 

即使是相同的文字,也可能用不同的方法编码--就是以数字对文字进行编号。

 

对英文甚至数字都有不同的编码方案,比如著名的ASCIIBCD码、克雷码等,不

一而足。

 

更不用说汉字了,计有GBKGB2312GB18060UTF-8等诸多编码方案。

 

给你串数字497825832403,在不同的编码方案下,对应着不同的文字。如果不告

诉你用的是什么编码,打死你也猜不出来。或者你就挨个方案猜,结合上下文,

看哪个方案猜出来的像是人话。

 

计算机程序如果事先不知道编码是什么,也就只能瞎猜(比以上更有些依据,有

限)。

 

Kindle也需要程序解码,因此也有类似的问题。

 

我在把卫斯理全集整到kindle的过程中,花了40多个小时,悟出了点道理。

 

以下。

 

1. 文件名, 文件内容 都是有编码的.

Windows下尚好,只有GB系列的编码,它还是少年,不会犯青年的错误.

Linux对中文以各种方式支持,这就要求使用者选对.

我发现如果发到kindle的邮箱的话,编码相同为宜.

UTF-8编码为宜.

但是,这不是最好的方法.

 

2. 如果在windows下,能以word发送,相当之好.

这时候排版较好.

最好别整成PDF再发.无论是全图扫描的,很多图片的,编码不是非常简单的,处

理的都不太好看.

 

3. 有个软件,Calibre,是专门用来转换电子书格式的,很不错.

windows, osx, linux版本.

最大的好处是,传到kindle以前,可以先预览一下效果.

但是,当它处理大文件,即很多文字的时候,速度极其慢.

比如卫斯理全集,在我的实验中,每次都耗费几个小时之多.

然后一看,可能仍不符合要求.打击人.

 

4. 最后我终于发现最佳处理流程. 如下.

 

步骤1. 先把不管什么格式,手动整成HTML;这能节省calibre,就是上面说的那

个电子书格式转换软件,很长时间.

 

不知道该软件啥算法,把PDF或者大的TXT(比如能写如卫斯理这么多文字者)转

HTML就要费掉几个小时.

 

手动整成HTML的意思,比如把TXT文件改名为HTML后缀.

 

步骤2. 手动修改HTML

 

如果是TXT改名成HTML, 加

 

<html>

<head>

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

</head>

<body>啥啥啥</body>

</html>

 

head里那段是关键.

 

步骤3. UTF-8编码保存.

如果是记事本打开,可以另存为UTF-8格式.

如果是用emacs打开,C-x RET f C-x s,编码选UTF-8

 

如果整不出来utf-8,那么,HTML的编码 和 内容的编码 都用gb2312.

 

步骤4. 段落

 

把所有的^J^M改成<p>.

 

段落前的空两格,与后面要用的转换工具有关.free.kindle.com的信箱和

calibre<p>处理不完全一样.

 

calibre转换htmlmobi时,<p>的每个段落前不会自动加空格(所以需要手动每

个段落前全角空格,批量替换.我用的方法.);free.kindle.com的信箱转换html

azw时,<p>的每个段落前会自动加2个全角空格那个大的空白;

 

步骤5. 转换

 

calibrehtmlmobi格式.

 

步骤6. 发送

 

发送mobi格式的文件到free.kindle.com上的你的信箱.

你的信箱的意思是,在kindle上能查到的,你的 用来转换个人文档的 信箱,

不是 yourname@free.kindle.com.

学计算机的谨记,自然语言是模糊的多义的.不咋地的.

 

以上.

 

这个故事告诉我们:无论多长的内容,采用了正确的方法,就总能成功解析;无

论多长的路,踏着正确的方向,就总能走到终点.

 

正确的”关键是,始终如一,处处一致.

GBK,那就是GBK,用UTF-8,那就是UTF-8.

 

只要有一处矛盾,那么就全盘皆错.这也是逻辑残忍的一面,”它会因为对所有人都

相同的态度而伤害某些人的宗教感情.”

 

这个故事花费了我40个小时以上的时间.其实尽早地换个数据来源,可能会更容易.

40小时的时间这个故事告诉我们:如果走了很久的夜路仍然没有尽头,那么应该

换条路,或者

 

醒过来.

相关文章推荐

解决kindle刷多看系统的问题

设备KPW1代,原本系统是多看,也习惯多看操作了,后来手误切换为原生系统后,有更新,手贱更新到5.6.1.1版本的原生系统,想要刷回多看系统,结果按照官方教程重启了无数次,依然进入的是原生系统。 ...

如何修复Kindle频繁自动锁屏和解锁

12年入手kindle dxg,用了几年年,看pdf的利器,感觉很不错, 2016年夏天的时候,kindle突然出现频繁的锁屏和解锁。在网上搜了一下,只有在贴吧找到一个类似的问题,但是没有解决方案,联...

python实现kindle每天推送博客2----python实现爬取博客内容

python爬虫教程很多, 本文以爬取博客为例 1.  Beautiful Soup Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据 为节约篇幅,安装方法自行...
  • xx123er
  • xx123er
  • 2017年08月04日 11:19
  • 227

python 爬虫(二) 爬虫知乎 制作成电子书发送到kindle

平时关注比较多的知乎话题,上网的状态下看着会容易走神,所以写了个python脚本用来抓取自己喜欢的问题,然后推送到自己kinle看。 代码: python爬虫 推送知乎文章到kindle电...
  • yagamil
  • yagamil
  • 2016年05月24日 23:12
  • 2281

亚马逊Kindle强势掌控电子书市场 竞争对手一个接一个关闭业务

全球数字图书和阅读器的市场仍然在增长中,许多消费者开始接受全新的数字阅读。不过据外媒报道,在这一市场,亚马逊的Kindle形成了某种强势垄断,许多传统书店被迫关闭了数字图书业务。  ...

Kindle电子书的用到的几种文件

题记 最近入手kindle,大概了解了下kindle 4的入门级知识,与大家分享。转自 http://blog.sina.com.cn/s/blog_6441e0640100gz2o.html 在...
  • whuslei
  • whuslei
  • 2012年03月08日 14:11
  • 9367

kindle上打开学术论文的正确方式

先说答案: $k2pdfopt -o out.pdf in.pdf -dev kpw -mode 2col -ws 0.375 -ls- -ui-​ 背景:​ 双栏学术论文在6寸屏上看就是...

亚马逊Kindle Fire挑战传统设备制造商

Amazon 发布了它的平板产品 Kindle Fire,定价199美元。 尽管售价远不如HP清仓的webOS Touchpad那么吸引眼球,但是与其他竞争对手相比,这个价钱还是相当有吸引力...
  • autoasm
  • autoasm
  • 2011年09月29日 21:10
  • 337

如何删除Amazon (kindle) 云端文件

要求:使用chrome浏览器或者搜狗浏览器的“高速”模式。firefox等浏览器我没有测试过,理论上适用;搜狗的“兼容”模式实测无效(应该是IE内核版本过低,对javascript的支持有问题)。另外...

Kindle Fire: 同一Fragment多次Replace后会出现空白界面

我们的Android开发,目前都是提倡写Fragment。
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:kindle与卫斯理
举报原因:
原因补充:

(最多只允许输入30个字)