首先,用UE编辑器打开 mobi文件,如图:
1. 地址0x4a到0x52 :000000DC 00000730 意思是:索引有0xDC 条(16进制),到0x0730结束。
接下来从0x56开始00000000 00001343 的意思是:第一节内容的地址,其中4字节位第几节编号不予
理会,00001343 是我们关心得内容。按每8个字节的间隔依次读入、解压就是mobi文件的真实内容。
2. 除了文本文件,mobi格式中还有章节索引和图片文件,一般放在文本文件之后,如下图:
这些内容得地址在前面读取得地址中可以找到,这些内容是连续得(即没有压缩),可根据
INDX、JFIF判断(或根据起始内容)保存位toc 索引、图片(一般为封面图片或文章插图)。
为了简单,我们只关心文本部分内容。
第二 ,编写网页文件包含<input> 标签,指定类型为file 运行,如图: