豆丁及百度文件格式描述

最新推荐文章于 2024-09-14 11:39:03 发布

hfdsoft

最新推荐文章于 2024-09-14 11:39:03 发布

阅读量1k

点赞数 1

文章标签：百度 stream byte 文档测试 2010

一、豆丁文件格式的版本

描述豆丁文件格式版本之前，有必要交代一下豆丁文件在豆丁文档器中装载的过程。

1. 通过js传递ProductId给DocinFlashPlayer

2. DocinFlashPlayer调用Docin的ProductWebService的getProductInfo方法获取ProductInfo。这里面有一个属性conversionSuccee（converSuccess）描述了豆丁文件格式的版本信息。（>20为V3否则为V2）

3. pageNum属性描述了子文件的数量

4. docin资源文件的URI地址及格式为：

第一个文件(i == 1)：

http://file.yimk.com/docin_{ProductId}.docin

其他文件(i == 2 to pageNum)：

http://file.yimk.com/docin_{ProductId}_{i}.docin

介绍以上内容的原因是从豆丁资源文件本身是无法识别文件的版本信息的，但是也可以采用试探的方式进行转换。

具体细节为读取第三/四字节，如这两个字节值为0x00，则为V3，否则为V2。

二、豆丁V2格式描述

Stream： headerLen headcontent body(X)content

Length： 4 headerLen @size(x)

headcontent ： iso-8859-1 encoder（解码后字符串如）

<root>

<node size="43893" width="595" height="842"/>

<node size="34595" width="595" height="842"/>

</root>

与FlexPaper的对应关系

该版本中读取的@sizeX部分的内容即为第X页的swf内容

三、豆丁V3格式描述

Stream： pageWidth pageHeight _totalPages headerLen swfHeaderContent

Length： 4 4 4 4 headerLen

Stream： body(X)Len body(X)Content

Length： 4 body(X)Len

所谓的豆丁知识产权的部分也就在这里了

采用zlib的压缩传输，对flexPaper进行了分包并压缩

Content = Uncompress(swfHeaderContent)+ Uncompress(body(X)Content)

Tlen =len(Content)

FlexPaper(x)= byte(70) byte(87) byte(83) byte(09) byte([](tlen) Content

四、百度资源文件的格式描述

很多朋友都想知道百度文库的文件格式，通过分析豆丁的文件格式，发现其实百度文库的格式很相似，并且更为简单，但是文件的体积相对较大。

Stream： jsonstring body(X)content

Length： 102? @size(x)

其实百度的jsonstring的长度我没有仔细测试其长度，因为在这样的格式下，只需要抓取CWS或者FWS 即

if ((_loc_3[_loc_5] == 67 || _loc_3[_loc_5] == 70) && _loc_3[(_loc_5 + 1)] == 87 && _loc_3[_loc_5 + 2] == 83 && (_loc_3[_loc_5 + 3] == 9 || _loc_3[_loc_5 + 3] == 10))

本文来自CSDN博客，转载请标明出处：http://blog.csdn.net/chinull/archive/2010/06/28/5698775.aspx

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

hfdsoft CSDN认证博客专家 CSDN认证企业博客

码龄18年

0: 原创

73万+: 周排名

224万+: 总排名

1024: 访问

: 等级

16: 积分

16: 粉丝

1: 获赞

0: 评论

1: 收藏

私信

关注

热门文章

豆丁及百度文件格式描述 1024

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。