mdx文件转换成html,MDX/MDD 文件格式解析

MDict 将字典定义(关键字,解释)放在 MDX 文件中,字典相关的其他资源样式文件,比如图片,发音,样式放在 MDD 文件中,虽然存放的内容是不一样的,但是两种文件的结构是一致的。

源文件格式

MDict 的 html 格式

每个项目两行

第一行是关键字

第二行开始是正文,这里的正文应该包括关键字。可以使用 html 的标记(不要包含)

, 这个程序会自动加上,另注意在转换时要指明源数据为 html).

如果需要显示音标的话,可以利用 html 指定字体就可以显示了。

举例

Whole

whole

(hol,hJl; houl)

>

注意”>”和下一个记录间不要有任何其他空行

在 html 中连接到其它关键字的方法

key

其中 key 是关键字,section 是对应关键字页面中的 section 名称

在 html 中嵌入图片的方法

或者 abc.gif 其中 src 指向的文件名大小写不敏感

并将所有图片文件放在一个单独的目录中(不要与词典源文件放在同一目录中). 数据目录中可以带有子目录。在使用 MdxBuilder 制作词库时,将 Data 路径指向上面存放数据的目录,该目录中的所有文件都会被压缩到后缀名为.mdd 文件中,使用时该.mdd 文件应当与.mdx 文件在同一目录下。

在 html 中嵌入声音的方法

使用链接 keyword 这样的形式,点击该链接的时候可以进行发音 发音仅支持.wav 和.spx 格式的音频文件

内部重定向(内容链接)

当两个关键字所指向的内容是一样的时候,可以采取重定向的方式来达到”链接”的效果。内部重定向的格式为:6

@@@LINK= 关键字

例如 color 和 colour 都指向相同的内容,制作词典时可以正常编写 color 词条,但对于 colour 词条,可以写成:

colour

@@@LINK=color

>

当显示 colour 条目的内容时,程序会自动找到 color 的内容进行显示,链接是可以多重嵌套的。

writemdict

一个 Python 库用来将 mdx 转换为 txt 文本

一个 Python 库可以用来制作 mdx 词典

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
MDICT的文件制作工具 转换程序支持格式: 1) 扩展的SugarDict格式: 每个项目(词条)一行,缺省最大为32K. 格式为: 关键字 解释(就是关键字和解释之间用空格分开) 关键字: 可以是大小写的组合, 每个单词的最大长度是255个字符。 关键字和解释中的'_', '^'在转换后会被替换成空格和回车 例子: break_through /'bri:k_MQru:/ ^v. 突破^n. 突破 good ^adj.好^adj.贼好^adj.好得不得了 2) KDict解码后的tab格式 每个条目一行,关键字和解释之间用"tab"分隔. 其中的"\n"会被转换成换行 例如: good adj.好\nadj.贼好\nadj.好得不得了 3) MDict的html格式 每个项目两行 第一行是关键字 第二行开始是正文, 这里的正文应该包括关键字。可以使用html的标记(不要包含 , 这个程序会自动加上, 另注意在转换时要指明源数据为html). 如果需要显示音标的话,可以利用html指定字体就可以显示了。(参见下面的例子) 正文结束后必须用一行表示结束 例子: Whole whole (hol,hJl; houl) 在html中连接到其它关键字的方法: key 其中key是关键字,section是对应关键字页面中的section名称. 4) MDict的紧凑型html格式(Compat Html) 这个格式由两个文件组成,正文文件格式基本和2)一样,但在正文里可以使用记号。另外 一个是记号文件。 记号文件的格式: 由多个记号定义组成,每个记号定义有3行 第一行: 记号的名称(只能用数字,必须大于0,最大不超过255) 第二行: 开始字符串(可以为空) 第三行: 结束字符串(可以为空) 使用时在正文里使用`记号`(键盘左上角的那个符号)就会将后续的文字直到下一个记号前的文 字用记号定义的开始字符串和结束字符串括起来。正文里如果需要显示` 则用"`"表示。内 码应该和正文的一样(例如正文如果是用Unicode的话,记号文件也应该用Unicode) 例如: 记号文件: 1 2 3 正文文件: whole `1`whole`s`2``3`(hol,hJl; houl) 最后在显示的时候就会被替换成 whole&#%96;s(hol,hJl; houl) 备注: 如果你的数据里含有国际音标,建议使用Unicode格式 (请参考http://www.phon.ucl.ac.uk/home/wells/ipa-unicode.htm) 将音标用对应的Unicode进行表示。这样只要用户装有支持IPA的字体文件就能够显示音标。 (Windows里的Lucida Console就包含有IPA对应的字体)

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值