AutoMdxBuilder 项目使用教程

AutoMdxBuilder 项目使用教程

AutoMdxBuilder Automatically make mdx dictionaries AutoMdxBuilder 项目地址: https://gitcode.com/gh_mirrors/au/AutoMdxBuilder

1. 项目的目录结构及介绍

AutoMdxBuilder 项目的目录结构如下:

AutoMdxBuilder/
├── cross_platform/
│   └── images/
├── lib/
├── templates/
├── LICENSE
├── README.md
├── auto_mdx_builder.py
├── ebook_utils.py
├── func_lib.py
├── requirements.txt
└── settings.py

目录结构介绍

  • cross_platform/: 包含跨平台相关的文件和资源,如图片等。
  • lib/: 存放项目依赖的库文件。
  • templates/: 存放词典制作的模板文件。
  • LICENSE: 项目的开源许可证文件。
  • README.md: 项目的介绍和使用说明文档。
  • auto_mdx_builder.py: 项目的主启动文件,负责自动化词典制作的主要逻辑。
  • ebook_utils.py: 与电子书相关的工具函数。
  • func_lib.py: 项目中使用的功能函数库。
  • requirements.txt: 项目依赖的Python包列表。
  • settings.py: 项目的配置文件,包含项目的各种设置和参数。

2. 项目的启动文件介绍

auto_mdx_builder.py

auto_mdx_builder.py 是 AutoMdxBuilder 项目的主启动文件。该文件包含了自动化词典制作的主要逻辑,包括词典的打包、解包、制作和还原等功能。

主要功能
  • 词典打包: 将词条数据打包成 mdx/mdd 文件。
  • 词典解包: 解包 mdx/mdd 文件,提取词条数据。
  • 词典制作: 自动化制作词典,支持多种模板和多卷/集合类型。
  • 词典还原: 将 Mdict 词典还原为原始格式。
使用方法
python auto_mdx_builder.py

3. 项目的配置文件介绍

settings.py

settings.py 是 AutoMdxBuilder 项目的配置文件,包含了项目的各种设置和参数。通过修改该文件,用户可以自定义词典制作的各种选项。

主要配置项
  • 词典模板: 选择词典制作的模板,支持 A-D 四种模板。
  • 词典类型: 设置词典的类型,如多卷词典、集合词典等。
  • 输出路径: 指定词典制作后的输出路径。
  • 其他参数: 包括词典的编码格式、分包大小等。
示例配置
# settings.py

# 选择词典模板
DICT_TEMPLATE = 'A'

# 词典类型
DICT_TYPE = 'multi_volume'

# 输出路径
OUTPUT_PATH = './output'

# 其他参数
ENCODING = 'utf-8'
SPLIT_SIZE = 1024 * 1024 * 10  # 10MB

通过修改 settings.py 文件中的配置项,用户可以根据自己的需求定制词典制作过程。

AutoMdxBuilder Automatically make mdx dictionaries AutoMdxBuilder 项目地址: https://gitcode.com/gh_mirrors/au/AutoMdxBuilder

MDICT的文件制作工具 转换程序支持格式: 1) 扩展的SugarDict格式: 每个项目(词条)一行,缺省最大为32K. 格式为: 关键字 解释(就是关键字和解释之间用空格分开) 关键字: 可以是大小写的组合, 每个单词的最大长度是255个字符。 关键字和解释中的'_', '^'在转换后会被替换成空格和回车 例子: break_through /'bri:k_MQru:/ ^v. 突破^n. 突破 good ^adj.好^adj.贼好^adj.好得不得了 2) KDict解码后的tab格式 每个条目一行,关键字和解释之间用"tab"分隔. 其中的"\n"会被转换成换行 例如: good adj.好\nadj.贼好\nadj.好得不得了 3) MDict的html格式 每个项目两行 第一行是关键字 第二行开始是正文, 这里的正文应该包括关键字。可以使用html的标记(不要包含 , 这个程序会自动加上, 另注意在转换时要指明源数据为html). 如果需要显示音标的话,可以利用html指定字体就可以显示了。(参见下面的例子) 正文结束后必须用一行表示结束 例子: Whole whole (hol,hJl; houl) 在html中连接到其它关键字的方法: key 其中key是关键字,section是对应关键字页面中的section名称. 4) MDict的紧凑型html格式(Compat Html) 这个格式由两个文件组成,正文文件格式基本和2)一样,但在正文里可以使用记号。另外 一个是记号文件。 记号文件的格式: 由多个记号定义组成,每个记号定义有3行 第一行: 记号的名称(只能用数字,必须大于0,最大不超过255) 第二行: 开始字符串(可以为空) 第三行: 结束字符串(可以为空) 使用时在正文里使用`记号`(键盘左上角的那个符号)就会将后续的文字直到下一个记号前的文 字用记号定义的开始字符串和结束字符串括起来。正文里如果需要显示` 则用"`"表示。内 码应该和正文的一样(例如正文如果是用Unicode的话,记号文件也应该用Unicode) 例如: 记号文件: 1 2 3 正文文件: whole `1`whole`s`2``3`(hol,hJl; houl) 最后在显示的时候就会被替换成 whole&#%96;s(hol,hJl; houl) 备注: 如果你的数据里含有国际音标,建议使用Unicode格式 (请参考http://www.phon.ucl.ac.uk/home/wells/ipa-unicode.htm) 将音标用对应的Unicode进行表示。这样只要用户装有支持IPA的字体文件就能够显示音标。 (Windows里的Lucida Console就包含有IPA对应的字体)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

钱溪双Bridget

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值