TMX是一种用于翻译记忆库交换的格式。下面从两部分讨论TMX规范,
1. 字符集
TMX字符集支持UTF-16, UTF-8 和ISO-646 [US-ASCII] 。
只允许使用下列5种特殊字符实体的引用: &
(&), <
(<), >
(>), '
('), and "
(")。
2. 结构
TMX文件包含在 <tmx>
根元素内。 <tmx>
元素包含两个元素: <header>
和 <body>。
Header中的属性包括:
必选:
creationtool
, creationtoolversion
, segtype
, o-tmf
, adminlang
, srclang
, datatype
.
可选:
o-encoding
, creationdate
, creationid
, changedate
, changeid
.
Body有翻译单元( <tu>元素)集合
组成,没有特殊的顺序要求。
每个 <tu>
元素必须至少包含一个 <tuv>
元素,每个 <tuv>
包含一个片段以及与片段的语言有关的信息。
文字保存在 <seg>
元素内,可选的<note>
和 <prop> 元素还能让你保存其他的
<tuv>的信息。
详细情况见下例:
<tu tuid="0002" srclang="*all*" <!-- 可选-->
> <prop type="Domain">Cooking</prop> <!-- 可选--> <tuv xml:lang="EN"> <seg>menu</seg> </tuv> <tuv xml:lang="FR-CA"> <seg>menu</seg> </tuv> <tuv xml:lang="FR-FR"> <seg>menu</seg> </tuv> </tu>
TMX文件内容的样例:
<?xml version="1.0"?> <tmx version="1.4"> <header creationtool="XYZTool" creationtoolversion="1.01-023" datatype="PlainText" segtype="sentence" adminlang="en-us" srclang="EN" o-tmf="ABCTransMem"
<!-- 可选内容
creationdate="20020101T163812Z" creationid="ThomasJ" changedate="20020413T023401Z" changeid="Amity" o-encoding="iso-8859-1"
-->>
<!-- 可选内容
<note>This is a note at document level.</note>
<prop type="RTFPreamble">{\rtf1\ansi\tag etc...{\fonttbl}</prop>
<ude name="MacRoman" base="Macintosh">
<map unicode="#xF8FF" code="#xF0" ent="Apple_logo" subst="[Apple]"/>
</ude>
-->
</header> <body> <tu tuid="0001" datatype="Text" usagecount="2" lastusagedate="19970314T023401Z" > <note>Text of a note at the TU level.</note> <prop type="x-Domain">Computing</prop> <prop type="x-Project">Pægasus</prop> <tuv xml:lang="EN" creationdate="19970212T153400Z" creationid="BobW" > <seg>data (with a non-standard character: ).</seg> </tuv> <tuv xml:lang="FR-CA" creationdate="19970309T021145Z" creationid="BobW" changedate="19970314T023401Z" changeid="ManonD" > <prop type="Origin">MT</prop> <seg>données (avec un caractère non standard: ).</seg> </tuv> </tu> <tu tuid="0002" srclang="*all*" > <prop type="Domain">Cooking</prop> <tuv xml:lang="EN"> <seg>menu</seg> </tuv> <tuv xml:lang="FR-CA"> <seg>menu</seg> </tuv> <tuv xml:lang="FR-FR"> <seg>menu</seg> </tuv> </tu> </body> </tmx>
具体的规范见:http://www.gala-global.org/oscarStandards/tmx/#body