TMX1.4b规范概述

TMX是一种用于翻译记忆库交换的格式。下面从两部分讨论TMX规范,


1. 字符集

TMX字符集支持UTF-16, UTF-8 和ISO-646 [US-ASCII] 。

只允许使用下列5种特殊字符实体的引用: &amp; (&), &lt; (<), &gt; (>), &apos; ('), and &quot; (")。


2. 结构

TMX文件包含在 <tmx> 根元素内。 <tmx> 元素包含两个元素:  <header> 和 <body>

Header中的属性包括:

必选:

creationtoolcreationtoolversionsegtypeo-tmfadminlangsrclangdatatype.

可选:

o-encodingcreationdatecreationidchangedatechangeid.

Body有翻译单元( <tu>元素)集合组成,没有特殊的顺序要求。

每个 <tu> 元素必须至少包含一个  <tuv> 元素,每个 <tuv> 包含一个片段以及与片段的语言有关的信息。

文字保存在 <seg> 元素内,可选的<note> 和 <prop> 元素还能让你保存其他的 <tuv>的信息。

详细情况见下例:

 

  <tu
   tuid="0002"
   srclang="*all*" <!-- 可选-->
  >
   <prop type="Domain">Cooking</prop> <!-- 可选-->

   <tuv xml:lang="EN">
    <seg>menu</seg>
   </tuv>
   <tuv xml:lang="FR-CA">
    <seg>menu</seg>
   </tuv>
   <tuv xml:lang="FR-FR">
    <seg>menu</seg>
   </tuv>
  </tu>


TMX文件内容的样例:

<?xml version="1.0"?>
<tmx version="1.4">
 <header
  creationtool="XYZTool"
  creationtoolversion="1.01-023"
  datatype="PlainText"
  segtype="sentence"
  adminlang="en-us"
  srclang="EN"
  o-tmf="ABCTransMem"
<!-- 可选内容
creationdate="20020101T163812Z" creationid="ThomasJ" changedate="20020413T023401Z" changeid="Amity" o-encoding="iso-8859-1"
 -->
>
<!-- 可选内容
  <note>This is a note at document level.</note>
  <prop type="RTFPreamble">{\rtf1\ansi\tag etc...{\fonttbl}</prop>
  <ude name="MacRoman" base="Macintosh">
   <map unicode="#xF8FF" code="#xF0" ent="Apple_logo" subst="[Apple]"/>
  </ude>
 -->
 </header>
 <body>
  <tu
   tuid="0001"
   datatype="Text"
   usagecount="2"
   lastusagedate="19970314T023401Z"
  >
   <note>Text of a note at the TU level.</note>
   <prop type="x-Domain">Computing</prop>
   <prop type="x-Project">P&#x00E6;gasus</prop>
   <tuv
    xml:lang="EN"
    creationdate="19970212T153400Z"
    creationid="BobW"
   >
    <seg>data (with a non-standard character: &#xF8FF;).</seg>
   </tuv>
   <tuv
    xml:lang="FR-CA"
    creationdate="19970309T021145Z"
    creationid="BobW"
    changedate="19970314T023401Z"
    changeid="ManonD"
   >
    <prop type="Origin">MT</prop>
    <seg>donn&#xE9;es (avec un caract&#xE8;re non standard: &#xF8FF;).</seg>
   </tuv>
  </tu>
  <tu
   tuid="0002"
   srclang="*all*"
  >
   <prop type="Domain">Cooking</prop>
   <tuv xml:lang="EN">
    <seg>menu</seg>
   </tuv>
   <tuv xml:lang="FR-CA">
    <seg>menu</seg>
   </tuv>
   <tuv xml:lang="FR-FR">
    <seg>menu</seg>
   </tuv>
  </tu>
 </body>
</tmx>

具体的规范见:http://www.gala-global.org/oscarStandards/tmx/#body
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值