OmegaT 用户指南
PDF
Dokumentas
Reklama
Reklama
OmegaT 3.0——用户向导
Vito Smolej
OmegaT 3.0——用户向导
Vito Smolej
Publication date
Abstract
该文档是正式的 OmegaT(免费的计算机辅助翻译工具)用户指南。其中还包含了安装说明。
Table of Contents
1. 关于OmegaT——介绍 ................................................................................................................. 1
1. OmegaT的突出特色 ............................................................................................................ 1
2. 章节概要 ............................................................................................................................ 1
2. 五分钟内学会使用OmegaT! ....................................................................................................... 3
1. 创建新项目 ......................................................................................................................... 3
2. 翻译文件 ............................................................................................................................ 3
3. 检验标签 ............................................................................................................................ 3
4. 生成已译文件 ...................................................................................................................... 3
5. 了解更多 ............................................................................................................................ 3
3. 安装和运行 OmegaT ................................................................................................................... 5
1. Windows 用户 .................................................................................................................... 5
2. Linux (Intel) 用户 ................................................................................................................ 5
3. Mac OS X 用户 .................................................................................................................. 6
4. 其它系统 ............................................................................................................................ 7
5. 使用 Java Web Start .......................................................................................................... 8
6. 从命令行启动 OmegaT ........................................................................................................ 8
7. 从源代码编译 OmegaT ...................................................................................................... 12
4. 用户界面 ................................................................................................................................... 13
1. OmegaT主窗口、其他窗口及对话框 ................................................................................... 13
2. OmegaT 主窗口 ................................................................................................................ 14
3. 其它窗口 ........................................................................................................................... 18
5. 菜单和键盘快捷键 ..................................................................................................................... 22
1. 主菜单 .............................................................................................................................. 22
2. 键盘快捷键 ....................................................................................................................... 26
6. 项目属性 ................................................................................................................................... 29
1. 属性对话框 ....................................................................................................................... 29
7. 文件过滤器 ............................................................................................................................... 32
1. 文件过滤器对话框 ............................................................................................................. 32
2. 过滤器选项 ....................................................................................................................... 32
3. 编辑过滤器对话框 ............................................................................................................. 34
8. OmegaT文件和文件夹 ............................................................................................................... 36
1. 翻译项目文件 .................................................................................................................... 36
2. 用户设置文件 .................................................................................................................... 37
3. 应用程序文件 .................................................................................................................... 38
9. 待译文件 ................................................................................................................................... 40
1. 文件格式 ........................................................................................................................... 40
2. 其它文件格式 .................................................................................................................... 41
3. 自右向左语言 .................................................................................................................... 41
10. 编辑行为 ................................................................................................................................. 43
11. 处理纯文本 ............................................................................................................................. 45
1. 缺省编码 ........................................................................................................................... 45
2. OmegaT 解决方案 ............................................................................................................ 45
12. 处理格式化文本 ....................................................................................................................... 46
1. 格式化标签 ....................................................................................................................... 46
2. 标签操作 ........................................................................................................................... 46
3. 标签组嵌套 ....................................................................................................................... 47
4. 标签组重叠 ....................................................................................................................... 47
5. 标签验证选项 .................................................................................................................... 47
6. 标签组检验 ....................................................................................................................... 48
7. 标签管理的几点提示 .......................................................................................................... 48
13. 翻译记忆 ................................................................................................................................. 49
1. OmegaT 中的翻译记忆 ...................................................................................................... 49
2. 重用翻译记忆 .................................................................................................................... 51
3. 带有现存译文的源 ............................................................................................................. 52
4. 伪翻译记忆 ....................................................................................................................... 52
5. 更新翻译记忆 .................................................................................................................... 53
14. 源片段分割规则 ....................................................................................................................... 54
iii
OmegaT 3.0——用户向导
1. 片段分割规则 ....................................................................................................................
2. 规则的优先级 ....................................................................................................................
3. 创建新规则 .......................................................................................................................
4. 一些简单的例子 .................................................................................................................
15. 搜索 .......................................................................................................................................
1. 搜索窗口 ...........................................................................................................................
2. 使用通配符 .......................................................................................................................
3. 搜索方式和选项 .................................................................................................................
4. 搜索结果展示 ....................................................................................................................
16. 正则表达式 .............................................................................................................................
1. 正则表达式的工具和使用实例 .............................................................................................
17. 词典 .......................................................................................................................................
1. 如何下载和安装词典 ..........................................................................................................
2. 与词典相关的问题 .............................................................................................................
18. 词汇表 ....................................................................................................................................
1. 用法 .................................................................................................................................
2. 文件格式 ...........................................................................................................................
3. 如何创建词汇表 .................................................................................................................
4. 使用Trados MultiTerm .......................................................................................................
5. 常见词汇表问题 .................................................................................................................
19. 机器翻译 .................................................................................................................................
1. 介绍 .................................................................................................................................
2. 谷歌翻译 ...........................................................................................................................
3. OmegaT 用户和谷歌翻译 ..................................................................................................
4. Belazar .............................................................................................................................
5. Apertium ...........................................................................................................................
6. 机器翻译 - 故障排除 ..........................................................................................................
20. 拼写检查 .................................................................................................................................
1. 安装拼写词典 ....................................................................................................................
2. 使用拼写词典 ....................................................................................................................
3. 提示 .................................................................................................................................
21. 杂项主题 .................................................................................................................................
1. OmegaT 控制台模式 .........................................................................................................
2. 自动Java属性对齐器 ..........................................................................................................
3. 字体设置 ...........................................................................................................................
4. 防止数据丢失 ....................................................................................................................
A. 语言-ISO 639 代码列表 ..........................................................................................................
B. 编辑器中的键盘快捷键 ..............................................................................................................
C. OmegaT团队项目 .....................................................................................................................
1. 版本控制——介绍 .............................................................................................................
2. 使用SVN共享项目 .............................................................................................................
3. 在OmegaT中使用团队项目 ................................................................................................
D. 解析器插件 ...............................................................................................................................
1. 介绍 .................................................................................................................................
2. 安装和使用 .......................................................................................................................
E. LanguageTool插件 ....................................................................................................................
1. 介绍 .................................................................................................................................
2. 安装和使用 .......................................................................................................................
F. 脚本化插件 ...............................................................................................................................
1. 介绍 .................................................................................................................................
2. 安装和使用 .......................................................................................................................
G. 网上的 OmegaT .......................................................................................................................
1. OmegaT 站点和 OmegaT SourceForge 项目 ......................................................................
2. BUG 报告 .........................................................................................................................
3. 为 OmegaT 项目做贡献 .....................................................................................................
H. 自定义快捷键 ...........................................................................................................................
1. 自定义快捷键 ....................................................................................................................
2. 项目菜单 ...........................................................................................................................
3. 编辑菜单 ...........................................................................................................................
4. 前往菜单 ...........................................................................................................................
iv
54
54
54
55
56
56
57
57
57
59
61
63
63
63
64
64
65
65
66
66
67
67
67
67
68
68
68
69
69
69
70
71
71
72
72
72
74
79
80
80
80
83
84
84
84
85
85
85
86
86
86
88
88
88
88
89
89
89
90
90
OmegaT 3.0——用户向导
5. 查看菜单 ...........................................................................................................................
6. 工具菜单 ...........................................................................................................................
7. 选项菜单 ...........................................................................................................................
8. 帮助菜单 ...........................................................................................................................
I. 法律声明 ....................................................................................................................................
1. 关于本文档 .......................................................................................................................
2. 关于应用程序 ....................................................................................................................
J. 致谢 .........................................................................................................................................
1. 感谢各位! .......................................................................................................................
Index ............................................................................................................................................
v
91
91
91
92
93
93
93
94
94
95
List of Figures
4.1. OmegaT 主窗口 .....................................................................................................................
4.2. 匹配窗格 ................................................................................................................................
4.3. 匹配窗格设置 .........................................................................................................................
4.4. 词汇表中的多词条目 ...............................................................................................................
4.5. 注解面板 ................................................................................................................................
4.6. 标签验证窗口 .........................................................................................................................
4.7. 项目统计 ................................................................................................................................
4.8. 匹配统计 ................................................................................................................................
6.1. 项目属性窗口 .........................................................................................................................
8.1. OmegaT项目 ..........................................................................................................................
8.2. OmegaT项目和子文件夹 .........................................................................................................
10.1. 编辑行为选项 .......................................................................................................................
12.1. 标签检验条目 .......................................................................................................................
15.1. 文本搜索窗口 .......................................................................................................................
16.1. Regex Tester .......................................................................................................................
17.1. Merriam Webster 词典——实际使用 ......................................................................................
18.1. 词汇表窗格 ...........................................................................................................................
18.2. 词汇表中的多单词条目——示例 .............................................................................................
19.1. 谷歌翻译 - 示例 ....................................................................................................................
20.1. 拼写检查器设置 ....................................................................................................................
20.2. 使用拼写检查器 ....................................................................................................................
E.1. OmegaT中的LanguageTool ....................................................................................................
vi
14
16
16
17
18
19
20
20
30
36
36
43
48
56
61
63
64
64
67
69
70
85
List of Tables
4.1. OmegaT主窗口 ......................................................................................................................
4.2. 其它窗口 ................................................................................................................................
4.3. 设置对话框 ............................................................................................................................
4.4. 窗格 widget ............................................................................................................................
4.5. 主窗口 - 方框 .........................................................................................................................
4.6. 匹配窗格设置 .........................................................................................................................
5.1. 主菜单 ...................................................................................................................................
5.2. 项目菜单 ................................................................................................................................
5.3. 复制/剪切/粘贴快捷键 .............................................................................................................
5.4. 编辑菜单 ................................................................................................................................
5.5. 前往菜单 ................................................................................................................................
5.6. 查看菜单 ................................................................................................................................
5.7. 工具菜单 ................................................................................................................................
5.8. 选项菜单 ................................................................................................................................
5.9. 帮助菜单 ................................................................................................................................
5.10. 项目管理快捷键 ....................................................................................................................
5.11. 编辑快捷键 ...........................................................................................................................
5.12. 来回移动快捷键 ....................................................................................................................
5.13. 其他快捷键 ...........................................................................................................................
16.1. Regex - 标志 .......................................................................................................................
16.2. Regex - 字符 .......................................................................................................................
16.3. Regex - 引用 .......................................................................................................................
16.4. Regex - 用于 Unicode 字块和分类的类 ..................................................................................
16.5. Regex - 字符类 ....................................................................................................................
16.6. Regex - 预定义字符类 ..........................................................................................................
16.7. Regex - 边界匹配 .................................................................................................................
16.8. Regex - 贪婪量词 .................................................................................................................
16.9. Regex - 非贪婪量词 .............................................................................................................
16.10. Regex - 逻辑操作符 ............................................................................................................
16.11. Regex - 用于译文的正则表达式示例 ....................................................................................
A.1. ISO 639-1/639-2 语言代码列表 ...............................................................................................
B.1. 编辑器中的按键行为 ...............................................................................................................
H.1. 项目菜单 ...............................................................................................................................
H.2. 编辑菜单 ...............................................................................................................................
H.3. 前往菜单 ...............................................................................................................................
H.4. 查看菜单 ...............................................................................................................................
H.5. 工具菜单 ...............................................................................................................................
H.6. 选项菜单 ...............................................................................................................................
H.7. 帮助菜单 ...............................................................................................................................
vii
13
13
13
14
15
17
22
22
22
23
24
24
25
25
26
26
27
27
28
59
59
59
59
60
60
60
60
60
61
61
74
79
89
90
90
91
91
91
92
Chapter 1. 关于OmegaT——介绍
1. OmegaT的突出特色
OmegaT是一种免费的多平台计算机辅助翻译工具,具有以下突出特色:
• 翻译记忆:OmegaT在翻译记忆中保存您的翻译内容。同时,它可以参考以前的翻译记忆文件。对于那
些要处理许多重复和相似文本片段的翻译工作来说,翻译记忆是非常有用的功能。OmegaT使用翻译记
忆保存您之前的翻译,并为您当前进行翻译的文本提供最可能的译文。
当已译文档需要更新时,这些翻译记忆非常有用。未变化的句子将保持已译状态;对于已更新的句子,
则会把旧版中同一句子作为最可能译文一同显示出来。对原始文档之修正版的处理工作也因此变得非常
轻松。如果您得到了已创建好的翻译记忆(比如来自翻译中介商或客户),OmegaT 也可以把它们用作
参考记忆。
OmegaT 使用标准的 TMX 文件格式来保存和读取翻译记忆,这使得您可以与其它支持这一文件格式的
CAT 应用程序交换翻译资料。
• 术语管理:为保持翻译的一致性,术语管理非常重要。OmegaT所使用的包含单词和短语的词汇表是一
种面向特定领域的简化双语词典。OmegaT把当前片段和词汇表中同时出现的那些词汇的翻译作为参考
显示出来。
• 翻译流程:想象一下不得不对从单个文件到整个文件夹(包含带有各种文件格式的子文件夹)进行翻译
的情形。您只需告诉 OmegaT 您想翻译哪些文件,它就会使用文件过滤规则在其中查找所支持的文
件,将文本部分识别出来,并按照分割规则对文本组进行分割,最后将片段逐段显示出来以便您进行翻
译。OmegaT保存您的翻译并根据与翻译记忆文件中相似的当前片段提供适当的建议。如果您想看看这
些文件翻译好之后的样子,您可以导出已译文件, 并使用适当的应用程序打开并查看最终格式的翻译。
2. 章节概要
此文档目的是作为向导和参考指南。这里简要介绍了各章的内容。
• 5分钟学会OmegaT!:本章是为初学者和已经知道CAT工具的人们准备的快速入门指南,演示了从创
建翻译项目到完成翻译的完整流程。
• 安装和运行
OmegaT:如果您是刚开始接触
OmegaT,那么本章很有用。它包含了如何在
Windows、Mac OS X 和 Linux 中如何安装和运行 OmegaT 的详细说明。对于高级用户,本章说明了命
令行模式及其功能。
• 用户界面,主菜单和键盘快捷键:这两章很可能要认真查阅,因为它们解释了 OmegaT 的用户界面和
可通过主菜单和键盘快捷键使用的功能。
• 项目属性、OmegaT文件和文件夹:OmegaT中的项目是它作为CAT工具所能处理的那部分工作。本章
描述了项目属性,例如源和目标语言。之后的章节描述了翻译项目中的各种子文件夹和文件及其用途,
同时描述了其他与OmegaT关联的用户和应用程序文件。
• 编辑片段行为:这简短的一章描述了如何设置要翻译片段的编辑行为。
• 操作纯文本和含格式文本:这两章说明了在翻译文本文件时的重要事项,例如编码设置(对于纯文本)
和标签处理(对于含格式文本)。
• 翻译记忆:说明了包含翻译记忆的各种子目录的用途,同时提供了与翻译记忆相关的其他重要信息。
• 片段分割:翻译记忆工具的使用以称为片段的文本为单位。在 OmegaT,片段的划分可以基于段落或分
割规则。段落分割比较少用,但它可用于被称为“创造性”文本的情况。而基于分割的规则通常指基于句
子的分割。程序中提供了一些规则集合,用户还可以根据本章中的说明定义其他规则。
• 搜索和正则表达式:在 OmegaT 中进行搜索可以和“列出包含单词 'kangaroo' 的片段”一样的简单。它们
还可以很复杂,例如允许搜索包含两个或更多连续空白字符的片段。此时正则表达式 ^s^s+ 可用来找到
出现问题的片段。正则表达式同样广泛用在片段分割中。
1
关于OmegaT——介绍
• 词典、词汇表、机器翻译及拼写检查器、语言工具:OmegaT 支持大量的词典和词汇表。如果存在网络
连接,OmegaT 中可以利用像谷歌翻译和微软翻译家这样的多种机器翻译服务。如果激活了拼写检查,
在翻译过程中的拼写和输入错误可以识别出来并纠正。开源的语言工具可以纠正常见的文法和格式错
误。
• 杂项:处理其他各种问题,例如怎样避免数据的丢失。
• 附录包含了下列信息
• 网络上的 OmegaT:与在线 OmegaT 资源相关的信息
• 语言:提供了ISO语言及语言代码列表。
• 编辑器中的键盘快捷键在编辑器中使用的快捷键列表
• 自定义快捷键:可根据个人习惯定制的快捷键
• 介绍解析器和脚本化插件
• 团队项目
• 法律声明和致谢
• 关键字索引:提供广泛的关键字索引来帮助阅读者找到相关信息。
2
Chapter 2. 五分钟内学会使用OmegaT!
1. 创建新项目
注:在Apple Mac上,请使用Command代替Control键。
开始使用OmegaT时首先要创建项目,用来保存您的所有文件,例如源文件、翻译记忆、词汇表及您要翻
译的文件。在项目菜单中选择新建……并输入项目名称。记住您创建项目的位置,之后还需要返回这里。
给项目命名后将出现创建新项目对话框。在该对话框顶端选择源文件语言和目标语言,并点击OK继续。
如果对该对话框中的其他设置有兴趣,您可在任何时候按下Ctrl+E来将其打开。
接着,项目文件对话框出现。点击导入源文件……按钮选择源文件。OmegaT跟着会复制选择的文件到新
建项目的/source/子文件夹。当编辑器窗格中加载了源文件后,您可以关闭项目文件对话框。
2. 翻译文件
OmegaT每次呈现一个片段供您翻译。翻译一个片段后,按下Ctrl+U将前往下一个未译片段(或使用Ctrl
+Shift+U前往下一个已译片段)。当您想看看译文的最终格式时,按下Ctrl+D会生成已译文档,它们在项
目文件夹中的/target/子文件夹。在翻译过程中使用编辑和前往菜单可以执行多种有用的功能。
3. 检验标签
如果源文件是格式化文件,如Microsoft Word、LibreOffice Writer或HTML,OmegaT会把待译文本周围的
格式转换为标签。经常文档都会含有无需处理的格式标签,但它们对源文件(和已译文件)也很重要。源
语言也许类似这样:
但OmegaT会把该语句以下面的样式呈现:
OmegaT中的标记为灰色,因此很容易识别。这些标签受到保护,这样您无法修改它们的内容,可以删
除、手动输入或移动它们在目标语句中的位置。无论如何当您输入了错误的格式标签,那么已译文件可能
无法打开。因此,在生成已译文件前请按下Ctrl+Shift+V以检验标签是否正确。
4. 生成已译文件
当您确定在翻译中没有标签错误后,按下Ctrl+D则会在项目文件夹的/target/子文件夹中生成目标文件。
5. 了解更多
• 如果某个文件无法加载到编辑器窗格,那么该文件可能是OmegaT无法处理的格式。请参阅文件过滤
器了解OmegaT能处理的文件格式列表。
• 您可以为每个新工作创建新项目,且随时可以添加新的源文件到项目中。
• 要让自己想起项目的最初设置,请按下Ctrl+E打开项目设置对话框。要查看项目中文件列表,请按
下Ctrl+L打开项目文件对话框。
• 在翻译结束后,OmegaT会导出名称分别为level1、level2和omegat的三种翻译记忆文件到项目文件
夹。level1和level2翻译记忆可以共享给使用其他翻译工具的用户。名称为omegat的翻译记忆可被
3
五分钟内学会使用OmegaT!
OmegaT自身用于将来创建的项目。如果您把这种翻译记忆文件放在项目的/tm/子文件夹,则OmegaT
会自动在其中搜索类似的片段(被称为“模糊匹配”)。
• 按下Ctrl+Shift+G可以添加新术语到词汇表,也可以复制现有的词汇表到项目文件夹的/glossary/子文件
夹,OmegaT会自动在其中搜索单词。
• 常常需要在源文本和翻译中搜索单词和短语,需要时请按下Ctrl+F打开文本搜索对话框。
• 更全面的介绍请参阅Omegat网站上的OmegaT初学者入门 [http://www.omegat.org/en/tutorial/OmegaT
%20for%20Beginners.pdf]。如果您需要关于OmegaT某些方面的帮助,可随时加入OmegaT用户组
[http://tech.groups.yahoo.com/group/OmegaT/]。
4
Chapter 3. 安装和运行 OmegaT
1. Windows 用户
1.1. 下载安装包
安装了与Oracle的Java 1.6 JRE兼容的Java实现了吗?
• 是:下载OmegaT_3.n.n_Windows_without_JRE.exe。
• 否/我不知道:下载 OmegaT_3.n.n_Windows.exe。
该安装包捆绑了Oracle的Java运行环境。该JRE不会与系统中可能已安装的其它 Java 实现相冲突。
1.2. 安装OmegaT
要安装OmegaT,只需双击已下载的程序。
安装开始时您可以选择在安装过程中使用的语言。在接着的窗口中您可以选择在OmegaT使用的语言。如
果您选中了相应的复选框,则会修改OmegaT.l4J.ini文件以使用选择的语言(请参阅下一部分了解详
情)。然后,当您接受了许可协议后,安装程序将询问是否要在开始菜单中创建文件夹以及在桌面和快速
启动栏创建快捷方式(以后您可以拖动OmegaT.exe到桌面或开始菜单来创建快捷方式)。最后一个画面
提议您看看所安装版本的自述文件和更新文件。
1.3. 运行 OmegaT
一旦安装好 OmegaT,您可以通过点击 OmegaT.jar 或者从命令行启动它。
然而,最简单的方法是运行 OmegaT.exe 程序。在此情形下,将从 OmegaT.l4J.ini 文件读取程序选项,
该文件与可执行文件在同一目录,您可对它进行修改以反映您的设置。下面的 INI 文件将保留 1GB 内存,
以法语为用户语言,将国家设置为加拿大:
# OmegaT.exe 运行时配置 # 要使用某参数,仅需删除 '-' 前面的 '#' # Memory -Xmx1024M # Language -Duser.la
1.4. 升级 OmegaT
这里的内容只适用于通过“传统”方式安装的 OmegaT 的 Windows 版本。它不适用于 Web Start 版本(它
会自动更新),也不适用在 Windows 上安装的跨平台版本。
如果您已经在电脑上安装了某个版本的 OmegaT 且希望升级到最新的版本,有两种方法:
• 使用覆盖方式进行安装。要实现这个操作,只需将新版本安装到现有安装所在的目录。旧版本的
OmegaT 会被覆盖,不过将保留所有的设置。其中包括 OmegaT 中的首选项设置,对 OmegaT.l4J.ini
文件进行的所有更改以及您使用的启动脚本(.bat 文件)。
使用这种方法您可以下载“不含 JRE 的 Windows” 版本,因为新的安装程序可以使用原来的 JRE。
• 安装到新文件夹。这样您可以同时使用两个版本,直到您适应新版本的时候。使用这种方法您也可以使
用在 OmegaT 中更改的首选项和设置。不过此时:
• 如果您对 OmegaT.l4J.ini 进行了修改或使用 .bat 文件,那么必须把它们复制过去。
• 如果您已安装的程序是“带
Windows”版本。
JRE
的
Windows”版本,那么新的安装程序也必须是“带
2. Linux (Intel) 用户
2.1. 下载正确的安装包
安装了与Oracle的Java 1.6 JRE兼容的Java实现了吗?
5
JRE
的
安装和运行 OmegaT
• 是:下载OmegaT_3.n.n_Without_JRE.zip。
• 否/我不知道:下载OmegaT_3.n.n_Linux.tar.bz2。
该安装包捆绑了Oracle的Java运行环境。该JRE不会与系统中可能已安装的其它 Java 实现相冲突。
2.2. 安装OmegaT
解压下载的文件。该操作将会在工作目录中创建一个 omegat/ 目录,在该目录中可以找到运行 OmegaT
所需的所有文件。要解压 .tar.gz 文件:
$ tar xf downloaded_file.tar.gz
2.3. 向菜单(KDE)或面板(Gnome)中增加 OmegaT
2.3.1. KDE 4 用户
可按下列步骤添加 OmegaT 到菜单中:
• 按下 Alt+F2
以显示 KRunner。输入
KMenuEditor 选择文件->新项目。
kmenuedit+enter
命令并运行。出现
KMenuEditor。在
• 然后选择适当的菜单,通过[文件]-[新子菜单]和[文件]-[新项目]添加一个子菜单/项目。
输入 OmegaT 作为新菜单项的名称。
• 在 "命令[Command]" 字段中,通过导航[navigation]按钮找到 OmegaT 启动脚本(在解压目录中
命名为 OmegaT 的文件)并加以选中。
• 点击图标按钮(在 Name/Description/Comment 字段的右边)。
• 其它图标[Other Icons] - 浏览[Browse],导航至 OmegaT 应用程序文件夹的 /images 子文件夹。
选择 OmegaT.png 图标。
• 最后,通过“文件-保存”[File-Save]保存所作变更。
2.3.2. GNOME 用户
可按下列步骤添加 OmegaT 到菜单中:
• 在面板上单击鼠标右键——添加新启动器[Add New Launcher]。
• 在[名称](Name)字段输入
"OmegaT",在[命令](Command)字段使用[导航]按钮找到
OmegaT 启动脚本(解压后文件夹中名为 OmegaT 的文件)。选中并通过[确定](OK)按钮进行确
认。
• 点击图标按钮,然后点击【浏览】(Browse)……然后导航至 OmegaT 应用程序文件夹的 /images 子
文件夹。选择 OmegaT.png 图标。GNOME 可能无法显示当前格式的图标文件,原本看起来预期值为一
份 SVG 文件,但如果选中了该文件夹,将会显示该文件并可以选择 OmegaT.png。
2.4. 运行 OmegaT
可直接在命令行中通过包含命令行启动参数的脚本启动 OmegaT,或直接点击 OmegaT.jar 启动它。根据
发行版本方法有所不同。请确认正确设置了 PATH 以及 .jar 与 Java 启动器正确关联。查阅下文中的 "命令
行启动 " 了解更多信息。
3. Mac OS X 用户
3.1. 下载安装包
OmegaT需要Java 1.6才能运行。从苹果菜单调用 "软件更新(Software Update)..." 以更新 Java 的版
本。
6
安装和运行 OmegaT
下载OmegaT_3.n.n_Mac.zip。
3.2. 安装OmegaT
双击OmegaT_3.n.n_Mac.zip解压出来。该操作会创建一个名为 OmegaT 的文件夹。此文件夹中包含两个
文件:index.html 和 OmegaT.app. 将文件夹复制到合适的文件夹(如:Applications)。完成上述操作后,
即可删除OmegaT_3.n.n_Mac.zip文件。
3.3. 添加 OmegaT 到 Dock
拖放 OmegaT.app 到 Dock 中。
3.4. 运行 OmegaT
双击 OmegaT.app 或点击它在 Dock 中的位置。
要访问 Info.plist,请右键点击 OmegaT.app 并选择[显示包内容]"Show Package Contents",然后
右键点击该文件并选择文本编辑器来将其打开。您还可以在命令行 "cd" 到这里并在命令行编辑器(例如
emacs 或 vi)中打开 Info.plist。
您可以修改 Properties 和 VMOptions 部分。
如果要向 VMOptions 添加值 ,在两者之间放置一个空格。例如,-Xmx1024M -Duser.language=ja 将提
供 1024MB 内存并以日文用户界面启动 OmegaT。
要运行多个 OmegaT.app 实例,请双击在 OmegaT.app/ Contents/MacOS/ 中的 JavaApplicationStub 文
件。
请使用在 OmegaT.app/Contents/Resources/Java/ 中的 OmegaT.jar 文件来从命令行启动 OmegaT。查阅
下文中的 "命令行启动 " 了解更多信息。
3.5. Mac OS X 优势
可以从 Mac OS X 提供的服务直接访问 OmegaT.app。因此,您可以在 OmegaT 的任何地方选择一个单
词,然后使用在 Spotlight 或谷歌提供的服务查阅该词。您还可以使用 AppleScript 或 Automator 创建能够
自动频繁查询的服务或脚本
4. 其它系统
这里的信息适用于诸如 Solaris SPARC/x86/x64、Linux x64/PowerPC、Windows x64 的系统
4.1. 下载正确的安装包
OmegaT 提供一种为Linux (Intel x86) 和 Windows 平台准备的捆绑了 Oracle Java JRE 的版本。其他平台
的用户(Linux PowerPC, Linux x64, Solaris SPARC/x86/x64, Windows x64 等) 要使用 OmegaT 必须安
装与系统兼容的 Java JRE。
安装了与Oracle的Java 1.6 JRE兼容的Java实现了吗?
• 是:下载OmegaT_3.n.n_Windows_without_JRE.zip。该安装包可用在安装了兼容Java 1.6 JRE的JRE
的任何平台上。
• 我不知道:打开终端,输入“java -version”。如果返回了“command not found”或类似的信息,系统很有
可能没有安装 Java
• 否:获取适用于您系统的Java JRE(见下文)并下载OmegaT_3.n.n_Without_JRE.zip。
Oracle在http://www.oracle.com/technetwork/java/archive-139210.html提供了用于Solaris
x86(Java 1.6)和Linux x64、Solaris x64、Windows x64(Java 1.6)的JRE
7
SPARC/
安装和运行 OmegaT
IBM
在
http://www.ibm.com/developerworks/java/jdk/linux/download.htm
[http://www.ibm.com/
developerworks/java/jdk/linux/download.html] 提供了用于 Linux PowerPC 的 JRE
按照所需安装包的说明操作。
4.2. 安装OmegaT
要安装OmegaT,只需解压OmegaT_3.n.n_Without_JRE.zip文件。这样会在工作目录中创建./
OmegaT_3.n.n_Without_JRE/文件夹,且其中包含运行OmegaT需要的所有文件。
4.3. 安装便捷的快捷方式
按照系统的提示在方便的地方安装 OmegaT 快捷方式。
4.4. 运行 OmegaT
安装好 OmegaT 后,可直接在命令行中通过包含命令行启动参数的脚本启动,或直接点击 OmegaT.jar 启
动它。根据发行版本方法有所不同。请确认正确设置了 PATH 以及 .jar 与 Java 启动器正确关联。查阅下
文中的 "命令行启动 " 了解更多信息。
5. 使用 Java Web Start
通过Java Web Start技术(Java 1.6及以上版本的一部分),只需一次点击就可通过网络部署独立的Java
应用软件。Java Web Start 能够保证部署应用程序的最新版本以及使用正确 Java运行环境(JRE)版本。
为首次通过Java Web Start启用OmegaT,在浏览器中输入下面的网址:
http://omegat.sourceforge.net/webstart/OmegaT.jnlp
下载 OmegaT.jnlp 文件然后点击它。在安装期间,根据操作系统的不同,您可能会收到几条安全警告。
您赋予该版本的权限(可能会被认为是“对计算机的无限制访问”)和您给予本地版本的相同,也就是说它
们被允许访问计算机硬盘。如果处于在线状态,之后再点击 OmegaT.jnlp 将会检查是否有升级,如果有的
话将安装升级包并运行 OmegaT。初始化安装之后,您当然可以在离线状态使用 OmegaT.jnlp。
隐私政策:OmegaT Java Web Start 不会在您的计算机之外保存您在其中操作的任何资料。该应用程序只
在您的计算机上运行。您的文档和翻译记忆将保留在您的计算机上,并且 OmegaT 项目就没有您的工作
或信息。
请注意,如果您需要某个启动命令参数(见上文),就不得不使用正常安装。
6. 从命令行启动 OmegaT
正常情况下,没有必要从命令行启动 OmegaT。不过,从命令行启动的方法允许用户控制和修改程序的行
为。在命令行有两种启动 OmegaT 的方法:
6.1. 打开命令行窗口
命令行窗口也被叫做“终端窗口“。在 Windows 中可以称之为 "MS-DOS 窗口",可从开始菜单,程序中的
"MS-DOS" 项找到。Mac OSX 对应的是位于 应用程序[Applications] → 实用工具[Utilities] 中的应用程
序终端。
为启动 OmegaT,通常您必须执行两条命令。第一条是:
cd {文件夹}
其中 {folder} 是 OmegaT 程序,具体地是 OmegaT.jar 文件所在的文件夹的名称(带完整路径)。在实际
情况中,该命令可能是这样的:
在 Windows 上
8
安装和运行 OmegaT
cd C:\Program Files\OmegaT
在 Mac OS X 上
cd <OmegaT.app location>/OmegaT.app/Contents/Resources/Java/
在 Linux 上
cd /usr/local/omegat
该命令将目录改为包含可执行 OmegaT 文件的目录。第二条是实际启动 OmegaT 的命令。就最基本的形
式而言,该命令为:
java -jar OmegaT.jar
请注意如果在Windows外的其中操作系统中输入错误的大小写形式,例如输入omegat 而不是OmegaT ,
那么程序将不会启动!
该方法对于找出问题的根源有特别的意义:如果在使用程序过程中发生了错误,在终端窗口所显示的错误
信息对查找原因提供了有用的信息。
上面的方法对于经常性启动一个程序来说是不切实际的。为此,上述两条命令被包含在一份文件(一份脚
本、在 Windows 上也叫做一份 “.bat 文件”)。
执行该文件时,将自动执行其中的命令。因此,要修改启动命令,修改该文件即足以。
6.2. 启动命令参数
基本的参数已经在上面提到过了。修改该命令可以添加增加额外的“参数”。参数添加到首个 "java" 之后,
且在 "-jar OmegaT.jar" 之前。请注意,在 Windows 环境中您可以修改 OmegaT.l4J.ini 文件来选择自己的
偏好。在 Mac OS X 中,您可以修改在 OmegaT.app/Contents/ 中的 Info.plist 文件来达到相同的目的。
下面给出了可用参数的清单:Advanced users can obtain more information on the arguments by typing
man java in the terminal window.
• 用户界面语言
-Duser.language=XX 正常情况下,也就是 OmegaT 不带任何参数启动的情况下,程序将首先检测用户
操作系统所使用的语言。如果存在所用语言的界面, OmegaT 将会使用它。因此,如果用户的操作系
统为俄语版,而 OmageT 有俄语版的本地化版本,OmegaT 将显示为俄语用户界面、俄语菜单等等。
如果不存在用户系统的语言,OmegaT缺省使用英语。这是标准行为。
"-Duser.language=XX" 参数会使得 OmegaT 使用指定的语言而不是用户操作系统的语言。命令中的
"XX" 代表所需语言的双数字代码。要想 OmegaT 以法语界面运行(例如在俄语操作系统上),该命令
应该为:
java -Duser.language=fr -jar OmegaT.jar
• 用户国家
-Duser.country=XX 语言之后,您也可以指定国家,例如对于中文情况下的 CN 或 TW 。要使用期望的
语言显示即时入门指南,您必须同时指定语言和国家。甚至在只要一种可用组合的情况下,这也是必须
的,比如 Portuguese / Brazil 情况下的 pt_BR 。
• 字体抗锯齿——(仅Java 1.6)
-Dswing.aatext=true 该参数影响字体的抗锯齿效果,从而改善其外观。
• 内存分配
-XmxZZM 该命令给 OmegaT 分配更多内存。缺省情况下,将会分配512 MB内存,因此分配低于此大小
的内存是没有好处的。“ZZ”代表以兆字节为单位的内存。因此,启动 OmegaT 时分配 1024 MB(1G)内
存的命令是:
9
安装和运行 OmegaT
java -Xmx1024M -jar OmegaT.jar
• 代理服务器主机 IP 地址
-Dhttp.proxyHost=nnn.nnn.nnn.nnn 如果您系统上使用代理服务器,在这里指定它的地址。
• 代理主机端口
-Dhttp.proxyPort=NNNN 访问代理服务器使用的端口。
• 谷歌翻译v2
-Dgoogle.api.key=A123456789B123456789C123456789D12345678 如果您签约了谷歌翻译服务,请
在这里输入您私有的谷歌 API 密钥。请注意该密钥长度为 38 个字符。
• Microsoft Translator
确保您已经有了免费的微软账户。您需要把它注册到Windows
Azure
Marketplace
[http://
datamarket.azure.com/dataset/bing/microsofttranslator#schema]并使用Translator服务。注意免费账户
每月最多可用2M字符数。在您账户页面 [https://datamarket.azure.com/account]中有必须的主账户密钥
和客户ID两个条目:
-Dmicrosoft.api.client_id=XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX
-Dmicrosoft.api.client_secret=XXXX9xXxX9xXXxxXXX9xxX99xXXXX9xx9XXxXxXXXXX=
• 团队项目选项
-no-team处理团队工作的项目设置。使用此参数能让OmegaT不同步项目内容。
参数可以进行组合:要想以上面所举所有例子为参数启动 OmegaT 的话,命令可能是:
java
-Dswing.aatext=true
-Duser.language=pt
-Duser.country=BR
DDhttp.proxyHost=192.168.1.1 -Dhttp.proxyport=3128 -jar -OmegaT.jar
-Xmx1024M
-
6.3. 以命令行模式运行 OmegaT
控制台模式的目的是将 OmegaT 用作脚本环境的翻译工具。在控制台模式下,将不会载入任何图形化界
面(因此仅在某控制台中运行),同时会自动按要求翻译指定的项目。
6.3.1. 先决条件
要以命令行模式运行 OmegaT,必须指定有效的 OmegaT 项目。位置并不重要,因为无论如何启动时您
都必须将位置添加到命令行。
如果需要变更设置,必须提供配置文件。可通过两种方式达到这个目的:
• 正常运行 OmegaT (带图形用户界面)并进行设置。如果以控制台模式启动 OmegaT,它将使用相同
的设置。
• 如果您无法正常运行OmegaT(没有可用的图形界面):可将另一机器上安装的OmegaT设置文件复制
到特定的文件夹。位置并不重要,因为无论如何,启动时您都必须将位置添加到命令行。相关的文件是
可在用户主目录找到的filters.conf和segmentation.conf(如:Windows系统中的C:\Documents
and
Settings\%User%\OmegaT或Linux系统中的%user%/.omegat/)
6.3.2. 以控制台模式启动
要以控制台模式启动 OmegaT,必须在启动时传入额外的参数。最重要的是 <project-dir>,以及可选的 -config-dir=<config-dir>。例如:
java -jar OmegaT.jar /path/to/project \
--config-dir=/path/to/config-files/ \
10
安装和运行 OmegaT
--mode=console-translate|console-createpseudotranslatetmx|console-align
--source-pattern={regexp}
请注意所有的参数都以两个 - 字符开始。
说明:
• <project-dir> 告知 OmegaT 要翻译项目的位置。如果给出了该参数,则 OmegaT 以控制台模式启动并
翻译指定的项目。
• --config-dir=<config-dir>告知OmegaT配置文件所在文件夹。如果没有给出该参数,OmegaT将转而使
用缺省值(即用户主目录中的OmegaT文件夹,如果不可用的话则是当前的工作目录)。请注意两个 字符
• --mode=...- OmegaT 以控制台模式启动,接着执行下列的某个服务
• --mode=console-translate
在该模式中,OmegaT 将尝试使用可用的翻译记忆来翻译 /soruce/ 中的文件。这可用于在含有 TMX
文件的服务器上运行 OmegaT 来自动翻译项目。
• --mode=console-createpseudotranslatetmx
在该模式中,OmegaT 将仅根据项目的源文件创建整个项目的 TMX。您可以使用后面的参数指定要
创建的 TMX 文件:
--pseudotranslatetmx=allsegments.tmx --pseudotranslatetype=[equal|empty]
参数 pseudotranslatetype 指明了目标片段是与源片段相同或留空。
• --mode=console-align
在该模式中,OmegaT 将对齐在项目的 /source/ 目录找到的 Java 属性文件在指定位置的内容。生成
的 TMX 保存在 /omegat/ 目录,名称为 align.tmx。
此时需要额外的参数指明目标数据的位置:
--alignDir={已译文件的位置}
alignDir 必须包含项目目标语言的翻译。例如,如果项目为 EN->FR,则 alignDir 必须包含以 _fr 结尾
的包。生成的 TMX 保存在 omegat 目录,名称为 align.tmx。
• --source-pattern={regexp}
如果使用了模式,则该选项将指定要自动翻译的文件。如果未使用该选项,则处理所有文件。这里是一
些限制源文件匹配的实际例子:
• .*\.html
此时将翻译所有的 HTML 文件,需要注意到 *.html 在正则表达式中指定时需要进行转义 (\.)。
• test\.html
仅翻译source文件夹下当前目录中的test.html。如果在其子目录下有名为test.html的文件,它们会被
忽略。
• dir-10\\test\.html
仅翻译dir-10文件夹中的test.html文件。再次强调反斜杠也需要进行转义。
• --output-tag-validation-={regexp}
如果使用了模式,则该选项将指定要自动翻译的文件。如果未使用该选项,则处理所有文件。这里是一
些限制源文件匹配的实际例子:
11
安装和运行 OmegaT
• .*\.html
此时将翻译所有的 HTML 文件,需要注意到 *.html 在正则表达式中指定时需要进行转义 (\.)。
• test\.html
仅翻译source文件夹下当前目录中的test.html。如果在其子目录下有名为test.html的文件,它们会被
忽略。
• dir-10\\test\.html
仅翻译dir-10文件夹中的test.html文件。再次强调反斜杠也需要进行转义。
• --tag-validation=[abort|warn] outputFileName
该选项支持在批处理模式中进行标签验证。如果选择了abort ,则标签验证器会在遇到首个非法片段时
停止。如果使用warn,则标签验证器会处理所有片段并把含非法标签片段的警告写入指定文件。
6.3.3. 静默选项
控制台模式专用的一个附加命令行参数: --quiet。在静默【Quiet】模式下,屏幕上将显示更少的日志信
息。在状态栏通常可以看到的所有信息都不会被显示。
用法:java -jar OmegaT.jar /path/to/project --mode=console-translate --quiet
6.3.4. 标记验证选项
控制台模式专用的一个附加命令行参数:--tag-validation=[abort|warn]。添加此参数后,会在翻译/文本对
齐之前验证标签。如果该参数值为 abort,那么在遇到标签错误时打印出错误,同时程序停止。如果该参
数值为 warn,则打印错误且 OmegaT 继续执行。
用法:java -jar OmegaT.jar /path/to/project --mode=console-translate --tag-validation=abort
7. 从源代码编译 OmegaT
请注意您还需要
ant
程序(http://ant.apache.org/bindownload.cgi)来编译
OmegaT。解
压OmegaT_3.n.n_Source.zip文件并进入OmegaT_3.n.n_Source文件夹或SVN检出代码的./omegat/文件
夹。请确认 build.xml 文件存在该目录中。然后,在命令行输入:
$ ant jar release
该命令将在 ./dist/ 目录中创建一份完整的 OmegaT 发行文件,其中包含运行 OmegaT 需要的所有文件。
12
Chapter 4. 用户界面
1. OmegaT主窗口、其他窗口及对话框
OmegaT主窗口包括主菜单、状态栏和几个窗格。还有另外的用来改变OmegaT项目设置的窗口和对话
框。下面的信息概述了它们的用途和调用方式:
Table 4.1. OmegaT主窗口
编辑器窗格
输入编辑译文的地方
匹配窗格
显示翻译记忆中最相似的片段
词汇表窗格
显示当前片段中存在的术语
词典窗格
显示当前片段中词汇的词典提示
机器翻译窗格
显示由机器翻译服务提供的译文
笔记窗格
注解附属于当前片段,例如可选译文或键值对格式
中的当前键
注解面板
对于PO文件为作者的注解,对于XHTML为待译属
性名称。
Table 4.2. 其它窗口
标签验证窗口
用来检验标签(用Ctrl+T打开、Esc关闭)
帮助浏览器
用来显示用户手册(用F1打开、Esc关闭)
统计窗口
用来查看项目统计信息的窗口,通过工具 → 统计打
开。
匹配统计窗口
用来查看项目匹配统计的窗口,通过工具 → 匹配统
计打开。
Table 4.3. 设置对话框
项目属性
用来修改项目文件夹和语言(通过Ctrl+E 快捷键或
项目 → 属性……打开、Esc关闭)
字体
用来修改OmegaT显示原文、译文、匹配和词汇表
术语的字体(通过选项 → 字体……打开、Esc)
文件过滤器
用来调整所支持格式的处理方式(通过选项 → 文件
过滤器……打开,通过 Esc 关闭)
分割规则
用来改变把源文本分割成句子的方式(通过选项 →
片段分割 打开,通过 Esc 关闭)
编辑行为
用来改变在片段间往返移动时 OmegaT 的行为(通
过选项 → 编辑行为……关闭,通过 Esc 关闭)
13
用户界面
2. OmegaT 主窗口
Figure 4.1. OmegaT 主窗口
主窗口由几个窗格、主菜单和状态栏组成。您可以改变任何窗格的位置,甚至可以通过点击和拖动窗格的
名称将其变成独立的窗口。根据窗格的不同状态,在它的右上角可能会显示不同的标志:
Note
如果您无法看到所有窗格(处于打开或最小化状态),按下选项>恢复主窗口将把它们恢复为原始
状态。
Table 4.4. 窗格 widget
最小化窗格后,这样只它的名称在窗口的底部
最大化窗格
14
用户界面
恢复最大化操作前的布局
从主窗口中移出窗格
把窗格停靠到主窗口内
需要时您可以重叠窗格。重叠后的窗格将在顶部显示一个标签。窗格之间的分割线可以拖动来改变窗格的
尺寸。当您忘记了对用户界面进行哪些调整后,可在任何时候使用 选项→恢复主窗口来恢复原始布局。
在右下角方框中的内容表示翻译工作的进度(左列的数字请参考上面的图示):
Table 4.5. 主窗口 - 方框
27/27
片段数 - 已译/总数(当前文件)
9319/16338
独特片段数 - 已译/总数(整个项目)
31175
项目中的片段总数(包括重复)
103/114
在当前片段中原文和译文中的单词数
在实际中,最重要的数字是第二对,它告诉您总的有多少,到现在已经做了多少。在这个例子中显然项目
已经完成了,因为已经翻译了所有的独特片段。
2.1. 编辑器窗格
这是输入和编辑译文的地方。编辑窗格显示部分被翻译的文本:已经被翻译好的文本将会显示为已翻译,
而未翻译的文本以原始语言显示。显示的文本被分成片段,您可以在文档中上下移动或者双击某个片段进
行编辑。在上面的情况中,已译片段显示为黄色。
其中某个片段是激活状态的片段。这是那个显示为两部分的片段。上面部分是源语言,使用绿色背景并加
粗字体显示;下面部分是编辑区域,以标记结尾:这里的标记是 <segment nnnn>,其中 nnnn 为当前片段
在项目中的编号。您可以使用上面部分作为参考,覆盖或者修改编辑区域的内容以使它包括译文。
根据不同的首选编辑行为,未译片段的编辑区域可能是空的、可能包含源文本或者与待译内容最接近的字
符串的译文。移动到另一个片段时,译文将被确认并保存。如果您想让译文等同于原文,只需简单地删除
所有文本使编辑区域为空(Ctrl+A 然后用 Del 删除)。OmegaT 会保存等同于原文的译文。该功能对翻译
包含商标、姓名或专用名词以及不须翻译的第三方语言的文档非常有用。请参阅译文编辑了解更多信息。
如果在编辑窗格中点击右键,会打开弹出菜单,其中提供了剪切、复制、粘贴(即功能等同于
Ctrl+C 和 Ctrl+V)和转到片段功能。
15
Ctrl+X,
用户界面
2.2. 模糊匹配窗格
Figure 4.2. 匹配窗格
匹配查看器中显示译法记忆中最相似的片段,包括您在项目翻译过程中创建的项目翻译记忆,也包括从您
早前工作中导入的辅助记忆,或者是您从客户或翻译代理那里得到得到的。
当您进入下一片段,第一个模糊匹配(拥有最高匹配百分比的那个)自动被选中。您可以使用 Ctrl+2, 3, 4
或 5选择另一个。当然,如果没有第 5 号匹配,按下Ctrl+5是没有效果的。要在译文中使用选中的匹配,
请使用 Ctrl+R 以用匹配替换目标区域,或使用 Ctrl+I 以将匹配插入到当前光标位置。
匹配率大体上相当于匹配片段和被匹配片段中相同的单词数量,并除以两者单词数量中较大者。被选中的
模糊匹配会以粗体突出显示,对正在翻译片段中缺少的单词显示为蓝色,而在缺少单词旁边的单词显示为
绿色。在上述示例中源片段为Context menu command。第一个匹配度是100%,因为所有的单词都相
同。而接下来的两个匹配和第4个匹配是类似的,但不同。在显示匹配率的这一行还显示了包含该匹配的
翻译记忆的名称。如果未显示文件名,则发现匹配的源为缺省项目的翻译记忆。孤立片段(第2个匹配)
表示该片段存在默认项目的翻译记忆中,但不存在于项目的源片段。
实际上还有三个可用的匹配估计(在上面第4个匹配中为66/66/30)。它们的含义如下:
• 使用解析器插件后的匹配百分率
• 缺省的OmegaT匹配度,即忽略数字和标签后匹配词汇数除以总的词汇数
• 包含数字、标签的OmegaT匹配度
2.2.1. 定制模糊匹配窗格
在选项>外部TMX中有一些用来配置匹配窗格显示的选项。
Figure 4.3. 匹配窗格设置
16
用户界面
上图显示了默认的匹配显示模板。可以下列变量定制该内容:
Table 4.6. 匹配窗格设置
${id}
从1到5的匹配编号
${sourceText}
当前匹配的原文
${targetText}
当前匹配的目标文本
${diff}
显示源和匹配之间差异的字符串。提示:如果您正
在翻译的文本经过了更新请使用该变量。
${score}
解析器得出的百分率
${noStemScore}
不计算数字和标签的百分率
${adjustedScore}
校准的百分率
${fileNameOnly}
TMX的名称
${filePath}
TMX的完整路径
${fileShortPath}
相对于/tm根目录的TMX路径
${creationID}
译文作者
${creationDate}
译文创建日期
${fuzzyFlag}
表示该匹配为模糊匹配(当前仅用于来自PO文件中
带#fuzzy标志的翻译)
2.3. 词汇表窗格
词汇表窗格允许您使用个人收集的词汇和专业术语,这些词汇都存放在词汇表文件中。它显示当前片段中
找到的术语。下面例子中源片段为“Context menu command”(就像上面例子中模糊匹配显示的一样),
显示出在可用的词汇表(微软术语集和斯洛文尼亚语Linux用户组词汇表)中找到的术语。
Figure 4.4. 词汇表中的多词条目
如果您激活选项→翻译提示中的翻译提示,那么可在源片段中突出显示的单词上点击右键来打开包含由词
汇表提供的可选译文的弹出菜单。选择其中一个可将其插入到目标片段的当前光标位置。您可以让词汇表
窗格中的首选译文突出显示,并通过右键点击选区来将它插入目标片段中。
2.4. 词典窗格
词典是等同于 Merriam Webster、Duden、Larousse 等桌面上的印刷词典的电子版本。请在词典章节中了
解关于它们的更多信息
17
用户界面
2.5. 多选译文窗格
特定的源片段在不同的语境中可能需要集中不同的翻译。如果片段的当前译文不适合,则用户可选择编辑
→创建可选译文。之后输入的目标文本会被视为当前源片段的可选译文。您可以通过编辑→用作默认译文
指定某个可选译文(例如其中可能性最大的译文)为默认译文。
2.6. 笔记窗格
译员可添加笔记到打开的片段(例如之后返回该片段并撤销译文、检查可选译文是否正确或询问同事的看
法。您可通过前往→后一笔记和前往→前一笔记以浏览笔记。
2.7. 注解面板
某些专门用于翻译工作的文件格式(例如PO)允许包含注释。这样就为译者提供了待译片段的相关信
息。在下面的示例中,包含为译者提供警告的PO文件可用于其作者检查译文的长度:
Figure 4.5. 注解面板
2.8. 机器翻译窗格
在机器翻译窗格中,打开后其中会包含由机器翻译工具为当前片段提供的翻译建议。按 Ctrl+M 可使用建
议译文替换当前片段的译文。请到机器翻译章节了解更多
2.9. 主菜单
通过主菜单可访问 OmegaT 的所有功能。参阅主菜单附录了解所有菜单和菜单项的完整描述。最常用的
功能可以使用键盘快捷键访问,因此当您习惯了使用它们之后,在翻译的时候根本不需要使用菜单。请参
阅菜单和键盘快捷键了解细节。
2.10. 状态栏
在主窗口底部的状态栏显示和工作流相关的信息。该栏目向用户给出仅在进行的某个操作的反馈。它也会
显示和当前片段匹配的模糊和术语的数量。
3. 其它窗口
3.1. 项目文件
项目文件窗口显示所有的项目文件和其他项目的信息。当 OmegaT 载入项目时这个窗口自动出现。使用
Ctrl+L 打开,使用 Esc 关闭。项目文件窗口显示了下列信息:
• 项目中所有待译文件组成的列表。这是在源文件文件夹中OmegaT当前能够识别的文件。点击任何一份
文件将打开它用于翻译
18
用户界面
• 当前在编辑窗格中打开的文件用蓝色背景突出显示。按Enter将在编辑窗格中移动到选中文件的开始处
• 每个文件条目包含它的名称、文件过滤器类型、编码和它所包含的片段数
• 整个项目的片段总数、独特片段数和已译独特片段数显示在底部
独特片段数目的计算方法为统计所有的片段并去除所有重复片段。(“独特”
的:"Run" 和 "run" 被看作是不同的片段)
的判断方法是区分大小写
通过“片段数”和“独特片段数”的差异可粗略估算出文本中有多少重复内容。但是请注意:该数字并未透露
这些重复的相关性,它们可能是多次重复的相当长的句子(此时是幸运的)或关键字表格(不那么幸运
了)。项目 omegat 文件夹中的 project_stats.txt 提供了每份文件更多的片段细节信息。
修改分割规则可能改变片段数和独特片段数。然而,一旦启动项目的翻译工作,就应该避免发生这样的事
情。请参阅分割规则章节了解更多信息。
添加文件到项目:您可以通过点击“导入源文件”按钮将源文件添加到项目中。它将选中的文件拷贝到
/
source 目录并重新载入项目以导入新文件。通过点击“从 MediaWiki 导入”按钮并输入相应的网址,您还可
以添加互联网页中用MediaWiki编写的源文件。
3.2. 搜索窗口
您可以用使用搜索窗口查找项目中的某个片段。可以同时打开多个搜索窗口。在主窗口中使用Ctrl+F可打
开一个新的搜索窗口。搜索窗口由三个部分组成:用于输入搜索字符串或关键字的文本框、用于设置搜索
的标志和单选按钮、包含搜索结果的显示区域。请参阅 搜索 章节来了解关于搜索窗口的更多信息。
3.3. 标签验证
标签检验窗口检测译文中出现的所有标签错误和不一致并列出来。使用Ctrl+T 打开该窗口。该窗口显示了
一个三列表格,其中列出了指向出错片段的链接及其原文和译文内容:
Figure 4.6. 标签验证窗口
标签用加粗蓝色突出显示,以便于对源内容和译后内容进行比较。点击该链接可在编辑器窗格中跳转至该
片段。如果必要的话,修正错误然后按Ctrl+T 键返回标签验证窗口以修正其它错误。在上述的第一和第三
种情况中,标签的错误成对出现,而在第二种情况中开始标记缺失了 < 标记。
标签错误是指译文中标签的顺序和数目与源片段不一致。在标签验证窗口中包含的某些情况的标签是必要
的和良性的,但有些在创建已译文档时会导致问题。标签通常代表了原始文本中的某种格式。开始翻译前
对源文本格式的简化很大程度上有助于减少标签的数目。
3.4. 统计(&S)
统计窗口(通过工具>统计打开)显示了OmegaT当前项目的统计信息,包括整个项目的总的统计信息和
其中每个待译文件的详细情况。这里显示的统计信息是tab分隔的project_stats.txt文件(在omegat子文件
夹),方便用户加载到电子表格程序。您可用Ctrl+A 、Ctrl+C 、Ctrl+V 复制/粘贴其中的内容。
19
用户界面
Figure 4.7. 项目统计
3.5. 匹配统计
通过工具/匹配统计可访问统计信息。该统计需要CPU进行繁重的运算而耗时较多,所以在计算时会显示
进度条。至于相关的分类,下面这些组的分类符合工业标准:重复率、精确匹
配、95%-100%、85%-94%、75%-84%、50%-74%和无匹配。该信息根据片段、单词和字符(含和不含
空格)计算出来的。请注意在OmegaT中的统计数值可能与其他CAT工具略有差异。
Figure 4.8. 匹配统计
注意:这些总数是较接近项目中工作量的近似值,因此可作为您计算费用或价格的参考。
在最后一列片段间的空格无需考虑。重复表示多次出现在文本中的相同片段。第一个片段及其内容将被归
类到“无匹配”中,而剩余片段则被视为第一个的重复。如果在项目的翻译记忆中存在多个相同源片段的译
文,这些及其他已译独特片段将被归类为“精确匹配”。在需要时,标准统计窗口中会显示独特片段数,不
论它们是否已经翻译。
分类中的其他部分 (50-100%) 包含了具有模糊匹配的未译片段。在统计重复和精确匹配时模糊匹配不仅可
以来自 /omegaT,也可以可以来自 /tm 文件夹。与 project_save 翻译记忆的匹配的唯一区别是外部 TM 中
的统计不会得到精确匹配,而只是 100%。如果不想使用外部翻译记忆参与统计,可以让 /tm 文件夹为空
或临时改变项目设置以让 /tm 指向其他地方。
该匹配统计是 tab 分割的,您可用 Ctrl+A , Ctrl+C , Ctrl+V 来复制/粘贴它们,例如到工作表或费用统计程
序中。在计算后,该数据还可以在 omegat/project_stats_match.txt 中找到。需要注意的是该文件是有时间
戳记录的,因为计算不是瞬时的(相对于统计),所以可能很快过时。
20
用户界面
3.6. 帮助浏览器
帮助浏览器(显示本手册)可通过按 F1 或调用主菜单中的帮助→用户手册……条目来打开。在该窗口中
会显示手册和两个按钮:退后和内容。用户手册是一份包含各个不同章节链接的 HTML 文档。像在网页浏
览器中那样点击一个链接将会打开要看的页面。
用户手册存放在 OmegaT 安装目录的 doc 子目录中,因此可在浏览器中打开 doc/en/index.hmtl 文件来查
看英文文档。用这种方法,您也可以打开外部的链接,因为内建的帮助浏览器并不接受外部互联网链接。
21
Chapter 5. 菜单和键盘快捷键
1. 主菜单
OmegaT 的所有功能均可通过编辑器窗口顶部的菜单栏来调用。多数功能也可以通过键盘快捷方式调用。
快捷键通过按 Ctrl 和字母键来激活。某些快捷键还包含其他按键。为了增强可读性,本手册中这些字母以
大写形式出现。Ctrl 在 Windows 系统中使用, UNIX 和类 UNIX 操作系统使用 Ctrl 或 Control 键。Mac 用
户应该使用 cmd+键 来代替它。"Cmd" 键就是在苹果键盘上印有 "command" 或“苹果”符号的那个键。
您可以根据自己的需要自定义现有的或增加新的快捷键。请参阅附录——自定义快捷键
Table 5.1. 主菜单
项目
编辑
前往
查看
工具
选项
帮助
1.1. 项目
Table 5.2. 项目菜单
新建
创建并打开一个新项目。创建项
目的对话框与编辑项目属性的相
同。请参阅Chapter 6, 项目属性
打开
Ctrl+O
打开之前创建的项目。
导入源文件
将选中的文件复制到源目录,并
重新加载项目以载入新文件。
从MediaWiki导入……
根据输入的网址从 MediaWiki 页
面导入单元。
重新载入
F5
重新载入项目以使源文件的外部
修改生效,并保留之前的翻译记
忆、术语表内容和项目设置。
关闭
Ctrl+Shift+W
保存翻译并关闭项目。
保存
Ctrl+S
将内部的翻译记忆保存到硬
盘。OmegaT 每十分钟保存一次
翻译,且在关闭项目或退出前自
动保存。
创建已译文档
Ctrl+D
根据您对文档文本的翻译创建目
标文档。创建的目标文档放置
在目标文件夹中。
属性……
Ctrl+E
显示项目属性对话框以便编辑项
目语言和文件夹位置。
项目文件……
Ctrl+L
关闭或打开项目文件窗口(取决
于它处于打开或关闭状态)。
退出
Ctrl+Q
保存项目并退出 OmegaT。如果
您未手动保存项目,系统将会让
您确认是否真要要退出。
1.2. 编辑
注意:在多数程序中可以找到的(复制/剪切/粘贴)条目没有出现在这个菜单中,但是您可以通过系统快
捷键使用。例如:
Table 5.3. 复制/剪切/粘贴快捷键
复制
Ctrl+C
复制选中的文本到剪贴板。
22
菜单和键盘快捷键
剪切
Ctrl+X
将选中的文本复制到剪贴板并删
除选中文本。
粘贴
Ctrl+V
将剪贴板中的文本粘贴到光标位
置。
取消前一操作
Ctrl+Z
恢复前一个编辑操作发生之前的
状态。一旦所修改的片段生效,
该操作将会失效。
重做前一操作
Ctrl+Y
恢复前一个编辑操作取消之前的
状态。一旦所修改的片段生效,
该操作将会失效。
用匹配替换
Ctrl+R
使用当前选中的模糊匹配覆盖整
个目标片段(缺省选中第1个匹
配)。
插入匹配
Ctrl+I
将当前选中的模糊匹配插入到光
标位置。如果已选中了目标片段
的某个部分,则此功能会覆盖那
部分。
用机器翻译替换
Ctrl+M
使用选择的机器翻译服务提供的
译文取代目标片段。如果未激活
机器翻译服务(参阅下面的 菜单 >
选项),将不会有任何动作。
用源文本替换
Shift+Ctrl+R
使用源片段覆盖整个目标片段。
插入源文本
Shift+Ctrl+I
在光标位置插入源段落内容。
插入源标签
Shift+Ctrl+T
在光标位置插入源标签。原文中
的所有有用的标签(如OmegaT和
自定义的、Java、printf等标签)
都将被插入到当前片段,不论它
们当前是否存在。标签内的文本
被替换为空格:<f0><f1>This is
text</f0></f1> thus will be copied
as <f0><f1>one_space</f0></f1>
导出选中部分
Shift+Ctrl+C
将当前选中内容导出至文本文件
进行处理。如果未选中文本,将
导出当前的源片段至该文件。当
用户退出 OmegaT 时,为了与通
常的剪贴板行为一致,该文件不
会清空。导出的内容被复制到位
于用户首选项文件文件夹(请参
阅Chapter 8, OmegaT文件和文件
夹)的 selection.txt 文件中。
创建词汇表条目
Shift+Ctrl+G
可让用户在缺省的词汇表文件中
创建条目。
在项目中搜索……
Ctrl+F
打开新搜索窗口。
转换大小写为……
Shift+F3(查阅文本)
将目标片段中突出显示的文本之
大小写状态修改为选定选项(小
写、 大写或首字符大写)。可使
用 Shift+F3 在三种选择之间循环
切换。如果未选中文本,
OmegaT 将选中包含了紧挨着光
标右边字母的单词。
该菜单本身包括下列条目:
Table 5.4. 编辑菜单
23
菜单和键盘快捷键
选择第 #N 号模糊匹配
Ctrl+#N
(#N 为 1 至 5 之间的数
字) - 选择在匹配查看器中列出的
第 N 个模糊匹配项,并将其替代
或插入该段中。Section 2.2, “模糊
匹配窗格” 描述了关于颜色代码的
细节。
用作缺省译文
如果当前片段有多个可选译文,
您可以标记所选择的译文为缺省
译文。如果仅有一个可用译文,
则该条目会显示为灰色。
创建可选译文
同样的片段在不同的语境中可能
会使用不同的译文。如果当前译
文不适合,则选择该菜单项并输
入可选译文。
后一未译片段
Ctrl+U
移动到翻译记忆中无相同内容的
后一个片段。
后一片段
Ctrl+N 或 Enter or Tab
移动到后一片段。如果当前片段
是文件中的最后一个片段,将移
动到下个文件的第一个片段。
前一片段
Ctrl+P 或 Ctrl+Enter 或 Ctrl+Tab
移动到前一片段。如果当前片段
是文件中的第一个片段,将移动
到前个文件的最后一个片段。
片段序号……
Ctrl+J
输入片段序号来打开片段。
后一笔记
打开含笔记的下一个片段。
前一笔记
打开含笔记的前一个片段。
在历史中前进……
Ctrl+Shift+N
OmegaT 会记住执行过的片段。
使用该命令可以前进到某片段,
即您使用在编辑历史中回退……
命令之前所处片段。
在历史中回退……
Ctrl+Shift+P
通过该命令一次可以返回一个片
段,在稍后可使用下面的在编辑
历史中前进……命令返回当前片
段。
1.3. 前往
Table 5.5. 前往菜单
1.4. 查看
Table 5.6. 查看菜单
标记已译片段
如果选中该选项,已译片段将会标记为黄色。
标记未译片段
如果选中该选项,未译片段将会标记为紫色。
显示源片段
如果选中该选项,将会显示源片段并标记为绿色。
如果未选中,将不会显示源片段。
标记非独特片段
如果选中该选项,则非唯一片段会被标记为浅灰
色。
标记含笔记片段
如果选中该选项,则含笔记片段会被标记为青绿
色。该标记优先于标记已译片段和标记未译片段功
能。
标记非中断空白
如果选中该选项,则片段中的非中断空白字符会带
有灰色背景显示。
24
菜单和键盘快捷键
修改信息
设置显示修改信息选项来选择是否显示上次修改当
前片段的时间和作者。可设置为所有来显示所有片
段的这些信息或不显示来关闭该选项。
1.5. 工具
Table 5.7. 工具菜单
检验标签
Ctrl+T:检查格式化文件中的丢失或者错误放置的
标签。将会显示一份含有错误和可能不一致标签的
片段清单。请参阅检验标签和Chapter 12, 处理格式
化文本。
移除标签
启用该选项后,会从源片段中移除所有格式化标
签。在处理含无用内联格式的文本(如OCRed
PDF、转换错误的.odt或.docx等)时很有用。这样
只移除内联标签,所以一般来说可正常打开目标文
档。不可见的格式信息(即在OmegaT编辑器中不
显示为标签的那些)会保留在目标文档中。
统计(&S)
打开新的窗口并在其中显示项目的统计数据,即整
个项目和项目中每个文件的统计数据。
匹配统计(&M)
显示当前项目的匹配统计:对于片段、单词和字符
的重复、精确匹配、模糊匹配和无匹配的数目。
1.6. 选项
Table 5.8. 选项菜单
使用 Tab 前进
设置片段检验键为 Tab来代替缺省的Enter。该选项
对于一些中文、日文、韩文字符输入系统非常有
用。
退出前总是确认
程序在关闭前必须得到确认。
机器翻译
允许您激活/取消激活程序提供的机器翻译工具。激
活后,使用 Ctrl+M 可将翻译建议插入到当前片段的
目标部分。
词汇表
保留至将来供插件使用
翻译提示
可以让您激活/取消激活翻译提示功能,并设置精确
匹配选项。翻译提示激活了在原文中突出显示的单
词上的右键菜单功能,这样在此单词上点击时将出
现含有词汇表条目的弹出菜单。接着可以点击喜欢
的翻译来将其插入目标片段的当前位置。选中翻译
提示/精确匹配时只检查完整的单词,否则也会匹配
部分单词。
字体……
显示对话框以修改文本显示字体。感觉窗口尺寸变
化非常缓慢的旧款计算机的用户可以尝试改变字
体。请参阅杂项中的字体设置
文件过滤器……
显示文件过滤器对话框来设置文件的分析和处理方
式。
分割规则……
打开源片段分割设置对话框来配置文本片段分割设
置。
拼写检查……
显示拼写检查工具设置窗口以安装、配置和激活拼
写检查器。
编辑行为……
显示翻译编辑对话框以进行配置。
标签验证……
对于程序员:您可以配置标签验证器选项以同时检
查程序(%...)变量。
25
菜单和键盘快捷键
团队……
在这里输入您的名字,它将被附加到您翻译的所有
片段中。
外部 TMX ……
用户可决定如何处理外部TMX文件(即不是由
OmegaT生成的)中的标签。
查看……
包含了粗体显示所有源片段和标记首个非独特片段
的选项。
查看……
用户可选择自动保存项目的间隔(分钟数和秒
数)。最小间隔为10秒。
登录代理……
如果使用代理访问您的项目,请输入用户名和密
码。
恢复主窗口
将 OmegaT 窗口的组件恢复到缺省状态。在对一个
或多个组件进行了分离、移动、隐藏操作之后,无
法对它们进行还原时可以使用这个功能。它还可用
于在更新 OmegaT 后不正确显示窗格时。
1.7. 帮助
Table 5.9. 帮助菜单
用户手册……
F1:在独立的窗口中使用帮助浏览器打开本手册。
关于……
显示版权、制作人员和授权信息。
2. 键盘快捷键
在主窗口中可以使用以下快捷方式。当其他窗口挡在前面时,点击主窗口使它位于前方,或者按 Esc 键关
闭当前窗口。
快捷键通过按 Ctrl 和字母键来激活。某些快捷键还包含其他按键。为了增强可读性,本手册中这些字母以
大写形式出现。
Ctrl 键在 Windows 系统中使用,UNIX 和类 UNIX 操作系统使用 Ctrl / Control 键。Mac 应该转为使用 cmd
+key。Cmd 键就是在苹果键盘上印有 "command" 或“苹果”符号的那个键。
• 项目管理
• 编辑
• 来回移动
• 参考窗口
• 其它
2.1. 项目管理
Table 5.10. 项目管理快捷键
打开项目
Ctrl+O
打开对话框以打开一个现有的项
目。
保存
Ctrl+S
将当前的工作保存到位于项目的
omegat
目录下的
project_save.tmx 文件中。
关闭项目
Shift+Ctrl+W
关闭当前项目。
创建已译文档
Ctrl+D
在项目的目标文件夹创建已译文
档,同时在项目的根目录中创建
26
菜单和键盘快捷键
翻译记忆文件((level1,level2 和
omegat tmx 文件)。
项目属性
Ctrl+E
显示项目设置并进行可能的修
改。
取消前一操作
Ctrl+Z
取消当前目标片段中的前一个编
辑操作
重做前一操作
Ctrl+Y
重做当前目标片段中的前一个编
辑操作
选择第 #N 号匹配
Ctrl+#N
#N 为 1 至 5 之间的数字. 选中匹
配窗口中显示的第 N 个匹配内容
(缺省情况下选中第一个匹配)
用匹配替代
Ctrl+R
使用选中的匹配替换当前目标段
内容(缺省情况下选中第一个匹
配)
插入匹配
Ctrl+I
向当前的片段的光标位置插入选
中的匹配(缺省情况下插入第一
个匹配)
用源文本替换
Ctrl+Shift+R
用源文本内容替换当前的目标片
段。
插入源文本
Ctrl+Shift+I
在目标片段的当前位置插入源文
本内容
插入源标签
Ctrl+Shift+T
在目标片段的当前位置插入源标
签
在项目中搜索……
Ctrl+F
显示一个对话框引导在项目中的
搜索
用机器翻译替换
Ctrl+M
使用原文的机器翻译的译文取代
目标片段。如果未激活机器翻译
服务(参阅下面的 菜单 > 选
项 > 机器翻译),将不会有任何动
作。
导出选中部分
Shift+Ctrl+C
将当前选中内容导出至文本文件
进行处理。
创建词汇表条目
Shift+Ctrl+G
可让用户在缺省的词汇表文件中
创建条目。
后一未译片段
Ctrl+U
将编辑字段转到项目翻译记忆中
未登记的后一个片段。
后一片段
Ctrl+N,Enter 或 Return
移动编辑区域到后一个片段。
前一片段
Ctrl+P
将编辑区域转移到前一个片段
片段序号……
Ctrl+J
移动到所输入序号的片段
在历史中回退……
Ctrl+Shift+P
在历史中回退……
在历史中前进……
Ctrl+Shift+N
在历史中前进……
2.2. 编辑
Table 5.11. 编辑快捷键
2.3. 来回移动
Table 5.12. 来回移动快捷键
27
菜单和键盘快捷键
2.4. 其它
Table 5.13. 其他快捷键
项目文件清单
Ctrl+L
显示项目文件列表
检验标签
Ctrl+T
打开标签验证窗口
导出选中部分
Shift+Ctrl+C
输出当前选中内容,如果未选中
的话输出当前源片段。该文本被
导出到纯文本文件。
在项目中搜索……
Ctrl+F
打开一个新的搜索窗口
帮助文件
F1
在独立的窗口中显示 OmegaT 帮
助文件
28
Chapter 6. 项目属性
1. 属性对话框
项目 → 属性…… (Ctrl+E)对话框可用来修改项目文件夹和语种。
可以在翻译进行的过程中对项目的属性进行修改。请注意对项目设置的变更可能已经产生结果,特别是在
重新加载项目后。在您还没有丰富的OmegaT使用经验时,最安全的办法是在翻译开始的时候决定好所有
的设置——除非您意识到自己犯了一个严重的错误。查阅防止数据丢失部分了解如何保护您的工作成果。
29
项目属性
Figure 6.1. 项目属性窗口
它包括:
30
项目属性
• 设置项目的源和目标语言的区域
您可以手动输入语种或者通过下拉菜单选择。必须要记住:修改语言可能会导致当前使用的翻译记忆变
得不可用,由于它的语言对不再与新语言相匹配。
• 启用语句级分割 复选框
分割规则设置只影响 OmegaT 处理源文件的方式。语句级分割是主要的分割方式,所以正常情况下应
该选中该复选框。
在一些罕见的情况下,可能优先选择其替代方案即段落级分割方式。改变该标志不会对已经译好翻译记
忆进行修改。如果您在翻译中决定从语句分割切换为段落分割,项目的内部翻译记忆不会改变
(OmegaT 可能会更新未使用语句分割的旧翻译记忆,但反过来却不会)。
改变分割规则设置可能导致一些已经译好的片段被分拆或者合并。这实际上会让它们回到“未译”状态,
因为它们不再和记录在翻译记忆中的片段相匹配,即便旧的的匹配翻译仍然存在。
• 分割规则……按钮
分割规则通常应用于所有项目。但是用户可能需要设置一些针对当前项目的一些规则。点击此按钮打开
对话框,选中其中的项目专用分割规则复选框,然后根据需要调整分割规则。新的规则集将和项目保存
在一起,而不与通用分割规则集相冲突。要删除项目专用分割规则,请取消选中此复选框。请参阅源分
割规则章节了解更多关于分割规则的信息。
暗示:特定项目的分割规则集保存在project/omegat/segmentation.conf。
• 文件过滤器……按钮
和上面类似,用户可以创建项目专用文件过滤器,它和项目保存在一起并仅对当前项目有效。要创建项
目专用文件过滤器集,点击文件过滤器……按钮,并在打开的窗口中选中启用项目专用过滤器复选框。
更新后的文件过滤器配置文件的副本会与项目保存在一起。要删除项目专用文件过滤器,请取消选中此
复选框。注意在选项->文件过滤器菜单中,修改的是全局用户过滤器而不是项目专用过滤器。请参阅文
件过滤器章节了解关于本主题的更多信息。
提示:特定项目的文件过滤器集保存在project/omegat/filters.xml。
• 自动传播翻译复选框
源文档中包含非唯一片段时,自动传播翻译复选框为用户提供了下面两种类似自动翻译的功能:选中
时,首次翻译的片段将被假定为默认翻译,其目标文本会自动用于以后翻译过程中的提示。当然误译片
段可以之后手动通过创建可选译文进行纠正。如果未选中自动传播复选框,则含可选译文的片段会保持
未译状态至用户决定使用哪种译文。
• 移除标签复选框
启用该选项后,会从源片段中移除所有格式化标签。在处理含无用内联格式的文本(如OCRed PDF、
转换错误的.odt或.docx等)时特别有用。一般情况下都能正常打开目标文档,因为只移除了内联标签。
不可见的格式信息(即在OmegaT编辑器中不显示为标签的那些)会保留在目标文档中。
• 设置项目文件夹的区域
此处您可选择不同的子文件夹,如源文件子文件夹、目标文件子文件夹等。如果您输入了还不存在的文
件夹名称,则 OmegaT 会创建它们。如果您要修改项目文件夹,必须紧记这样做并不会将现有的文件
从旧文件夹移动到新的位置。
31
Chapter 7. 文件过滤器
OmegaT 的特色之一是可高度自定义过滤器,它让您可以配置众多的过滤器。文件过滤器是一堆代码,它
能够:
• 从某些特定文件格式中读取文档。例如:纯文本文件。
• 将可翻译的内容从文件中提取出来。
• 通过将可翻译内容替换为译文,自动修改可译文档的文件名。
要查看OmegaT能处理哪些文件格式,请打开选项>文件过滤器……菜单
多数用户应该会对缺省的文件过滤器选项感到满意。如果不满意,可以从主菜单选项→文件过滤器……打
开主对话框。通过选择项目属性中的文件过滤器……属性,您还可以启用仅用于当前项目的项目专用文件
过滤器.
通过项目→属性……您还可以启用项目专用过滤器。点击文件过滤器按钮并选中启用项目专用过滤器复选
框。此时文件过滤器配置文件的副本会与项目保存在一起。如果以后您改变了过滤器,则只更新当前项目
的过滤器而用户过滤器保持不变。
警告!如果您在项目打开的时候改变过滤器选项,您必须重新载入项目以使改变生效。
1. 文件过滤器对话框
该对话框列出了可用的文件过滤器。如果您不想使用 OmegaT 翻译某种类型的文件,您可以取消选中该
文件名旁边的复选框来关闭其过滤器。这样一来,在载入项目时 OmegaT 会忽略这些文件,并且在创建
目标文档时对它们进行原封不动的复制。如果之后您又决定使用这些过滤器,只需勾上这些复选框。点
击缺省【Defaults】可将文件过滤器恢复为缺省设置。要编辑过滤器处理文件时使用的编码,请从列表中
选中该过滤器然后点击编辑按钮。
2. 过滤器选项
多种过滤器(文本文件、XHTML文件、HTML和XHTML文件、OpenDocument文件和Microsoft
XML文件)有一个或多个特殊选项。要修改这些选项,请从列表中选中该过滤器,并点击
【Options】按钮。可用选项包括:
Open
选项
文本文件
• 在换行、空行处进行片段分割或不分割:
如果激活了句子分割规则,则文本将会按照现有规则作进一步的分割。
PO 文件
• 允许目标文件中存在空译文:
如果启用,未翻译的 PO 片段(可能是整个段落)在目标文件中的译文是空的。从技术上说,PO 目标
文件(如果创建了)中的 msgstr 片段将为空的。由于这是 PO 文件的标准行为,所以缺省启用。如果关
闭了此选项,则会复制源文本到目标片段中。
• 跳过PO头部
如果选中此选项,则PO头部会被跳过而保持不变。
• 自动替换头部中的‘nplurals=INTEGER; plural=EXPRESSION;’
此选项会让OmegaT覆盖PO文件头部的规范并在选择的目标语言中使用默认规范。
XHTML 文件
32
文件过滤器
• 新增或重写HTML和XHTML文件中的编码声明:目标文件通常使用与源文件不同的编码字符集(不论是
显式或隐式定义)。通过该选项译者可以指定目标文件是否包含编码声明。例如,如果文件过滤器指定
目标文件的编码方案为UTF8,则选择总是能确保已译文件中包含此信息。
• 翻译下列属性:已选择的属性会作为片段出现在编辑器窗口中。
• 在下列位置分割新段落:按照 <br> HTML 标签分割段落。
• 忽略匹配正则表达式的文本:匹配该正则表达式的文本会被忽略。它在标签检验中显示为渲染红。源片
段中匹配的文本以斜体显示。
• 不翻译元标签……的内容属性:下列元标签将不进行翻译。
• 不翻译含下列属性键值对(逗号分隔)的标签内容:匹配列表中键值对的标签内容将被忽略。
在需要根据属性值来不翻译一些标签时很有用。例如,对于<div class="hide"> <span translate="no">您
可以定义键值对来保持其未译状态。对于上面这个例子,定义字段应包含:class=hide, translate=no
Microsoft Office 开放 XML 文件
您可以选择要翻译的元素。它们将以单独片段的形式出现。
• Word:不可见说明文本、注释、脚注、尾注、页脚
• Excel:注释、工作表名
• Power Point:幻灯片注释、幻灯片控制和幻灯片布局
• 通用:图表、图示、图画和艺术字
• 其他选项:
• 聚合标签:如果选中了,不含可翻译文本的多个相邻标签会被合并为单个。
• 保留所有标签的空白:如果选中了,则会保留“空白”(即空格和新行符),即使没有在文档中专门设
置
HTML 和 XHTML 文件
• 在 HTML 和 XHTML 文件中新增或重写编码声明:总是(缺省),仅当 (X)HTML 文件含标题时,仅当
(X)HTML 文件含编码声明时,从不
• 翻译下列属性:已选择的属性会作为片段出现在编辑器窗口中。
• 在下列位置分割新段落:按照 <br> HTML 标签分割段落。
• 忽略匹配正则表达式的文本:匹配该正则表达式的文本会被忽略。
• 不翻译元标签……的内容属性:下列元标签将不进行翻译。
• 不翻译含下列属性键值对(逗号分隔)的标签内容:匹配列表中键值对的标签内容将被忽略。
文本文件
• 在换行、空行处进行片段分割或不分割:
如果激活了句子分割规则,则文本将会按照现有规则作进一步的分割。
Open Document格式(ODF)文件
• 您可以选择要翻译下列哪些项:
索引条目、书签、书签参考、笔记、注解、介绍说明、链接(URL)、工作表名称
33
文件过滤器
3. 编辑过滤器对话框
该对话框允许您设置该过滤器所处理的文件的源文件名模式,定制已译文件文件名,并为它选择用何种编
码来载入文件及保存已译副本。要修改文件过滤器模式,可直接修改该字段或点击编辑按钮。要新增文件
过滤器模式,请点击新增。新增模式和编辑特定模式使用的是相同的对话框。该对话框非常有用,因为它
带有的特定目标文件名模式的编辑器,它允许您自定义输出文件的名称。
3.1. 源文件类型、文件名模式
当
OmegaT
在源文件夹中发现一个文件时,它将首先根据文件的扩展名试着选择过滤器。更确切地
说,OmegaT 尝试着用每个过滤器的源文件名模式对文件名进行匹配。例如,*.xhtml 模式将会匹配任
何扩展名为 .xhtml 的文件。如果找到了合适的过滤器,它将被用来处理该文件。比如说在缺省情况下
XHTML 过滤器将会用来处理扩展名为 .xhtml 的文件。 您可以对每个文件过滤器要处理文件的名称
模式进行修改或增添。源文件名模式中使用的匹配字符与搜索中所使用的类似。'*' 字符匹配零个或多个字
符。'?' 字符只匹配一个字符。其他所有字符代表自身。比如,如果您希望文本过滤器处理 readme 文件
(readme, read.me 和 readme.txt),那么您应该使用模式 read*.
3.2. 源文件和目标文件编码
仅少量文件格式必须指定强制性的编码方式。未指定编码方式的文件格式将使用您所设定的匹配该名称的
扩展名的编码方式。例如,缺省情况下 .txt 文件将会使用系统缺省的编码导入。您可以对每种源文件名模
式的源编码进行修改。这些文件也可以任何编码方式输出。缺省情况下,已译文件的编码与源文件的编码
相同。源和目标编码字段使用的组合框包括了所支持的全部编码。<自动>将编码选择工作留给
OmegaT。以下是其工作原理:
• OmegaT 通过(HTML 文件、基于 XML 的文件中)可能存在的编码声明来识别源文件编码。
• OmegaT 被设置为某些文件格式(Java 属性等)使用强制性编码。
• OmegaT 为文本文件使用缺省的系统编码。
3.3. 目标文件名
有时您也需希望系统自动将译好的的文件重新命名,比如在文件名后加上语言代码。目标文件名模式使用
特殊的语法规则,因此如果希望编辑这些字段的话,您必须点击编辑……以使用编辑模式对话框。如果您
想恢复到缺省的过滤器设置,点击缺省。您也可以在文件过滤器对话框中的目标文件名模式字段中直接修
改名称。编辑模式对话框提供了以下选项:
• 缺省设置是
样。
${filename}——和源文件完全相同的文件名和扩展名:此时已译文件名和源文件名完全一
• ${nameOnly}——只插入源文件的名称,而不包括扩展名。
• ${extension} ——源文件扩展名
• ${targetLocale}——目标文件区域设置代码(形式为“xx_YY”)。
• ${targetLanguage}——目标语言和国家代码(形式为“XX-YY”)。
• ${targetLanguageCode}——目标语言——仅“XX”
• ${targetCountryCode}——目标国家——仅“YY”
• ${timestamp-????}——多种格式的生成时间系统日期时间
请参阅Oracle文档
[http://docs.oracle.com/javase/1.4.2/docs/api/java/text/SimpleDateFormat.html]了
解“SimpleDateFormat”格式示例
• ${system-os-name}——电脑使用的操作系统
34
文件过滤器
• ${system-user-name}——系统用户名
• ${system-host-name}——系统主机名
• ${file-source-encoding}——源文件编码
• ${file-target-encoding}——目标文件编码
• ${targetLocaleLCID}——微软目标区域设置
对${nameOnly}和${Extension}变量还有附加变量可用。在文件名存在疑义的情况下,其中某个可以适用
于${仅文件名-扩展数字}
and
${扩展名-扩展数字}
形式的变量。例如如果原始文件名为
Document.xx.docx,则变量与其对应的结果如下:
• ${nameOnly-0} Document
• ${nameOnly-1} Document.xx
• ${nameOnly-2} Document.xx.docx
• ${extension-0} docx
• ${extension-1} xx.docx
• ${extension-2} Document.xx.docx
35
Chapter 8. OmegaT文件和文件夹
OmegaT 运行时使用三种文件。
• 翻译项目文件:它们构成了翻译项目。丢失这些文件可能会影响项目的完整性并导致您无法完成翻译工
作。项目文件是 OmegaT 最重要的文件。它们是您在翻译时处理文件的日常基础。
• 用户设置文件:它们是用户通过首选项改变 OmegaT 的行为时创建的文件。丢失这些文件可能导致
OmegaT 恢复“出厂”设置。如果您正处于翻译工作的中期,这将会导致一个小问题。
• 应用程序文件:它们包含在您下载的安装包中。其中大部分对于 OmegaT 的正常运行来说是必须的。
如果出于某种原因丢失或损坏了这些文件,仅需下载并重新安装 OmegaT 以恢复它们。
1. 翻译项目文件
一个 OmegaT 翻译项目由多个文件和文件夹组成。
创建翻译项目时,OmegaT会自动创建一个您指定名称的文件夹和一系列文件夹:
Figure 8.1. OmegaT项目
在项目创建或翻译过程中可对一些目录的位置进行变更。根据您的工作流程和项目管理习惯,可以选择现
有目录或创新目录。项目创建之后要改变目录的位置,请打开菜单中的项目>属性……或使用 Ctrl+E 进行
必要的修改。
在文件管理器中翻译项目在外观和操作上和其他文件夹一样。下面的例子中my
OmegaT项目:
Figure 8.2. OmegaT项目和子文件夹
36
projects文件夹包含三个
OmegaT文件和文件夹
双击以 OmegaT 图标显示的项足以打开这个项目。用缺省设置创建的 Example_Project 项目将被创建为一
个新的子目录,其结构如下:
1.1. 根文件夹
项目的根文件夹总是包含 OmegaT.Project文件,其内容为项目属性窗口(项目>属性)中定义的项目参
数。在翻译时会在此文件夹中创建(且在翻译过程中更新)附加文件(project_nameomegat.tmx、project_name-level1.tmx和project_name-level2.tmx)。它们包含了不同形式的相同翻译记
忆内容,以用于以后的项目。
1.2. 词典子文件夹
该文件夹初始为空的,它将包含您添加到项目的词典文件。请参阅词典章节了解关于该主题的更多信息。
1.3. 词汇表子文件夹
该文件夹初始为空的。它将包含您在项目中使用的词汇表。请参阅词汇表章节部分了解关于该主题的更多
信息。
1.4. omegat子文件夹
omegat子目录至少包含一个或多个其他文件。其中最重要的文件是project_save.tmx,它是项目的有效翻
译记忆文件。此文件的备份(含扩展名bak)会不断增加到这个子文件夹:在翻译开始时、结束时和过程
中。这样可以避免意外丢失数据——请参阅杂项部分的防止数据丢失。
在翻译时还可能会在该子文件夹中创建的附加文件如下
stats.txt
包含当前项目的当前统计信息。您可以选择工具>统
计查看该文件
ignored_words.txt. learned_words.txt
由拼写检查器创建和使用。如果您已经收集了希望
拼写检查器忽略/接受的单词,只需复制相应的两个
文件到当前项目的omegat子目录。
project_stats_match.txt
由工具>匹配统计创建的最新项目匹配信息
segmentation.conf
若存在,则它包含项目>属性……需要的项目专用分
割规则。请参阅项目属性章节
filters.xml
若存在,则它包含项目>属性……需要的项目专用文
件过滤器。请参阅项目属性章节
1.5. source子文件夹
source子文件夹包含待译文件。之后您也可添加文件到其中。要注意的是source子目录的结构完全由您决
定。如果要翻译的文件是结构树的一部分(例如网站上的文件),您只需指定最上级子目录,而 OmegaT
将会保持完整的树形结构和全部内容。
1.6. target子文件夹
该子文件夹初始为空的。要添加内容到其中,请选择项目 → 创建已译文档 (Ctrl+D)。source文件夹中的文
件,无论是否已经翻译,都会以相同的层级结构生成到这里。target子文件夹的内容将反映当前的翻译状
态,如同在当前/omegat/project_save.tmx中保存的项目翻译记忆一样。因此未译片段将仍为源语言。
2. 用户设置文件
用户文件包含特定用户在所有项目中适用的信息;
logs/OmegaT.log
该文件记录了 OmegaT 运行时的 Java 错误信息。
当 OmegaT 表现异常时,在错误报告中加入这份文
件或相关部分是件很重要的事情
37
OmegaT文件和文件夹
script/
安装了脚本插件时该文件夹包含了作为脚本插件的
脚本文件。
filters.xml
用户默认文件过滤器
omegat.prefs
OmegaT首选项
segmentation.conf
用户默认分割规则
uiLayout.xml
一份包含所有 GUI 可访问选项设置的 XML 文件
注意默认的分割规则和文件过滤器可以被项目专用设置所覆盖(见上文)。用户文件的位置取决于当前使
用的平台:
Windows 2000 和 XP
Documents and Settings\<用户名>\Application
Data\OmegaT
Windows Vista 和 7
Users\<用户名>\AppData\Roaming\OmegaT
其他 Windows
<Something>\OmegaT (<Something> 对应于 Java
所确定的主目录["home"]的位置)
Linux/Solaris/FreeBSD
<User Home>/.omegat (.omegat 是一个目录,名
称前面的句点让它在使用 ls -a 或等效命令之外的情
形下保持不可见状态)
MAC OS X
<User Home>/Library/Preferences/OmegaT
其它
<User Home>
3. 应用程序文件
OmegaT 是以可以从 SourceForge 下载的安装包的形式提供的。在这里应先考虑的是标准Java形式的平
台独立安装包。可选的程序包还有Linux .tar安装包、Windows安装程序(含或不含Java运行环境)、Mac
OS X安装程序以及为开发人员准备的源码包。
该平台独立安装包可在任何运行Java 1.6运行时环境的平台上使用,包括安装有特定包的平台。它是一份
压缩文件(zip或tar存档),您需把它们解压缩到您选择的安装目录中。通常可通过双击已下载的安装包
来解压缩文件。解压缩后将创建一个包含下列内容的目录:
文件/子目录
目录
/docs/
所有的手册文件都在该目录中。您可在网络浏览器
中打开它们以访问其外部链接。
/images/
图标和标志图片。
/lib/
包含正常运行OmegaT所需的Java文件。
join.html
这是一份普通的HTML文件,在网络浏览器打开时
将会导航到Yahoo! Gourps中托管的OmegaT用户
组。不是一定要加入这个讨论组,但加入后可为您
提供一些额外的服务,例如可访问某些文件和参与
投票以及参加 OmegaT 相关的讨论。该讨论组的存
档是公开的,无须订阅该讨论组就可进行查看。
changes.txt
关于本版本和之前版本的一份较详细的变更清单。
license.txt
GNU 通用公共许可证。该许可证允许您对
OmegaT 做某些事情,包括修改和发布。如果您
有兴趣修改和发布 OmegaT,请仔细查阅该文档并
确保在进行操作前掌握其全部含义。如果有任何疑
问,请直接向项目成员请教,可通过 Source Forge
页面给他们发送邮件或向用户讨论组发送一份公开
邮件。
doc-license.txt
GNU 通用公共许可证。该许可证包含了文档。参阅
上文。
38
OmegaT文件和文件夹
readme.txt
该文件非常重要,在启动 OmegaT 之前请务必阅读
一遍。它包含了 OmegaT 的一般性信息,如:在哪
里可以找到更多信息以及如何提供帮助等等。它被
译为了多种语言。
OmegaT
只包含两行的文本文件:
#!/bin/bash java
java -jar OmegaT.jar $*
Linux和OS X用户可能会发现此文件有用。在确认
处于OmegaT程序目录后,从命令行运行chmod +x
OmegaT来把它转换为可执行文件。从此,您可以
从命令行调用该文件来启动 OmegaT 。
OmegaT.bat
批处理文件,用于从 Windows 命令行启动
OmegaT 。它只包括下面几行:
java -jar OmegaT.jar %*
OmegaT.jar
OmegaT 主程序。要启动 OmegaT,或是从命令行
调用该文件,或者通过文件管理器运行它(通常是
使用鼠标双击)。
39
Chapter 9. 待译文件
1. 文件格式
您可以使用 OmegaT 翻译一些文件格式。最基本的文件类型有两种,纯文本和格式化文本格式。
1.1. 纯文本文件
纯文本文件中只含有文本,因为对它们的翻译工作就像输入翻译一样简单。有多种方法可以指定文件的编
码,以确保 OmegaT 打开它们时不会显示乱码。这样的文本除了用于对齐文本、标示段落或插入页面
的“空白”之外没有任何格式化信息。它们无法包含或保留关于文本的颜色、字体等的信息。目
前,OmegaT 支持以下纯文本格式:
• ASCII 文本(.txt 等)
• 编码文本(*.UTF8)
• Java 资源文件(*.properties)
• PO 文件(*.po)
• INI (key=value) 文件(*.ini)
• DTD 文件(*.DTD)
• DokuWiki文件(*.txt)
• SubRip 标题文件(*.srt)
• Magento CE Locale CSV文件(*.csv)
OmegaT 可以处理的其它的纯文本文件可以通过将其文件扩展名关联到所支持的文件类型(比方说,.pod
文件可以关联到 ASCII 文本过滤器)并使用特定的分割 规则来进行预处理。
PO文件可以同时包含源和目标文本。从这个角度看,它们是纯文本加上翻译记忆。如果一个片段在项目
翻译记忆project_save.tmx中还没有译文,则会把当前译文作为默认译文保存到project_save.tmx中。然而
如果相同的源片段已经存在不同的翻译,则新译文会被保存为可选译文。
1.2. 格式化文本文件
格式化文本文件除了包含文本之外,还包括字体类型、大小、颜色等信息。它们通常由文字处理器和
HTML 编辑器创建。这些文件格式是设计用来保持格式信息的。这些格式信息可能就像 “这是粗体”一样简
单,也可能是包含了不同的字体大小、颜色和位置等信息的表格数据一样复杂。在大多数翻译工作中,在
译文中保留原文的格式信息是很重要的。通过使用易于维护的
TAG
来标记拥有特殊格式的字符或单
词,OmegaT 让您能够做到这一点。对源文本格式的简化很大程度上有助于减少标签的数量。如果有可能
应该考虑在文档中使用统一的字体、字体大小、颜色等,以此简化翻译工作和减少可能的标签错误。每种
文件格式在 OmegaT 中的处理方式都不同。可在文件过滤器设置特定的动作。在写此文档时,OmegaT
支持以下格式化的文本格式:
• ODF - OASIS Open Document Format (*.ods, *.ots, *.odt, *.ott, *.odp, *.otp)
• Microsoft Office Open XML (*.docx, *.dotx, *.xlsx, *.xltx, *.pptx)
• (X)HTML (*.html, *.xhtml,*.xht)
• HTML Help Compiler (*.hhc, *.hhk)
• DocBook (*.xml)
• XLIFF (*.xlf, *.xliff, *.sdlxliff)——一个源对应多个目标
40
待译文件
• QuarkXPress CopyFlowGold (*.tag, *.xtg)
• ResX 文件 (*.resx)
• Android 资源 (*.xml)
• LaTex (*.tex, *.latex)
• Help (*.xml) 和 Manual (*.hmxp) 文件
• Typo3 LocManager (*.xml)
• WiX Localization (*.wxl)
• Iceni Infix (*.xml)
• Flash XML export (*.xml)
• Wordfast TXML (*.txml)
• Camtasia for Windows (*.camproj)
• Visio (*.vxd)
其它的格式化文本文件可以通过将其文件扩展名关联到所支持的文件类型(假设相应的分割规则可以正确
分割它们)来让 OmegaT 进行处理。
2. 其它文件格式
还存在适合 OmegaT 处理的其他纯文本或格式化文本文件。
可使用外部工具将文件转换成所支持的格式。译后文件需要被转换回最初的格式。例如,如果您使用无法
处理 ODT 格式的过时 Microsoft Word 版本,对于 DOC 格式则需要进行下面这样的来回转换:
• 将文件导入到ODF writer
• 以 ODT 格式保存文件
• 对它进行翻译并创建目标 ODT 文件
• 在ODF writer中加载目标文件
• 保存该文件为 DOC 格式
译后文档中格式信息的质量将取决于来回转换的质量。在进行类似的转换前,必须确保测试过所有选项。
请参阅 OmegaT 主页 [http://www.omegat.org]了解最新的辅助转换工具列表。
3. 自右向左语言
原文和译文的区分取决于项目的语言设置。缺省情况下,LTR 语言使用左对齐而 RTL 语言使用右对齐。
通过按下 Shift+Ctrl+O(字母 O 而不是数字 0)来切换不同的显示模式。Shift+Ctrl+O切换有三种状态:
• 缺省对齐方式,这由语言决定的
• 左对齐
• 右对齐
在 OmegaT 中使用 RTL 模式对于 OmegaT 中创建的已译文档的显示模式没有任何影响。已译文档的显
示模式必须在常用于显示或编辑它们的应用程序(例如 Microsoft Word)中进行修改(查阅相关手册了解
详细信息)。使用 Shift+Ctrl+O 将使得 OmegaT 中文本的输入和显示模式都改变了。通过点击窗格并切换
显示模式,该方法也可单独适用于所有三个窗格(编辑器、模糊匹配和词汇表)。它还使用于在 OmegaT
中的所有输入字段(搜索窗口、片段分割规则等)。
41
待译文件
对于 Mac OS X 用户,请注意:使用 Shift+Ctrl+O 快捷键而 不是cmd+Ctrl+O.
3.1. 在片段中混合自右向左和自左向右字符串
在编写纯自右向左文本时,将使用缺省的(自左向右)视图。然而在许多情况下,必须在自右向左文本中
嵌入自左向右文本。例如,在 OmegaT 标签中,必须在自左向右源文件中保留产品名称、在本地化文件
中保留占位符以及在文本中保留数字。在像这样的情况下,必须转换为自右向左模式,以正确显示自右向
左(实际是双向)文本。应当注意,当 OmegaT 处于自右向左模式,源和目标都以自右向左模式显示。
这意味着如果源语言是自左向右,而目标语言是自右向左,或者反过来,就可能必须在自右向左和自左向
右模式之间来回切换,以轻松地在相应的模式下查看源文件和输入译文。
3.2. 自右向左片段中的 OmegaT 标签
如上所述,OmegaT 标签是自左向右字符串。如需在自右向左和自左向右之间进行翻译工作,为从源文件
中正确读取标签以及在目标中正确输入,有可能需要在自左向右和自右向左模式之间来回切换多次。
如果允许,极力倡导翻译人员将原始文档的风格信息删除,以确保在 OmegaT 中尽可能少地显示标签。
按照提示中提供的线索进行标签管理. 经常验证标签(见标签验证)和每隔固定时间制作已译文档(见下
文及菜单)可以更加轻松地发现导致的问题。提示:先翻译文本的纯文本版本,稍后再通过相应程序添加
必须的风格被证明是更少争议的。
3.3. 创建已译自右向左文档
在创建已译文档时,其显示方向将与源文本相同。如果源文档是自左向右的,目标文档的显示方向可以在
其查看程序中手动修改为自右向左。每个输出方式都有特定方法来处理自右向左显示,可查阅相关应用程
序手册了解更多细节。
无论如何对于.docx文件会自动进行一些更改:
• 段落、节和表被设为双向
• 阅读方向(文本元素)被设为RTL
为避免每次打开目标文件时都要改变其显示参数,可能修改源文件的显示参数以确保这些参数被目标文件
所继承。举例来说,这样的修改对ODF文件是可行的。
42
Chapter 10. 编辑行为
在选项 → 编辑行为……打开的对话框中,用户可以选择如何初始化和处理编辑区域的当前片段:
Figure 10.1. 编辑行为选项
随着对当前片段的编辑,您从文件的一个片段翻译到另一个片段。在片段之间移动时,您可能希望用现存
的译文或源文本来填充正在编辑的区域。在选项 → 编辑行为……菜单中,OmegaT 为您提供了以下选项:
源文本
可以将源文本自动插入编辑区域中。此方式在处理包含许多必须保持原样的商标和专有名词
的文本非常有用。
保持片段
为空
OmegaT把编辑字段留空。该选项允许您直接输入翻译而无需删除源文本,因此节省了两次
按键的时间(Ctrl+A 和 Del)。现在允许使用空译文。它们在编辑器中显示为<EMPTY>。要
使用空译文,在片段中点击右键并选择“设置空译文”。在相同的弹出菜单中的移除译文还可
以用来删除当前片段的已有译文。通过清楚目标片段并按下回车您可以实现相同的想过。
插入最佳
模糊匹配
OmegaT 将插入与当前源文本最相似译文字符串,前提是相似度高于在此对话框中设置的阈
值。此时可以使用前缀对通过模糊匹配的译文加上标记。如果您加上了前缀(例如[模
糊]),之后您可以找到这些译文并检查是否正确。
对话框下半部分的复选框实现了下列目的:
插入模糊匹配时
尝试转换数字
选中该选项后,在手动或自动插入模糊匹配时,OmegaT会尝试根据源文本转换模糊
匹配中的数字。它有一些限制:
• 源片段和模糊匹配中必须包含相同的数字列
• 在源和目标匹配中的数字必须完全相同。
• 只考虑整数和简单的浮点数(使用句点作为小数点,如5.4,但不包括5,4或
54E-01)。
43
编辑行为
允许译文和
原文相同
要翻译的文档也许包括了一些必须保持原封不动的商标、姓名或其他专有名词。对于只包
含不可变文本的片段可以采取两种策略。
您可以决定完全不翻译这样的片段。OmegaT 将这些片段报告为未译。这是缺省的情况。
另一种方法是输入与原文相同的译文。OmegaT 可以识别出您已经翻译过了。为了做到这
一点,前往选项 → 编辑行为…… 并选上多选框 允许译文和原文相同.
将片段导出到
文本文件
文本导出功能会把当前OmegaT 项目的内容导出到纯文本文件。打开一个片段时它的内容
会被导出。导出的内容会保存到OmegaT用户文件目录的/script子文件夹中的文件,包
括:
• 当前片段原文内容(source.txt)。
• 当前片段译文内容(target.txt)。
• 在用户按下了
Ctrl+Shift+C
(selection.txt)。
或选择了编辑
>导出选中部分的时候选择的文本
打开新片段(source.txt 和 target.txt)或导出新的选中部分(selection.txt)时,会覆盖原
来的内容。这些文件是无格式的纯文本文件。整个过程可以通过基于Tck/Tcl的脚本操纵控
制。请参阅使用OmegaT文本导出功能
[http://www.omegat.org/en/howtos/
text_export.html]了解细节、示例和建议。
前进到下一个含可选译文
的未译片段时停止
要避免在多个目标译文的片段中翻译错误时,选中前往下一个未译片段的复
选框后则会在到达这样的片段时停止,不论它是否已经翻译。
44
Chapter 11. 处理纯文本
1. 缺省编码
纯文本文件(在大多数情况下扩展名为 txt)只包含了文本信息,目前还没有明确的办法告诉计算机该文
件包含了何种语言的内容。在这种情况下,一般 OmegaT 会假设该文本写入时使用了当前计算机所使用
相同语言。这对于使用 16 位字符集 Unicode 进行编码的文件不会产生问题。然而,如果文本使用 8 位编
码,那么可能会遇到这样困惑的情况:不是显示日文的文本……
相反地,系统将显示类似这样的内容:
运行 OmegaT 的电脑的缺省语言为俄语,因此它使用西里尔字符集而不是汉字字符集显示字符。
2. OmegaT 解决方案
基本上 OmegaT 中有三种方法解决这个问题。它们都与选项菜单中的文件过滤器应用程序有关。
将文件编码改为
Unicode
使用能够正确解析编码的文本编辑器打开源文件,并使用 "UTF-8" 编码保存文件。
将文件扩展名由 .txt 改为 .utf8。OmegaT 会自动将文件解析为 UTF-8 文件。这是
最常用的有效方案, 可最大程度减少您的问题.
指定纯文本文
件的编码
即扩展名为 .txt 的文件:在文件过滤器对话框的文本文件部分,将源文件编码从<自动>修
改为 .txt 文件的编码,例如对于上述例子则修改为 .jp。
修改纯文本文
件的扩展名
例如对于日文纯文本文件将 .txt 修改为 .jp:在文件过滤器对话框的文本文件部分,新增
一个新的源文件名模式(在此例中为 *.jp)并为该源文件和目标文件的编码选择适当的
参数。
缺省情况下,OmegaT 使用下面的短名单帮助您处理一些纯文本文件:
• .txt 文件会自动 (<自动>) 被 OmegaT 以计算机缺省的编码进行解释。
• .txt1 是以 ISO-8859-1 进行编码的,包括绝大多数西欧语言。
• .txt2 文件是以 ISO-8859-2 进行编码的,包括绝大多数中欧和东欧语言
• .utf8 文件会被 OmegaT 以 UTF-8 编码进行解释(一种几乎涵盖了世界上所有语言的编码)。
可以通过在选项菜单中选择文件过滤器菜单项来检查是不是这样。比方说,当您拿到一份捷克文本文件
(非常有可能使用 ISO-8859-2 编码编写),您仅需将扩展名 .txt 修改为 .txt2,而 OmegaT 将会正确地解
析其内容。当然,如果您希望更加安全,可以将这类文件转换为 Unicode,即 .utf8 文件格式。
45
Chapter 12. 处理格式化文本
在源文件中表示的格式化信息通常需要在目标文中重新创建。在OmegaT中,由所支持格式(尤其是在写
入DocBook、HTML、XHTML、开放文档格式(ODF)和 Office 开放 XML(MS Office 2007及更高版本)
的时候)产生的内部格式化信息以标签的形式出现。一般情况下,为匹配目的而比较不同文本的相似性时
将忽略标签。在已译片段中重新创建的标签将会出现在译后文档中。
1. 格式化标签
标签的命名:
标签由一到三个字符和一个数字组成。唯一的编号允许我们将彼此相对应的标签组织在一起,不同的标签
允许有相同的快捷字符,但实际上并不一样。使用的快捷字符尝试反映标签所代表的格式含义(例如 b 表
示粗体,i 表示斜体)。
标签的编号:
标签以标签组自增长方式进行编号。在这里“标签组”是单个标签(例如 <i0> 和 </i0>)。在片段中,第一
个组(成对或单个的)获得编号 0,第二个编号为 1,以此类推。下面的第一个例子中有3个标签组(一组
成对的,一组单个,另一组成对的),第二个例子中只有一组(成对的)。
成对的和单个的:
标签不是单个的就是成对的。单个标签指的是对周边文本没有影响的格式化信息(例如:额外的空格或者
行终止)。
<b0><Ctr+N></b0>, <br1><b2><Enter></b2><片段 2132>
<br1>是单个标签,对周围的文本不产生任何影响。成对标签通常指对开标签和闭标签之间的文本使用格
式信息的标签对。下面的 <b0> 和 </b0> 是成对的且影响文本 log.txt。请注意开标签总是出现在闭标签的
前面:
<Log file (<b0>log.txt</b0>) for tracking operations and errors.<片段 3167>
OmegaT 在分割句子之前就进行标签创建工作。根据分割规则,标签对可能会被分成两部分并出现在两个
连续的片段,而标签检验会检查到这两处的部分标签并提示这两个片段出现错误。
2. 标签操作
对于标签的操作必须谨慎。如果它们被意外地改变,最终的文件格式也许会被破坏。基本的做法是标签序
列必须保持相同的顺序。然而,在可能的情况下,如果必须严格遵循某些规则,则不必拘泥于这个基本做
法。
标签的复制:
要复制标签组,只需将它们复制到您选择的位置。但请记住:成对的标签组中,开标签必须出现在闭标签
之前。您复制的标签组所代表的格式将会应用到原标签和复制标签的两个部分。
例如:
<b0>此格式</b0>即将被复制到此处。<片段 0001>
复制后:
<b0>此格式</b0>已经被<b0>复制到此处</b0>。<片段 0001>
标签组删除:
要删除标签组,仅需将它们从片段中移除。请记住:必须同时删去一个标签组的开标签和闭标签,以确保
它们所进行的格式化操作被完全清除,否则译后文件可能遭破坏而无法打开。删除一个标签组的同时,您
将会从已译文件中删除相关的格式。
46
处理格式化文本
例如:
<b0>此格式</b0>即将被删除。<片段 0001>
删除后:
此格式已经被删除。<片段 0001>
3. 标签组嵌套
对标签组的顺序进行修改也许会导致一个标签组嵌套在另一个标签组中。当封闭的组完全将另一个封闭组
封装在里面时,这是可行的。换句话说,在移动成对标签时请确保开标签和闭标签同时被移动到其他标签
对的内部或外部,否则译后文件可能遭破坏而无法打开。
例如:
<b0>格式</b0><b1>一</b1>即将嵌套到格式零的内部。<片段 0001>
嵌套后:
<b0>格式<b1>一</b1></b0>已经嵌套到格式零的内部。<片段 0001>
4. 标签组重叠
对标签对的错误维护将会导致重叠,也肯定会导致格式破坏以及某些情况下根本无法打开已译文件。
例如:
<b0>格式</b0><b1>一</b1>即将被弄乱。<片段 0001>
错误维护后:
<b0>格式<b1>一</b0> </b1>正被弄乱了。<segment 0001>
5. 标签验证选项
要定制标签的操作,可在选项>标签验证窗口中设置一些规则:
47
处理格式化文本
此处的行为、状态适用于所有的源文件而不只是某些类型的文件,如格式化文本。
• Printf变量——不检查、简单检查、全检查
OmegaT可以检查源文本中的程序变量如(%s)在译文中是否存在。您可以决定是否检查、检查简单
的printf变量(如%s %d等)或检查所有类型的printf变量。
• 检查简单的java MessageFormat模式
选中该复选框能让OmegaT检查简单的java MessageFormat标签(如{0})是否处理正确。
• 自定义标签正则表达式:
此处输入的正则表达式会让OmegaT把它的匹配实例视为客户标签。它会检查标签的编号和顺序是否一
致,就如同检查omegat标签一样。
• 应从译文中移除的碎片正则表达式
可以输入表示希望在目标删除的内容的正则表达式。之后在目标片段中的任何匹配将显示为红色,这样
就很容易发现和纠正。寻找模糊匹配时忽略该移除模式。如果被移除部分不匹配其他片段,则增加5个
固定罚点,因此匹配度就不会显示高达100%
6. 标签组检验
验证标签功能检测发生变化的标签序列(无论是有意的还是无意的),并显示受影响的片段。通过按下
Ctrl+T 组合键可调用该功能,它将打开一个窗口,显示文件的译文中所有可能包含断裂或错误的标签的片
段。通过标签检验功能可以轻松地修正标签和重新创建目标文档。按 Ctrl+T 打开的窗口显示了一个三列表
格,其中列出了指向该片段、原文片段和译文片段的链接:
Figure 12.1. 标签检验条目
标签用加粗蓝色突出显示,以便于对源内容和译后内容进行比较。点击链接可在编辑器中激活该片段。如
果必要的话(在上面的情况中是丢失了 <i2></i2> 标签对),修正错误然后按 Ctrl+T 键返回标签验证窗口
以修正其它错误。标签错误指的是译文中的标签序列没有完全按照源片段中的标签顺序和数量复制。某些
标签操作是必要的和良性的,但有些在创建已译文档时会导致问题。
7. 标签管理的几点提示
简化源文本
标签通常代表了原始文本中的某种格式。对源文本格式的简化很大程度上有助于减少标签的数量。如果有
可能,应该尽可能考虑使用统一的字体、字体大小、颜色等,以此简化翻译工作和减少可能的标签错误。
查阅标签操作部分了解可以对标签做哪些处理。记住:如果标签问题困扰着您,而格式又不是当前翻译工
作最至关紧要的事情的话,删除标签将会是解决问题的最简单途径。
对标签对应特别小心
如果需要在 OmegaT 中看到标签,但是却不需要在已译文档中保留绝大多数格式的话,可以不向译文中
添加任何标签。在这种情况下,要对标签对格外小心,因为删除成对标签中的一个而忘记了删除另一个的
话,肯定将破坏文档格式。因为标签包含在文本自身里面,因此可以使用片段规则来创建包含更含更少标
签的片段。这是一种高级功能,如果想正确使用必须具备一些经验。
OmegaT 目前还无法自动检测格式错误,因此如果犯了错误或者改变格式以更好适应您使用的目标语言
时,它不会对您作任何提示。然而有时,这些错误会导致译出的文件看起来不正常,在最坏的情况中甚至
可能无法打开。
48
Chapter 13. 翻译记忆
1. OmegaT 中的翻译记忆
1.1. tmx 文件夹 - 位置及用途
OmegaT项目含有在五个不同位置的翻译记忆文件,即扩展名为tmx的文件:
omegat 文件夹
omegat 文件夹包含 project_save.tmx 文件,以及一些备份的 TMX 文
件。project_save.tmx 文件包含了自项目开始以来所有被保存的片段。项目中总
是存在此文件。其内容总是根据源片段的字母进行排序。
项目主文件夹
项目主文件夹中包含 3 个 tmx 文件:project_name-omegat.tmx,project_namelevel1.tmx 以及 project_name-level2.tmx(project_name 是项目的名称)。
• level1 文件仅包含文本信息。
• level2 文件以适当的 TMX 标签封装了 OmegaT 的特殊标签,因此它可以在支
持第 2 级 TMX 的翻译工具中使用其中的格式信息,包括 OmegaT 本身。
• OmegaT 文件包含了
OmegaT 项目。
OmegaT
特殊的格式标签,因此该文件可用于其他
这些文件是 project_save.tmx文件的副本,即不包括被称为孤立片段的主翻译记
忆。它们使用适当变化的名称,这样在其他地方使用时容易识别其中包含的内
容,例如在其他项目的tm子文件夹(见下面)。
tm 目录
/tm/ 可包含任何数量的辅助翻译记忆,即 TMX 文件。这样的文件可创建为上面
提示的三种形式。注意:其他 CAT 也能导出(以及导入)TMX 文件,一般也有
三种形式。最好的来源是使用 OmegaT 特定的 TMX 文件(见上文),这样可以
保持片段中的内联格式。
在 tm 子目录中翻译记忆的内容是为要翻译文本提供建议。这些文件中已经保存
并翻译的任何文本,当它们与正在翻译的文本十分相似时,将出现在模糊匹配窗
格中。
如果某个辅助TM中的某个源片段与待译的文本完全相同,OmegaT会安装在选
项 → 编辑行为……对话框中的设置进行操作。例如(使用缺省设置),在辅助
TM中的译文被接受并加上前缀[模糊],这样译员随后可以通过这个标记检查译文
是否正确翻译(请参阅编辑行为章节)。
可能出现这样的情况:在tm子文件夹的翻译记忆中多个片段含有相同的源文
本,但目标译文不同。在指定的TMX文件中是根据每行的名称和片段逐行读取
TMX文件的。因此含相同源文本的最后一个片段将获得采用(注:当然预先避
免这种情况发生会更有意义)。
注意在tm文件夹中的TMX文件可使用gzip压缩。
tm/auto 目录
如果在提供的 TM 中的译文完全可靠的话,那么可以把它们放到 tm/auto 目录
以避免需要对大量的 [模糊]进行确认。这样能更有效地预翻译源文本:在源文本
中其翻译可以在那些“自动”TM 中找到的所有片段,将会自动加载到项目的主 TM
中。
tm/penalty-xxx文件夹
有时由于题材、客户、版本状态等,需要从翻译记忆中区分出高质量译文与不可
靠译文。在名称为“penalty-xxx”(其中xxx在0到100之间)文件夹中的翻译记忆
产生的匹配其匹配度将减少文件夹名称中的数字:例如Penalty-30文件夹中所有
TM中100%匹配的条目将减低至70%的匹配度。罚点适用于所有的三种匹配百分
率:此时匹配度75、80、90将减低至45、50和60。
或者,您可以让 OmegaT 制作一份附加的 TMX 文件(OmegaT 风格)到您指定的地方,包含了项目所有
的可译片段。请参阅下面的伪翻译记忆。
49
翻译记忆
注意:打开项目时会把所有的翻译记忆加载到内存中。对项目翻译记忆的备份会定期进行(请参阅下一
章),同时在打开或关闭项目时也会保存/更新project_save.tmx。这里的意思是,例如如果您想添加一个
辅助 TM 到当前正在工作的项目时,无需退出项目:只要简单地重新载入项目,所做的更改就会生效。
对于指定的项目,多种不同翻译记忆的位置是由用户定义的(请参阅项目属性中的项目对话框)。
根据不同的情况可采取不同的策略,例如:
在相同主题中保存多个项目:保留项目结构,同时改变源和目标目录(Source = source/order1,target
= target/order1等)。需要注意存在于order1而不在order2或后续任务中的片段,会被标记为孤立片段,
不过这样仍可用来获取模糊匹配。
多个译员工作于相同项目:把源文件分成
source/Alice,
source/Bob
等,同时把它们分配给项目
成员
(Alice,
Bob
...)。随后他们可创建自己的项目,当结束或到达阶段性目标时实现他们自己的
project_save.tmx。然后收集 project_save.tmx,并解决可能存在的用词冲突。 之后创建新的主翻译记
忆,可以放到项目成员的tm/auto子文件夹或覆盖他们的project_save.tmx文件。该团队还可以使用相同的
子目录结构来保存目标文件。这样允许他们,例如在任何时刻进行检查整个项目的目标版本是否已经完
成。
1.2. TMX 备份
翻译时,OmegaT会不断在项目/omegat子文件夹的project_save.tmx文件中保存您的工作。
OmegaT
还会在每次项目被打开或重新载入时备份翻译记忆到同一子目录的
project_save.tmx.YEARMMDDHHNN.bak。YEAR 是 4 位数的年份;MM 是月份;DD 是日期;HH 和 NN
是前一份翻译记忆保存时的小时和分钟。
如果您认为丢失了翻译数据,可执行下列步骤:
1. 关闭项目
2. 重命名当前的 project_save.tmx 文件(例如改名为 project_save.tmx.temporary)
3. 选择最有可能包含所需数据的翻译记忆备份(例如最近的那个或从某个日子的最后版本)
4. 复制并更名为 project_save.tmx
5. 打开项目
1.3. tmx 文件和语种
tmx文件包含了由一定数量多种语言的等义片段组成的翻译单元。一个翻译单元至少包含了两个翻译单元
变体(tuv)组成。每个都可以当作源或者目标使用。
项目的设置将指出哪个是源语言,哪个是目标语言。因此OmegaT抓取符合项目的源和目标语言代码的tuv
片段,并把它们分别作为源和目标片段使用。OmegaT 使用下面两个标准约定来识别语言代码:
• 2 字母(例如对于 Japanese 为 JA),或者
• 2 或 3 个字母的语言代码后跟着 2 个字母的国家代码(例如 EN-US - 请参阅Appendix A, 语言-ISO 639
代码列表 了解部分的语言和国家代码)。
如果项目语言代码和 TMX 语言代码完全匹配,片段将会导入内存中。如果语言匹配但国家不匹配,仍会
导入片段。如果语言代码和国家代码都不符合,片段将被忽略。
TMX文件通常包含有多种候选语言的翻译单元。如果一个指定的源片段在选择的目标语言中没有条目,则
不考虑语言而加载其他所有目标片段。例如如果项目的语言对为DE-FR,则在不存在DE-FR对的情况下,
看看DE-EN翻译仍然会有些帮助。
1.4. 孤立片段
project_save.tmx 文件包含了自项目开始以来已翻译的所有片段。如果您修改了项目的分割规则或从源中
删除了文件,那么在匹配查看器中可能出现孤立字符串。这样的匹配指向源文档中不存在的片段,而是指
向修改发生前的片段记录。
50
翻译记忆
2. 重用翻译记忆
在创建项目时,项目的主 TM project_save.tmx 是空的。该 TM 文件会在翻译时逐步进行填充。要加快这
个过程,可重用现有的翻译。如果指定的片段已翻译过一次且翻译正确,则无需再次翻译它们。翻译记忆
还可以包含参考翻译:多国法律,例如欧共体的法律是个实际的例子。
在OmegaT项目中创建目标文档时,项目的翻译记忆记忆将会在OmegaT项目的根目录中输出三份文件
(查阅之前的表述)。可将这三份 TMX 文件(-omegat.tmx,-level1.tmx 和 -level2.tmx)视为一份“导出
的翻译记忆”,即当前项目的可导出双语形式。
如果希望复用之前某个项目的翻译记忆(例如新的项目与之前的项目非常相似,或者使用了之前可能用到
的术语),您可以将这些用法记忆用作“输入翻译记忆”,也就是说导入您的新项目。在此情况下,可将这
些翻译记忆记忆文件放置在新项目的/tm或/tm/auto目录下:以前您将在模糊匹配查看器中获取来自这些翻
译记忆的提示,现在开始将使用这些翻译记忆预翻译您的源文本。
默认情况下,/tm文件夹位于项目的根文件夹中(例如:.../MyProject/tm),但如果您愿意您也可以在项目
属性对话框中选择不同的文件夹。如果您频繁使用过去创建的翻译记忆,这将非常有用,比方说因为您一
直在同一领域或为同一客户服务。在此情况下,有益的过程可能包括如下步骤:
• 在硬盘上某个习惯的位置创建一个文件夹(“仓库文件夹”)以保存某个客户或者主题的翻译记忆。
• 每当完成一个项目,将该三份“导出”翻译记忆从项目的根文件夹复制到仓库文件夹。
• 当您为同一主题或者客户启动一个新项目时,在项目 > 属性 > 编辑项目对话框找到该仓库文件夹,将其
选中为翻译记忆文件夹。
注意在程序启动时,/tm 仓库中的所有 TMX 文件将会被解析,因此将手头所有的 TMX 文件导入将会不必
要地减慢 OmegaT 的运行。每当翻译记忆文件的内容已经转到project-save.tmx文件的时候,您可能要考
虑移除那些不再需要的文件。
2.1. 导入和导出翻译记忆
OmegaT 支持导入 tmx 的 1.1-1.4b 版本(包括级别 1 和级别 2)。这样就可以在 OmegaT 中使用其他工
具创建的翻译记忆。然而,OmegaT 不完全支持导入级别 2 tmx 文件(同时保存了译文和格式)。支持导
入级别 2 tmx 文件并在 OmegaT 中看到它们的文本信息,但模糊匹配的质量会有所下降。
OmegaT在加载翻译记忆文件(TMX
文件)时遵循非常严格的过程。如果在文件中发现了错误,则
OmegaT 将提示问题文件中发现错误的位置。
已知有些工具在某些情况下会产生非法的TMX文件。如果您想在 OmegaT 中使用这样的文件作为参考翻
译,您必须对它们进行修补,否则 OmegaT 会加载失败并报告错误。修补是琐碎的操作,OmegaT 将会
在相关的错误信息中给您一些提示。如果遇到麻烦,可以向用户组垂询。
OmegaT 导出 1.4 版本的 TMX 文件(包括级别 1 和级别 2)。导出的级别 2 不是标准的级别 2,但是足
以在支持 TMX 级别 2 的翻译工具中产生正确的匹配。如果您只需要文本信息(而不是格式信息),可以
使用 OmegaT 创建的级别 1 文件。
2.2. 创建所选文档的翻译记忆
在译员需要与别人分享排除或仅包含某些文件的TMX翻译记忆文件时,此时无法分享ProjectNameomegat.tmx文件。下面的窍门只是其中一种方法,不过非常简单、容易操作且没有危险性。
• 使用希望的语言对和名称(注创建的翻译记忆文件也包含此名称)创建一个独立于其他项目的项目。
• 复制您希望获取翻译记忆的源文档到项目的源文件夹。
• 复制包含上述源文档翻译的翻译记忆到新项目的tm/auto子文件夹。
• 打开项目。使用Ctrl+T 检查标签错误,并用Ctrl+U检查未译片段。一切就绪后,按下Ctrl+D创建目标文
档并检查其内容。
51
翻译记忆
• 在退出项目时,现在在项目主文件夹(见上面)中的翻译记忆文件包含了所选语言对和您所复制到源文
件夹中的所选文件的翻译。把它们复制到安全位置供将来使用。
• 要避免重用该项目而可能破坏将来的情况,则删除项目或存档到工作区外的其他位置。
2.3. 分享翻译记忆
在一个翻译团队参与的情况下,译员更喜欢分享公共的翻译记忆而不是发布他们的本地版本。
OmegaT为SVN和Git提供了界面,它们是在开源许可下提供的版本控制系统的两种常用协作软件。在
OmegaT中完整的项目文件夹(即包含翻译记忆、源文件夹、项目设置等)都由所选的RCS进行管理。在
**章节中可进一步了解
2.4. 使用包含可选语言对的翻译记忆文件
可能会遇到这样的情况:项目源语言为荷兰语、目标语言为英语。然而您需要翻译成中文,但您的译员不
懂荷兰语,不过她英语极好。此时NL-EN的翻译记忆可作为桥梁以帮助生成NL-ZH的译文。
我们的解决方法是复制已有的翻译记忆到tm子文件夹并重命名为ZH_CN.tmx以表明TMX的目标语言。这
样将显示给译员荷兰语的源片段其译文为英文,并使用它们创建中文译文。
重要提示:受支持的TMX必须重命名为XX_YY.tmx,其中XX_YY为TMX的目标语言,例如上面例子中的
ZH_CN.tmx。当然项目和TMX的源语言必须一致,此例中为NL。请注意,对于指定的语言对只有一个
TMX是可行的,所以当应该包含多个翻译记忆时您需要将它们全部合并到XX_YY.tmx。
3. 带有现存译文的源
某些类型的源文件(例如PO、TTX等)是双语文件,即它们即作为源文件又作为翻译记忆。此时在文件
中的已有译文会包含到project_save.tmx。在没有找到匹配的源片段中这些译文被视为默认译文,当已含
有目标译文的相同源片段中它们被作为可选译文。因此结果取决于其中源片段被加载的顺序。
源片段的所有译文除显示在匹配窗格外,还显示在注解窗格。如果是PO文件,会对可选译文应用20%的
罚点(即100%的匹配度变成80%)。[模糊]短语会显示在源片段中。
当您加载片段化的TTX文件时,如果选中了选项→编辑行为……中的“允许译文和原文相同”选项时将会包
含源文本与目标文本相同的片段。这样可能引起混乱,所以此时您应考虑取消该选项。
4. 伪翻译记忆
Note
这些内容为感兴趣的高级用户准备的!
在翻译片段之前,您可能想以不同于 OmegaT 的其他方式预处理它们。例如,如果想创建伪翻译进行测
试,OmegaT 能为您创建包含项目所有片段的附加 TMX 文件。该翻译记忆中的译文可以是:
• 和原文相同的译文(缺省)
• 译文片段为空
翻译记忆文件的名称可以任意指定。通过下列命令行参数可生成伪翻译记忆:
java -jar omegat.jar --pseudotranslatetmx=<filename> [pseudotranslatetype=[equal|empty]]
把其中的<filename>替换为想创建的文件名,可以为绝对目录或也可以相对于工作目录(OmegaT的启动
文件夹)。第二个参数
--pseudotranslatetype
是可选的。它的值可以是
equal(缺省值,此时
source=target)或 empty(目标片段为空)。可以使用任何工具处理生成的 tmx 文件。要在 OmegaT 重
用这个文件,请把它更名为 project_save.tmx 并放置到项目的 omegat 文件夹。
52
翻译记忆
5. 更新翻译记忆
OmegaT 的早期版本只能将源文本按照段落切割成片段,而且对HTML和开放文档文件的格式标签编号时
会出现前后不一致。OmegaT可以实时检测并更新这样的TMX文件,以此提高模糊匹配的质量、提高现有
翻译的水平,减少您的手工操作。
项目的 TMX 只会更新一次,且会以更新过的格式写入 project-save.tmx,而每次项目被载入时都会对所继
承的TMX文件进行更新。注意:修改OmegaT中的文件过滤器在某些情况下可能会导致完全不同的片段分
割结构,结果在少数情况下您必须手动更新译文。
53
Chapter 14. 源片段分割规则
翻译记忆工具的使用以叫做片段的文本为单位。OmegaT 使用两种方式对文本进行片段分割:段落分割或
句子分割(也被称为“基于分割的规则”)。要选择分割类型,请从主菜单选择项目 → 属性……,然后选用
选中或取消选中相应的复选框。在某些情况中使用段落分割是有好处的,例如在与创造性和文学性高度相
关的翻译中,译员可能需要改变整个段落的顺序;然而,对于大多数项目,应优先选择句子分割,因为这
样可以与以前的翻译实现更好的匹配。如果选用了句子分割,可通过从主菜单选择选项 → 片段分割……以
设置规则。
许多语言中已经包含了可靠的分割规则,所以很可能您不需要自己编写分割规则。另一方面,该功能在特
殊情况下可能非常有用,您可以针对需要翻译的文本设置分割规则来提高生产力。
警告:由于在改变过滤器选项后将对文本进行不同的分割,所以您可能需要从原文开始进行翻译。同时,
在项目翻译记忆中原来有效的片段将变成孤立片段。如果您在项目打开的时候改变分割规则选项,您必须
重新载入项目以使改变生效。
OmegaT 使用下列步骤:
结构层片
段分割
OmegaT
片段。
首先将文本分割成结构级别的片段。在这个过程中,只有源文本的结构被用于创建
例如:文本文件可能会在行终止、空行进行片段分割或根本进行分割。格式化文件(ODF文
档、HTML 文档等等)在块级别(段落)标签处进行分割。XHTML 或 HTML 文件的可翻译对
象属性可以被提取为独立的片段。
语句级分
割
在将源文件分割为结构单元之后, OmegaT 将进一步把这些块分割为语句。
1. 片段分割规则
片段分割过程可描绘如下:光标沿着文本移动,每次一个字符。在每个光标位置,由 之前和之后的模式组
成的规则以指定的顺序应用,即对左边的文本使用之前模式同时对光标右边的文本使用 之后 模式。如果
规则匹配,光标继续移动而不进行分割(对于例外规则)或者创建一个新片段(为中断规则)。
两种类型的规则表现如下:
中断
规则
将源文本分割为片段。例如,"Did it make sense?I was not sure." 应该分割成两个句子。要实现这
样的目的,应该在 "?" 后跟着空格和大写字符时进行中断的规则。要定义一个中断规则,请选中中
断/例外复选框。
例外
规则
指定哪部分文本不应该被分开。不考虑句点的话, "Mrs. Dalloway " 不应被分割成两个片段,因此
应该为后面跟着句点的 Mrs (以及 Mr 和 Dr 、prof 等等) 创建例外规则。要定义例外规则,请取消
选中中断/例外复选框。
对于绝大多数欧洲语言和日语来说,预定义的中断规则已经够用了。从灵活性的角度看,您可能考虑为要
翻译的语种定义更多的例外规则,以获取语意更完整也更连贯的片段。
2. 规则的优先级
为匹配的语言模式定义的所有片段分割规则会按照规定的优先级别得到应用,因此为特定语言定义的规则
优先级会比缺省规则要高。例如,为加拿大法语 (FR-CA) 创建的规则优先级应该比为法语 (FR.*) 创建规则
的优先级要高,也比缺省规则(.*) 要高。因此,在翻译加拿大法语时,会首先应用加拿大法语规则(如果
存在的话),接着是法语规则,最后为缺省规则。
3. 创建新规则
一般应避免对分割规则进行大幅调整,尤其在开始翻译后,但进行细微修正,例如加上识别的缩略语,可
能会有好处。
54
源片段分割规则
要编辑或扩展现有规则集合,仅需在上面的表格中打开它。规则集合将出现在窗口的下半部分。
要为某新语种模式创建空的规则集合,在对话框的上半部分点击新增。上方表格的底部将出现一条空行
(您可能需要向下滚动才能看到它)。修改规则集的名称和语言模式到相关的语言及其代码(请参
阅Appendix A, 语言-ISO 639 代码列表 语言代码列表)。语言模式的语法遵循正则表达式的语法规则。
如果您设置了规则集来处理语言——国家对,我们建议您使用上移按钮将它移到顶部。
添加之前和之后模式。要检查它们的语法和适用性,建议使用工具来直接查看效果。请参阅正则表达式章
节。了解现有的规则总是个很好的起点。
4. 一些简单的例子
目的
前模式
后模式
\.
\s
“\.”表示句点字符。“\s”表
示任意空白字符(空
格、Tab、新行符等)。
Mr\.
\s
这是一条例外规则,因此
必须取消选中规则的复选
框。
在“。”(日文句点)后进
行分割
。
注意后模式规则是空的
不要对M.、Mr.、Mrs.、
和Ms.之后的内容进行分
割
Mr??s??\.
\s
例外规则——请查阅?在
正则表达式中的用途
设置在句点(‘.’)后跟着
空格、Tab等的位置后开
始新片段。
不要在Mr.后进行分割
55
说明
Chapter 15. 搜索
1. 搜索窗口
Figure 15.1. 文本搜索窗口
Note
上面的搜索查找所有包含目标中不太可能出现的字符(即斯洛文尼亚语字符)的目标片段。
1.1. 搜索
OmegaT 提供了强大的搜索功能。使用 Ctrl+F 调出搜索窗口,在查找文本框输入要搜索的单词或短语。此
外,还可以在编辑区域(当前片段的目标文本)选择一个单词或短语,然后按 Ctrl+F键。在该情况下,单
词或者短语将会自动输入到查找文本框中。您可以同时打开多个搜索窗口,但别忘记在不需要时关闭它
们,这样它们才不会弄乱您的桌面。
1.2. 搜索位置
缺省情况下同时对项目的源和目标部分进行搜索,不过可以限制只在源或目标文本中进行。您可以在下列
位置进行搜索
• 仅项目(缺省设置)
56
搜索
• 在项目和 /tm/ 中的参考翻译记忆(选中搜索翻译记忆)
• 单独的文件或包含一系列文件的文件夹(选中搜索文件)
在文件中搜索(相对于翻译记忆)时,OmegaT 将限制源文件格式。因此,尽管 OmegaT 能充分处理
tmx 文件,但它不会在进行文件搜索时把它们纳入搜索范围。如果打开了高级选项,您还可以把译文的作
者和上次修改时间组合在一起进行搜索。
2. 使用通配符
无论是精确还是关键词搜索,都可以使用通配符 '*' 和 '?'。它们的含义Word用户很熟悉:
• ‘*’匹配零个或多个字符,从指定单词的当前位置开始到它结束的部分。例如搜索条件‘run*’将会匹配单
词‘run’、‘runs’和‘running’。
• ‘?’匹配任何单个字符。例如,‘run?’ 会匹配单词‘runs’和‘running’单词中的‘runn’。
匹配将显示为蓝色粗体。需要注意‘*’和‘?’在正则表达式中有特殊含义,所以这里所说的通配符搜索只适用
于精确搜索和关键字搜索(见下文)。
3. 搜索方式和选项
使用单选按钮选择搜索方法。下面是可用的搜索方式:
精确搜
索
找出包括指定字符串的片段。精确搜索查找某条短语,也就是说,如果输入了多个词汇,只有它
们以相同顺序出现时才会被找出来。搜索 open file 将找到所有 open file 字符串出现的地方,但
不会找到 file opened 或 open input file.
关键字
搜索
找出所有包括指定关键字的片段,不考虑顺序。选择关键字搜索以搜索任何数目、任何顺序出现
的所有词汇。OmegaT 会显示所有词汇都出现了的片段清单。关键字搜索和互联网 Google 搜
索引擎的 “使用所有词”方式相似(AND 逻辑)。使用关键字open file进行搜索将找到所有open
file、file opened、open input file以及file may not be safe to open等字符串出现的地方。
正则表
达式
搜索字符串将会被当作正则表达式进行处理。例如在上文示例中的搜索字符串[a-zAZ]+[öäüqwß]在目标片段中寻找包含疑似来自德语键盘的字符的单词。正则表达式是一种功能强
大的字符串实例查找方法。请到正则表达式章节了解更多信息。
对上面的几种方式,您还可以选择下列选项:
• 区分大小写:搜索工作将会严格匹配指定字符串,即遵循大小写状态。
• 源片段:在源片段中搜索
• 目标片段:在目标片段中搜索
• 笔记:在笔记中搜索
• 搜索翻译记忆:在搜索时也把tm目录中的翻译记忆纳入其中。
• 显示所有结果:清除该复选框会使OmegaT在存在许多hit时仅显示首个提示的位置。
点击高级选项按钮会出现可供选择的附加条件(如翻译作者、翻译日期等),如上图所示。
4. 搜索结果展示
在搜索字段输入一个字符串然后点击搜索按钮,会把项目中所有包含输入字符串的片段显示出来。由于
OmegaT 将相同片段视为同一实体,因此将只显示第一个独特的片段。片段以在项目中出现的顺序显示。
已译片段会以上面显示原文、下面显示译文的形式显示,而未译片段只显示原始文本。
点击某片段将会编辑器中将它打开。然后您可以转回搜索窗口以编辑找到的下一个片段,例如进行检查或
者在必要时调整术语。
57
搜索
可以同时打开多个搜索窗口。通过标题您可以快速了解它们的搜索内容:标题中包含了搜索用词。
58
Chapter 16. 正则表达式
在搜索和片段切分规则中使用的是 Java 支持的正则表达式(或简称为 regex)。如果需要更详细的信息,请
参阅 Java Regex 文档 [http://download.oracle.com/javase/1.6.0/docs/api/java/util/regex/Pattern.html]. 查
阅下面提到的附加参考和范例。
Note
本章内容是为高级用户准备的,用于定义多变的分割规则或使用更复杂和强大的搜索功能。
Table 16.1. Regex - 标志
构造
……匹配下列内容:
(?i)
激活大小写不敏感匹配(缺省模式为大小写敏感)
Table 16.2. Regex - 字符
构造
……匹配下列内容:
x
字符 x,除了以下内容……
\uhhhh
以十六进制值 0xhhhh 表示的字符
\t
制表符 ('\u0009')
\n
新行(换行)符 ('\u000A')
\r
回车符 ('\u000D')
\f
换页符 ('\u000C')
\a
报警(响铃)符 ('\u0007')
\e
转义符 ('\u001B')
\cx
与 x 对应的控制字符
\0n
八进制值 0n (0 <= n <= 7) 表示的字符
\0nn
八进制值 0nn (0 <= n <= 7) 表示的字符
\0mnn
八进制值 0mnn (0 <= m <= 3, 0 <= n <= 7) 表示的
字符
\xhh
十六进制值 0xhh 表示的字符
Table 16.3. Regex - 引用
构造
……匹配下列内容
\
什么都不匹配,但对以下字符进行引用。当您需要
对 !$()*+.<>?[\]^{|} 中任意一个元字符进行匹配时需
要使用它。
\\
例如,这是反斜杠字符
\Q
什么都不匹配,但是引用 \E 之前的所有字符
\E
什么都不匹配,但结束由 \Q 开始的引用
Table 16.4. Regex - 用于 Unicode 字块和分类的类
构造
……匹配下列内容
\p{InGreek}
希腊字块中的字符(简单的字块 [http://
download.oracle.com/javase/1.6.0/docs/api/java/
util/regex/Pattern.html#ubc])
\p{Lu}
大写字母(简单的分类 [http://
download.oracle.com/javase/1.6.0/docs/api/java/
util/regex/Pattern.html#ubc])
59
正则表达式
构造
……匹配下列内容
\p{Sc}
货币符号
\P{InGreek}
任何不在 Greek 字块中的字符(取反)
[\p{L}&&[^\p{Lu}]]
除大写字母之外的所有字母(减法)
Table 16.5. Regex - 字符类
构造
……匹配下列内容
[abc]
a, b 或 c(简单的类)
[^abc]
除了 a、b 或 c 之外的任何字符(取反)
[a-zA-Z]
a 到 z 和 A 到 Z 的字符,包含两边(范围)
Table 16.6. Regex - 预定义字符类
构造
……匹配下列内容
.
任何字符 (除了行结束符之外)
\d
数字:[0-9]
\D
非数字:[^0-9]
\s
空白字符:[ \t\n\x0B\f\r]
\S
非空白字符:[^\s]
\w
单词字符:[a-zA-Z_0-9]
\W
非单词字符:[^\w]
Table 16.7. Regex - 边界匹配
构造
……匹配下列内容
^
行首
$
行尾
\b
单词边界
\B
非单词边界
Table 16.8. Regex - 贪婪量词
构造
……匹配下列内容
X?
X 出现一次或根本不出现
X*
X 出现零次或多次
X+
X 出现一次或多次
Note
贪婪量词会匹配尽可能多的字符。例如,a+? 将会匹配 aaabbb 中的 aaa
Table 16.9. Regex - 非贪婪量词
构造
……匹配下列内容
X??
X 出现一次或根本不出现
X*?
X 出现零次或多次
X+?
X 出现一次或多次
Note
非贪婪量词会匹配尽可能少的字符。例如,a+? 将会匹配 aaabbb 中的 a
60
正则表达式
Table 16.10. Regex - 逻辑操作符
构造
……匹配下列内容
XY
X 后跟着 Y
X|Y
X或Y
(XY)
XY 作为单个组出现
1. 正则表达式的工具和使用实例
有许多用于开发和测试正则表达式的交互工具。他们几乎都遵循同样的模式(见下面的
Regular
Expression Tester 示例):正则表达式(上面的条目)分析了搜索文本(中间的文本框),进行点击,显
示结果文本框。
Figure 16.1. Regex Tester
请参阅用于 Windows、Linux、FreeBSD 平台的独立工具 The Regex Coach [http://weitz.de/regex-coach/
]。这个工具和上面的示例几乎一致。
在 OmegaT 内可找到非常有用的正则表达式实例集(请参阅选项 > 片段分割)。在搜索翻译记忆时,下列
表所包含的表达式可能会有用:
Table 16.11. Regex - 用于译文的正则表达式示例
正则表达式
查找以下内容:
(\b\w+\b)\s\1\b
双字
[\.,]\s*[\.,]+
一个逗号或句点,跟着空格,然后是另一个逗号或
句点
\. \s+$
在行尾,句点后跟着额外的空格
\s+a\s+[aeiou]
英语:单词,以元音开始,前面可以是 "an" 而不能
是 "a"
\s+an\s+[^aeiou]
英语:如上一条表达式,但为辅音("a",而不是
"an")
\s{2,}
一个以上空格
61
正则表达式
正则表达式
查找以下内容:
\.[A-Z]
句点,跟着一个大写字母——是否在句点和下一个
句子间遗漏了空格?
\bis\b
匹配“is”,但不是“this”或“isn't”等。
62
Chapter 17. 词典
1. 如何下载和安装词典
OmegaT的词典基于StarDict或为Lingvo DSL格式。要为StarDict格式安装必须的文件,进行如下操作:
• 搜索所需的语言组合,例如上面的StarDict平台 [http://stardict.sourceforge.net/index.php]。
• 下载文件——可能是一份 tarball 存档(扩展名为 tar.bz 或 tar.bz2)。
• 使用 untar (或类似工具,例如 Windows 中的 winrar)将内容解压至项目文件夹 "Dictionary" 中。应该
包括三份文件,扩展名分别为:dz, idx 和 ifo。
注意除了可以使用“原文-译文”类型的词典之外,通过词典功能还可以访问下列资源:
• 韦氏修订同义词词典(1913)
• 朗文当代英语词典
• 不列颠简明百科全书
• ……等等
一些词典有些不附带任何条件——也就是说可以“自由使用”,而另一些,如上述则是基于GPL许可。下面
的例子显示了 Merrian Webster 10th dictionary 的“实际应用”:
Figure 17.1. Merriam Webster 词典——实际使用
2. 与词典相关的问题
• 检查词典文件是否放在正确的文件夹(或其子文件夹)中。查看项目 → 属性 (Ctrl+E).
• 文件夹中是否包含了三个名称相同,且带扩展名的文件?如果只有一份与预期相同的文件,那么检查下
它的扩展名。如果扩展名为tar.bz,那么是因为您忘记解压了。
63
Chapter 18. 词汇表
词汇表是用于 OmegaT 的文件,它由用户手工创建和更新。
如果某个 OmegaT 项目包含一个或多个词汇表文件,当前片段中出现的任何术语将自动显示在词汇表查
看器中。
您可以在项目属性对话框中设定其位置和名称。扩展名必须为.txt(若不存在,则会自动加上)。该文件
的位置必须在/glossary文件夹,不过它可以在较深层的文件夹(如glossary/sub/glossary.txt)。在设置时
该文件可以不存在,在添加词条时会自动创建该文件(如果需要)。如果该文件已存在,不会对其格式或
字符集进行检查:新条目总是以tab分隔并使用UTF-8编码。由于不会操作已有的内容,这样对已有文件的
破坏则受到了限制。
1. 用法
要使用现有的词汇表,只需在创建项目后将它放到 /glossary 目录下。在打开项目时,OmegaT 自动检测
该目录下的词汇表文件。从词汇表中找到当前片段中的术语后,OmegaT 将会在词汇表窗格将它们显示出
来。
Figure 18.1. 词汇表窗格
等号之前的单词是源术语,其翻译在等号(=)之后。词条可以有附加的注释。词汇表功能只能找到与词
汇表条目精确匹配的词汇(也就是说不会找到变化的词形)。在翻译时可以手动添加术语到词汇表中,比
如在文本编辑器中。在文件中新增的术语保存后不会马上被发现。
源术语可以不是一个单词,例如:
Figure 18.2. 词汇表中的多单词条目——示例
64
词汇表
添加了下划线的项“pop-up menu”可以在词汇表窗格找到并提示“pojavni menu”。在词汇表窗格中高亮该
1
项,接着点击右键将其插入到当前目标片段的光标处。
2. 文件格式
词汇表文件是简单的纯文本文件,包含了以制表符分隔的三列列表,其中第一和第二列分别对应源词汇和
目标术语。第三列用来保存附加信息。您可以添加目标列为空的条目,即只包含源术语和注释。
词汇表文件可以使用系统缺省的编码方式(以扩展名 .tab 表示),或者 UTF-8(扩展名 .utf8)。出于显而
易见的理由,Unicode 编码 (UTF8) 是首选。还支持 CSV 格式。该格式和 TAB 分隔的相同:源术语,目
标术语。注释字段使用逗号 ',' 分隔开来。字符串需要括在引号 " 里面,这样可以在字符串中使用逗号:
"This is a source term, which contains a comma","c'est un terme, qui contient une virgule"
除了纯文本,还支持 TBX 格式。TBX(Term Base eXchange)是用于交换结构化术语数据的基于
XML 的开放标准,已经被LISA和ISO批准为国际标准。如果您已经有术语管理系统(例如MultiTerm),
那么它很可能提供了导出 TBX 格式术语数据的功能。微软术语集 [http://www.microsoft.com/Language/
en-US/Terminology.aspx] 可以下载将近 100 种语言的术语,它们可以作为IT词汇表的基础。
3. 如何创建词汇表
项目设置中可以输入可写词汇表文件的名称(请参阅本章开始处)。在词汇表窗格点击右键或按下Ctrl
+Shift+G来添加新条目。在打开的对话框中可以输入源术语、目标术语及注释。
词汇表文件的内容会存放到内存中,在打开或重新载入项目时加载它们。因此更新词汇表变得非常简单:
按下Ctrl+Shift+G并输入新术语、其翻译及注释(确保在字段间使用了TAB)并保存文件。因此词汇表窗
格的内容将会被更新。
可写词汇表的位置可在项目>属性……对话框中设定。可识别出的扩展名为TXT和UTF8
注:还有其他创建含TAB分隔条目的简单文件的方法。例如没人会反对在Windows上使用Notepad++或在
Linux上使用GEdit或支持此操作的一些电子表格程序:可以使用任何能处理UTF8和显示空格(这样就不
会遗漏必须的TAB字符)的程序。
1
必须注意在这种情况中,到这里只说到一半(甚至更少),因为目标语言(斯洛文尼亚语)具有词形变化。所以被插入的主格“pojavni meni”需要
改变为“pojavnem meniju”,即转变为位置格。因此直接输入术语而不通过词汇表及其快捷方式可能会更快。
65
词汇表
4. 使用Trados MultiTerm
在 Trados MultiTerm 导出的数据可以不加修改地用作 OmegaT 词汇表,只需以 .tab为扩展名,并让对应
的源词汇和目标术语分别为头两个字段。如果使用 "Tab-delimited export" 系统选项导出,您必须删除头 5
列(包括编号, 创建日期等等)。新版本的 MultiTerm 支持导出为 TBX 格式。
5. 常见词汇表问题
问题:未显示词汇表术语——可能的解决方法:
• "glossary" 目录中没有找到词汇表文件。
• 词汇表文件为空。
• 词条的各项间未使用 TAB 字符分隔。
• 术语表文件未使用正确的扩展名(.tab 或 .utf8)。
• 词汇表词条和文档中的原文未完全匹配--例如该词条是复数形式。
• 词汇表文件没有采用正确的编码。
• 当前片段中没有任何术语与词汇表中的术语相匹配。
• 上述一个或多个问题已经被修正,但项目还没有被重新载入。
问题:在词汇表窗格中某些字符显示不正确。
• ……但在编辑窗格中能正确显示这些字符:扩展名与文件编码方式不匹配。
66
Chapter 19. 机器翻译
1. 介绍
与用户生成的翻译记忆(就像 OmegaT)相对的是机器翻译 (MT) 工具,它使用基于规则的语言学工具而
不是翻译记忆来创建源片段的翻译。使用根据源和目标文本的统计学习技术来构建翻译模型。机器翻译服
务已经在研究评估中达到了较好且稳定的结果改善。
要激活某种机器翻译服务,请前往选项>机器翻译……,然后激活需要的服务。需要注意的是它们都是基
于网络:您必须在线才能使用它们。
2. 谷歌翻译
谷歌翻译是由谷歌提供的付费服务,可用于翻译句子,网站和日益增多的语言的竞争文本。在编写此文档
时,其支持的语言超过50多种,从阿尔巴尼亚语到意第绪语,其中当然包括所有主要语言。该服务的当前
版本根据使用付费的,在编写此文档时每百万字符 20 USD 的价格。
重要提示:在您使用谷歌翻译
API
v2
的服务前需要所有客户的账单信息(请参阅价格和服务条
款 [https://developers.google.com/translate/v2/pricing?hl=en-US]了解更多信息)。为了向谷歌服务表明
您是合法用户,您需要使用在注册服务后谷歌发给您的唯一的私匙。请参阅安装和运行章节的运行命令参
数部分,了解如何添加该密钥到 OmegaT 环境中的详细情况。
谷歌翻译的质量当然一方面取决于目标语言文本和双语版本的可用性,另一方面取决于所创建模型的质
量。有一点可以肯定,在某些情况下,其质量肯定不够好,但它肯定会不断提高,而不是变差。
3. OmegaT 用户和谷歌翻译
OmegaT 并不强迫用户使用谷歌翻译。如果用了,既不表示用户要接受该译文,更不表示最终译文会提供
给谷歌。下面的窗口展示了一个 a) 英文原文 b) 西班牙语 和 c) 斯洛文尼亚语 的谷歌翻译译文。
Figure 19.1. 谷歌翻译 - 示例
西班牙语译文要好于斯洛文尼亚语的。注意西班牙语中的 interesar 和 navegar 被正确地翻译成动词
"interest" 和 "sail"。在斯洛文尼亚语版本中,两个词都被译成了名词。很可能西班牙语的翻译至少部分基
于实际的书籍译文。
当您激活了该服务后,每次打开新的源片段时,其对应的翻译建议将会出现在机器翻译窗格中。如果发现
了可接受的建议,按下 Ctrl+M 可使用它替换已打开片段的目标部分。例如在上面的片段中,使用 Ctrl+M
将会用斯洛文尼亚语的建议版本覆盖西班牙语的版本。
67
机器翻译
如果不希望 OmegaT 把源片段发送至谷歌获取译文,请取消选项菜单中的谷歌翻译菜单项。
注意,除了源片段外不会将其他任何内容发送至机器翻译服务。谷歌翻译的在线版本允许用户纠正翻译建
议和发送正确的片段。然而此功能在 OmegaT 中尚未实现。
4. Belazar
Belazar [http://belazar.info/] 是用于俄罗斯-白俄罗斯语言对的机器语言翻译工具。
5. Apertium
Apertium [http://www.apertium.org/] 是自由、开源的机器翻译平台,最初致力于相关的语言对,例如
CA、ES、GA、PT、OC 以及 FR,不过最近扩展为能够处理更多的其他语言对(例如英语-加泰罗尼亚
语)。请参阅网站了解已实现语言对的最新列表。
该平台提供
• 语言独立的机器翻译引擎
• 用来管理语言学数据的工具,这些数据是构建指定语言对的机器翻译系统不能缺少的
• 用于不断增长的语言对数目的语言学数据
Apertium 使用浅层传播机器翻译引擎(shallow-transfer machine translation engine )来处理输入的文
本,就像汇编行:去除格式,形态分析,语音消歧,浅层结构传播,词汇传播,形态生成以及重新格式
化。
使用 Apertium 为各种语言对构建机器翻译系统是可行的,在底端,Apertium 使用基于 XML 的简单标准格
式对需要的语言学数据(通过手工或转换现有数据)进行编码,并使用提供的工具被编译为引擎可用的高
级格式。
6. 机器翻译 - 故障排除
如果在机器翻译窗格中没有出现任何东西,检查下列内容:
• 是否在线?必须处于在线状态才能使用机器翻译。
• 进行翻译的语言对是什么?检查选择的服务是否支持。
• 谷歌翻译无法工作:您申请了Translate API service [https://developers.google.com/translate/v2/
faq]吗?注意谷歌翻译服务需要付费,请参阅安装和运行章节(运行时参数)了解更多相关信息。
• "Google Translate returned HTTP response code: 403 ...":请检查 38 个字符的密钥,输入到 pinfo.list
文件时是否正确。请检查是否激活翻译 API 服务 [https://developers.google.com/translate/v2/faq]。
• 谷歌翻译无法工作:请在请求时输入谷歌API密钥。检查选项>机器翻译中的谷歌翻译V2是否选中。
• Google Translate V2报告“Bad request”——请检查项目的源和目标语言。包含未定义的语言会引起此类
响应。
68
Chapter 20. 拼写检查
OmegaT内置有拼写检查器,它基于在Apache OpenOffice、LibreOffice、Firefox和Thunderbird中使用的
拼写检查器。因此能使用在这些程序中可用的大量免费的拼写检查词典。
1. 安装拼写词典
在检查拼写前,必须先安装适合的词典(例如用于您的目标语言)。要安装拼写词典,请参照这些步骤:
• 请在文件管理器中适当的位置创建新文件夹用来保存拼写词典(在下面的示例中为D:\Translations
\spellcheckers)。
• 在
OmegaT,选择选项>拼写检查,然后点击词典文件夹区域旁选择。浏览到保存词典的文件夹并选
中。
• 把要使用的词典文件放到此文件夹。进行这个操作实际分成两步。您可以使用文件管理器从其他位置手
动复制文件,或使用 OmegaT 的“安装”功能来提供可选择的词典列表。请注意“安装”功能需要网络连
接。随后选中的语言将会被安装,并出现在拼写检查器窗口中(可能需要一段时间)。
如果您系统中已经有合适的词典,那么可以手动复制,例如在Apache OpenOffice、LibreOffice、Firefox
或Thunderbird安装过程中已经安装了。这样简单点,不过如果要查找在线词典,请使用在线词典的网
址字段:
Figure 20.1. 拼写检查器设置
点击安装新词典按钮将打开词典安装窗口,此处您可选择要安装的词典。
文件的名称必须与项目属性对话框(项目>属性)中定义的目标语言的代码一致。例如,如果您选择ESMX(墨西哥式西班牙语)为目标语言,则词典文件必须命名为es_MX.dic和es_MX.aff。如果您只有标准
的西班牙语词典(例如文件名为es_es.dic和es_es.aff),您把这些文件改名为es_MX.dic和es_MX.aff也能
让拼写检查词典正常工作。请注意,除墨西哥式西班牙语外这时也会检查标准的卡斯提尔语。
2. 使用拼写词典
无需告诉 OmegaT 使用特殊的拼写词典,它会根据项目的语言代码来使用正确的语言词典。请确保目标
文件的语言代码与字典的语言代码相同:例如,FR-FR 字典在 FR 为目标语言设置下将无法正常使用。必
要时可编辑词典文件名或改变项目的语言设置。
69
拼写检查
要启用拼写检查器,请选择选项>拼写检查并选中自动检查文本拼写的复选框(见上面)。
Figure 20.2. 使用拼写检查器
右键单击突出显示的词汇(上面图示中的 "Artund")打开下拉菜单,其中列出了更正建议(Art und)。此
外,您也可以要求拼写检查器忽略所有该词的出现,或者把它添加到字典。
3. 提示
如果拼写检查器没有运行,首先确保选中了拼写检查器对话框(选项>拼写检查……)中“自动检查文本拼
写”的复选框。
在设置窗口中对照可用词汇表检查项目的目标语言代码。拼写检查器根据目标语言代码来决定要使用的语
言:如果目标语言是巴西葡萄牙语 (PT_BR),存放词汇表的目录必须包括两份词汇表,名为 pt_br.aff 和
pt_br.dic。
如果已经译了一大段文本,但是才意识到项目的目标语言代码与拼写检查器的语言代码不符(如将pt_BR
设为目标语言,但没有pt_BR词汇表),您只需复制两份对应的文件并进行重命名(例如
把pt_PT.aff和pt_PT.dic改名为pt_BR.aff和pt_BR.dic)。当然,中断一小段时间并下载正确的拼写检查器
版本的做法更加理智。
注意删除实际上只是删除了选择的词汇表。如果系统上有其他程序使用它们,则它们也会从那些程序中消
失。如果出于某种原因,您必须不时地重复该操作,将这些文件复制到其它目录并为 OmegaT 保留它们
是非常有意义的。
70
Chapter 21. 杂项主题
1. OmegaT 控制台模式
Note
这些内容为感兴趣的高级用户准备的!
控制台(即命令行)模式的目的是将 of OmegaT 用作脚本环境的翻译工具。在控制台模式下,将不会载
入任何图形化界面(因此仅在某控制台中运行),同时会自动按要求翻译指定的项目。这样的一个例子是
需要把图形用户界面本地化为多种语言的软件项目。使用控制台模式就可以在它的构建过程中生成本地化
界面。
1.1. 先决条件
为运行 OmegaT,必须存在有效的 OmegaT 项目。位置并不重要,因为无论如何,启动时您都必须在命
令行中明确指定它的位置。
如果不使用标准设置,则必须提供相应的配置文件(filters.conf和segmentation.conf))。可通过两种方式
达到这个目的:
• 正常运行 OmegaT (带图像用户界面)并进行设置。如果以控制台模式启动 OmegaT,它将使用您配
置的设置。
• 如果您无法正常运行OmegaT(没有可用的图形界面):可将另一机器上安装的OmegaT设置文件复制
到指定文件夹。位置并不重要,因为无论如何,启动时您都必须将位置添加到命令行。相关的文
件filters.conf和segmentation.conf可在用户主目录找到(如Windows
系统中的C:\Documents
and
Settings\%User%\OmegaT或Linux系统中的%user%/.omegat/)
1.2. 以控制台模式运行 OmegaT
要以控制台模式启动 OmegaT,必须在启动时传入另外的参数。其中最重要的是<project-dir>,还可以加
上--config-dir=<config-dir>。例如:
$> java -jar OmegaT.jar /path/to/project \
--config-dir=/path/to/config-files/ \
--mode=console-translate \
--source-pattern={regexp} \
--tag-validation=[block|warn]
说明:
• <project-dir> 告知 OmegaT 要翻译项目的位置。如果给出了该参数,则 OmegaT 以控制台模式启动并
翻译指定的项目。
• --config-dir=<config-dir> 向 OmegaT 指示配置文件所在的目录。如果没有给出该参数,OmegaT 将转而
使用缺省值(即用户主目录中的OmegaT文件夹,如果不可用的话则是当前的工作目录)。
• --mode=console-translate OmegaT 以控制台模式运行并翻译指定的项目。
• --source-pattern={regexp} 可使用这种方式指定要翻译的文件。这是一个正则表达式的例子:test\.html
• --tag-validation=[abort|warn]若使用abort,在标签检验发现错误时会中止。用warn则打印错误且
OmegaT继续执行。在其他情况下(即不使用此参数时)不会进行标签验证操作。
71
杂项主题
1.3. 静默选项
控制台模式专用的一个附加命令行参数:--quiet。在静默模式下,屏幕上将显示更少的日志信息。在状态
栏通常可以看到的所有信息都不会被显示。
用法:java -jar OmegaT.jar /path/to/project --mode=console-translate --quiet
1.4. 标记验证选项
控制台模式专用的另一个附加命令行参数: --tag-validation=[abort|warn]。添加此参数后,标签验证操作
先于翻译/对齐进行。如果该参数值为 abort,那么在遇到标签错误时打印出错误,同时程序停止。如果该
参数值为 warn,则打印错误且 OmegaT 继续执行。
用法:java -jar OmegaT.jar /path/to/project --mode=console-translate --tag-validation=abort
2. 自动Java属性对齐器
OmegaT 可以在控制台模式中对齐 Java .properties。如果您有以您需要的语言对表示的源和目标属性文
件,这个过程将创建包含这些内容的 TMX 文件。用法:
java -jar OmegaT.jar --mode=console-align /my-project-dir --alignDir=/translatedFiles/
alignDir 必须包含项目目标语言的翻译。例如,如果项目为 EN->FR,则 alignDir 必须包含以 _fr 结尾的
包。生成的 TMX 保存在 omegat 目录,名称为 align.tmx。
3. 字体设置
在该对话框中可以修改下列 OmegaT 窗口所使用的字体:
• OmegaT 主窗口 (编辑器、匹配查看器、词汇表查看器)
• 搜索窗口
• 标签验证窗口
通过主菜单中的选项 → 字体……菜单项可以调出该对话框。该对话框包括:
• 字体:用于在计算机上选择可用字体的下拉菜单。
• 大小:改变字体大小。
• 示例文本:即时预览所选择的字体的区域。
注意:在某些情况下,修改字体设置后 OmegaT 可能需要一些时间来更新显示。特别是在编辑器中打开
了一份拥有大量片段的大文件或使用慢速硬件的时候。同时,就某些语言而言,某些字体比另一些的表现
更佳。特别是当您在不同的语系/书写系统间进行翻译(例如俄语和日语),请选择一种适用于两者的字
体。
4. 防止数据丢失
OmegaT 是健壮的应用程序。然而就像使用其他任何程序一样,使用 OmegaT 时还是应该对数据丢失保
持警惕。在翻译文件时,OmegaT在项目的/omegat 子文件夹的翻译记忆文件project_save.tmx中储存您所
有的进度信息。
OmegaT
在每次打开或重新载入项目时,也将翻译记忆备份到同一子目录下的
project_save.tmx.YEARMMDDHHNN.bak 文件中。YEAR 是 4 位数的年份;MM 是月份;DD 是日期;而
HH 和 NN 是前一份翻译记忆保存时的小时和分钟。
如果您觉得丢失了翻译数据,那么可以参照下列步骤恢复项目到最近保存的数据,通常是大约 10 分钟以
内:
72
杂项主题
1. 关闭项目
2. 重命名当前的 project_save.tmx 文件(例如改名为 project_save.tmx.temporary)
3. 选择最有可能包含所需数据的翻译记忆备份
4. 将其更名为 project_save.tmx
5. 打开项目
为避免丢失重要数据:
• 必须定期备份 /omegat/project_save.tmx,例如复制到 CD 或 DVD。
• 在熟悉 OmegaT 之前,应该定期创建已译文件,并查看已译文件是否包含了您所翻译的最新版本。
• 在项目进行过程中,对/source目录中的文件进行修改要特别小心。如果在开始翻译后对源文件进行了
修改,OmegaT 也许会找不到您已经翻译的某个片段。
• 通过这些帮助来开始使用。如果运行遇到问题,请在OmegaT 用户组 [http://tech.groups.yahoo.com/
group/Omegat/]发帖。请使用自我感觉最熟悉的语言发帖。
73
Appendix A. 语言-ISO 639 代码列表
请检查ISO 639代码表 [http://www.sil.org/ISO639-3/codes.asp]来了解更多和更新的语言代码信息。
Table A.1. ISO 639-1/639-2 语言代码列表
语言名称
ISO 639-1
ISO 639-2
阿布卡兹语
ab
abk
阿法尔语
aa
aar
南非荷兰语(斐语)
af
afr
库阿语
ak
aka
阿尔巴尼亚语
sq
sqi
阿姆哈拉语
am
amh
阿拉伯语
ar
ara
阿拉贡语
an
arg
亚美尼亚语
hy
hye
阿萨姆语
as
asm
阿瓦尔语
av
ava
阿维斯陀语
ae
ave
艾马拉语
ay
aym
阿塞拜疆语
az
aze
班巴拉语
bm
bam
巴什基尔语
ba
bak
巴斯克语
eu
eus
白俄罗斯语
be
bel
孟加拉语
bn
ben
比尔哈语
bh
bih
比斯拉马语
bi
bis
波斯尼亚语
bs
bos
布里多尼语
br
bre
保加利亚语
bg
bul
缅甸语
my
mya
加泰罗尼亚语
ca
cat
查莫罗语
ch
cha
车臣语
ce
che
奇契瓦语、切瓦语、尼安哈语
ny
nya
中文
zh
zho
楚瓦什语
cv
chv
凯尔特语
kw
cor
科西嘉文
co
cos
克里语
cr
cre
克罗地亚语
hr
hrv
捷克语
cs
ces
丹麦语
da
dan
74
语言-ISO 639 代码列表
语言名称
ISO 639-1
ISO 639-2
地维希语、迪维希语、马尔代夫
语
dv
div
荷兰语
nl
nld
不丹语
dz
dzo
英语
en
eng
世界语
eo
epo
爱沙尼亚语
et
est
埃维语
ee
ewe
法罗语
fo
fao
飞济群岛语
fj
fij
芬兰语
fi
fin
法语
fr
fra
弗拉语、富拉语、弗拉尼语、普
拉尔语
ff
ful
加利西亚语
gl
glg
格鲁吉亚语
ka
kat
德语
de
deu
希腊语(现代)
el
ell
瓜拉尼语
gn
grn
古吉拉特语
gu
guj
海地语、海地克里奥尔语
ht
hat
豪撒语
ha
hau
希伯来语(现代)
he
heb
赫勒娄语
hz
her
印地语
hi
hin
希里莫图语
ho
hmo
匈牙利语
hu
hun
国际语
ia
ina
印尼语群
id
ind
国际语
ie
ile
爱尔兰语
ga
gle
伊博语
ig
ibo
依努皮亚语
ik
ipk
伊多语
io
ido
冰岛语
is
isl
意大利语
it
ita
伊努伊特语
iu
iku
日语
ja
jpn
爪哇语
jv
jav
格陵兰语
kl
kal
卡纳塔克语
kn
kan
卡努里语
kr
kau
克什米尔语
ks
kas
75
语言-ISO 639 代码列表
语言名称
ISO 639-1
ISO 639-2
哈萨克语
kk
kaz
高棉语
km
khm
吉库犹语
ki
kik
卢旺达语
rw
kin
吉尔吉斯语
ky
kir
科米语
kv
kom
刚果语
kg
kon
韩语
ko
kor
库尔德语
ku
kur
库瓦亚马语
kj
kua
拉丁语
la
lat
卢森堡语
lb
ltz
卢干达语
lg
lug
林堡语
li
lim
林加拉语
ln
lin
老挝语
lo
lao
立陶宛语
lt
lit
卢巴-加丹加语
lu
lub
拉脱维亚语
lv
lav
马恩岛语
gv
glv
马其顿语
mk
mkd
马达加斯加语
mg
mlg
马来语
ms
msa
马拉亚拉姆语
ml
mal
马其他语
mt
mlt
毛利语
mi
mri
马拉地语(Marāṭhī)
mr
mar
马绍尔语
mh
mah
蒙古语
mn
mon
瑙鲁语
na
nau
纳瓦伙语
nv
nav
挪威博克马尔语
nb
nob
北恩德贝勒语
nd
nde
尼泊尔语
ne
nep
恩敦加语
ng
ndo
挪威尼诺斯克语
nn
nno
挪威语
no
nor
彝语
ii
iii
南恩德贝勒语
nr
nbl
奥西坦语
oc
oci
欧吉布瓦语
oj
oji
古教会斯拉夫语、教会斯拉夫
语、古斯拉夫语
cu
chu
76
语言-ISO 639 代码列表
语言名称
ISO 639-1
ISO 639-2
库希特语言
om
orm
奥里亚语
or
ori
奥塞特语
os
oss
旁遮普语
pa
pan
巴利语
pi
pli
波斯语
fa
fas
波兰语
pl
pol
普什图语
ps
pus
葡萄牙语
pt
por
盖丘亚语
qu
que
罗曼斯语
rm
roh
基隆迪语
rn
run
罗马尼亚语、摩尔达维亚语
ro
ron
俄语
ru
rus
梵语(Saṁskṛta)
sa
san
撒丁语
sc
srd
信德语
sd
snd
北萨米语
se
sme
萨摩亚语
sm
smo
桑戈语
sg
sag
塞尔维亚语
sr
srp
苏格兰盖尔语, Gaelic
gd
gla
修纳语
sn
sna
锡兰语
si
sin
斯洛伐克语
sk
slk
斯洛文尼亚语
sl
slv
索马利语
so
som
南索托语
st
sot
西班牙语、卡斯提语
es
spa
巽他语
su
sun
斯瓦希里语
sw
swa
斯瓦特语
ss
ssw
瑞典语
sv
swe
泰米尔语
ta
tam
泰卢固语
te
tel
塔吉克语
tg
tgk
泰语
th
tha
蒂格里亚语
ti
tir
标准藏语、西藏语、主要的
bo
bod
土库曼语
tk
tuk
塔加拉族语
tl
tgl
塞茨瓦纳语
tn
tsn
77
语言-ISO 639 代码列表
语言名称
ISO 639-1
ISO 639-2
汤加语(汤加群岛)
修改为
ton
土耳其语
tr
tur
宗加语
ts
tso
鞑靼语
tt
tat
Twi
tw
twi
大溪地语
ty
tah
维吾尔语
ug
uig
乌克兰语
uk
ukr
乌尔都语
ur
urd
乌兹别克语
uz
uzb
文达语
ve
ven
越南语
vi
vie
沃拉卜克语
vo
vol
瓦隆语
wa
wln
威尔士语
cy
cym
沃洛夫语
wo
wol
西弗里斯兰语
fy
fry
科萨语
xh
xho
意第续语
yi
yid
约鲁巴语
yo
yor
藏语
za
zha
祖鲁语
zu
zul
78
Appendix B. 编辑器中的键盘快捷键
此简短的文本描述了编辑窗格中的按键行为。在这里“移动到片段内”是指,如果光标原来在此片段前面则
移动到片段的开始处,如果在片段后面则移动到片段的末尾。
Table B.1. 编辑器中的按键行为
组合键
动作
Left:
移到一个字符左边,但不超过片段的开始处
Right:
移到一个字符右边,但不超过片段的末尾
Ctrl+Left:
移到一个单词左边,但不超过片段的开始处
Ctrl+Right:
移到一个单词右边,但不超过片段的末尾
PgUp:
在文档中向上翻页
PgDn:
在文档中向下翻页
Home*
移到当前片段中当前行的开始处
End*
移到当前片段中当前行的末尾
Ctrl+Home
移到当前片段的开始处
Ctrl+End
移到当前片段的末尾
Ctrl+PgUp
移到当前文档的开始处 (Mac: Cmd+PgUp)
Ctrl+PgDn
移到当前文档的末尾 (Mac: Cmd+PgDn)
Backspace*
移除光标前字符
Delete*
移除光标后字符
Ctrl+Backspace
移除从当前位置到当前单词开始处的字符 (Mac: Alt
+Backspace)
Ctrl+Delete
移除从当前位置到下一个单词开始处的字符 (Mac:
Alt+Delete)
Ctrl+Enter
打开前一个片段(Mac:Cmd+Enter)
Ctrl+A
全选当前片段 (Mac: Cmd+A)
Ctrl+Shift+O
RTL-LTR 开关
* 当光标在可编辑片段外面时这些按键的行为会不相同:
• Home: 将光标移到活动片段的开始处
• End: 将光标移到活动片段的末尾
• Backspace: 不起作用
• Delete: 不起作用
• 任意字符键 在可编辑片段外面被按下时都会被忽略。
“Shift”键不会表现出特殊的行为:在按下 "Shift" 时使用上面快捷键也会以相同的方式移动,唯一的例外
是Shift+Enter组合键会在文本中插入新行符。
系统范围的命令全选(Ctrl+A)、粘贴(Ctrl+V)、剪切(Ctrl+X)、复制(Ctrl+C)、插入匹配(Ctrl
+I)和插入源(Ctrl+Shift+I)原则上只作用于当前打开的片段。
请注意,您可以按自己的偏好重新分配快捷键。请参阅附录自定义快捷键
79
Appendix C. OmegaT团队项目
1. 版本控制——介绍
OmegaT中的协作翻译基于版本控制功能,该功能广泛应用于软件社区的程序代码维护和开发团队内部的
无阻碍协作。OmegaT支持两种流行的版本控制系统(简写为VCS):Apache
Subversion
[http://
subversion.apache.org](在命令名称svn后常被简称为SVN)和Git [http://git-scm.com/]。版本控制系统给
团队成员带来的好处可概括如下:
• 多个团队成员可同时工作在一个翻译项目而不会彼此冲突
• 他们可以共用材料,如项目的翻译记忆和词汇表
• 缺省情况下,每三分钟就会把更新的版本分享给团队其他成员
• 由系统维护共享数据的版本
• 可以发现并解决冲突(例如相同片段或术语的可选译文)
这里对后面的文本中使用的术语作个简短的说明:
• VCS服务器:即SVN或Git服务器是网上保存和维护公用材料的地方。服务器可以在本地网络,但大部
分情况下它在因特网上,即通过网址访问。项目的其中一个成员——项目管理员,需要熟悉服务器端事
务,即设置工作环境、导入OmegaT项目、设置团队成员的访问权限、解决冲突等。
• VCS客户端:要和服务器连接,SVN或Git客户端必须安装在包含OmegaT项目的“项目管理员”的电脑
上。Windows系统中最常用的客户端分别为TortoiseSVN [http://tortoisesvn.net/]和TortoiseGit [http://
code.google.com/p/tortoisegit/]。其他操作系统(Linux、OS X)提供了类似的软件。
• 版本库:保存和维护共享材料的位置,在本地网或因特网上。项目成员需要VCS客户端与其连接。
• 检出:该操作从版本库创建工作副本到本地电脑。服务器维护了检出的信息,所以以后的提交(参阅下
面)可以平滑地进行。
• 提交:当检出材料的新的本地版本准备好后,就可以提交到版本库而共享给团队其他成员。服务器会确
保在两个成员工作于相同的检出内容时引起的冲突得到解决。
• 管理员:创建和维护版本库(如处理服务端事务)的人。要避免问题,最初的设置中每个人只应该具有
基本的这些权利。
• 用户:团队成员,协作于共同的项目。
2. 使用SVN共享项目
有两种运行SVN服务器的方式:可以把SVN安装在自己的服务器或使用托管服务。使用外部服务时您必须
注意到可能的机密泄漏,因为您是在不受自己直接控制的服务器上加载文档的。或者,为了避免此问题您
可以建立私有的SVN服务器,例如如果您已经有了包含正在讨论的软件(如VisualSVN)的Apache服务
器。
有了SVN服务器,那么项目管理员需要在本地安装SVN客户端用来管理电脑上的项目内容。对于Windows
我们推荐TortoiseSVN [http://tortoisesvn.net/]。对于Mac您可以从如SourceForge [https://sourceforge.net/
projects/macsvn/]站点下载客户端,对于Linux请参阅Subversion命令和脚本
[www.yolinux.com/
TUTORIALS/Subversion.html]。
2.1. 创建版本库
这里所说的过程依赖于由ProjectLocker [http://projectlocker.com/]提供的免费的SVN服务器(限制2个用
户)。请注意版本库的创建者默认具有他所创建的版本库的管理权限。首先登录到该站点,如果您是第一
次到这个站点,请先注册并保存用户名和密码以用于之后的项目。
80
OmegaT团队项目
1. 在ProjectLocker上创建新项目
2. 输入版本库的名称和说明。(这里举的例子为OmegaT和OmegaT SL本地化)
3. 选择 SVN。
4. 点击Create Project
在您的账户中打开Projects视图。项目服务下的网址将被SVN用来从客户端连接到您刚建立的SVN服务
器。这里还可以添加团队成员到项目中并为他们分配权限。需要注意的是团队成员必须先注册,您才能把
他们添加到项目中(注意:在ProjectLocker的免费版本中每个项目只允许添加两个成员)。
您可以根据自己的开发风格和需求管理项目。与OmegaT项目类似,对于不同的语言对您需要使用各自的
版本库。在指定的语言对中最好像单独的版本库一样保存不同的主题及客户。替代方案是在一个版本库中
包含Project1、Project2等子文件夹,并通过公共的tm、glossary和dictionary文件夹共用相同的材料。
为了简便,这里的例子中我们决定为OmegaT项目使用单个版本库。
2.2. 导入项目到SVN版本库——Windows
此时版本库是空的。您先在磁盘上创建空的客户端文件夹。在保存项目的位置创建空文件夹并在上面点击
右键。选择 TortoiseSVN>检出后显示下面的对话框:
把ProjectLocker提供的网址输入到版本库网址字段。确保检出目录无误,即指定您创建的空文件夹并按
下OK。操作完成后,您可以检查刚才所说的目录:现在它应该包含.svn子文件夹且图标上含有绿色的就
绪标记,这表示该文件夹的内容是最新的。
下一步中,要添加OmegaT文件到本地文件夹。下面的文件用于在团队成员中共享,因此在任何情况下都
必须包含它们:
• omegat项目文件——omegat.project
• 翻译记忆——omegat\project_save.tmx
• 源文件夹的内容
• 项目专用的过滤器定义文件——omegat\filters.xml
管理员还可以决定包含后面这些文件夹及其内容:tm、glossary和dictionary。还有omegat文件夹中
的ignored_words.txt和learned_words.txt也许值得在团队中共享和维护。在任何情况下都必须排
81
OmegaT团队项目
除omegat子文件夹中的bak文件、project_stats.txt及project_stats_match.txt,因为它们除了让版本库变得
臃肿外得不到丝毫好处。您可以把相同的设置用于target文件夹及其内容。
在复制必须的文件到检出文件夹后您会发现它的图标改变了:绿色的就绪标记变成红色的感叹号,这表示
版本库的本地副本发生了变化。通过下面的两个步骤可以把最新的版本传到服务器:
• 添加已复制的文件到版本库的本地版本:右键点击检出文件夹并选择TortoiseSVN>添加。在出现的对
话框中,让所有设置保持默认并点击 OK。添加结束!窗口,类似于下面会出现的一个:
检出文件夹的内容会进行相应的标记:
• 提交本地更新到服务器:在本地检出文件夹上点击右键并选择SVN提交…。提交窗口——请参阅下面。
选中发生的变更——在这里即是刚添加的文件夹和文件。
82
OmegaT团队项目
输入相应的信息到信息框并按下OK。将打开提交窗口并显示提交进度。它会首先提交当前内容到服务
器版本库,接着更新版本库的本地副本(即.svn子文件夹的内容),这样它就是版本库的最新版本了。
• 从本地版本库副本更新本地文件——从服务器版本库的.svn子文件夹接收到的变更但还不是文件和文件
夹本身的更新。要更新本地文件,右键点击检出文件夹并选择SVN更新。检查文件夹的内容以确认与服
务器中的最新版本相对应的版本库和相应文件及文件夹的本地副本:
3. 在OmegaT中使用团队项目
建立团队项目后,团队成员只需OmegaT就能访问团队项目。首先,他们需要打开项目>下载团队项目。
这个操作实际上会检出项目到本地文件夹。访问凭据会保存下来,这样就无需每次都要输入它们。在
Linux中,如果OmegaT仍要求凭据,则您可以选中强制保存密码为纯文本复选框。
以后使用时,所有需要做的只是像其他OmegaT项目那样打开项目。OmegaT会识别出团队项目,并在缺
省的情况下每隔三分钟自动同步所有内容。
83
Appendix D. 解析器插件
1. 介绍
分解器(或 stemmer,词干分析器)提高了识别源和翻译记忆数据中的词形变化的匹配质量。同时也提高
了词汇表的匹配度。
英语中的词干分析器,例如能识别字符串 "cats"(以及 "catlike", "catty" 等)的词根是 "cat",而 "stemmer",
"stemming", "stemmed" 的词根是 "stem"。词干分析算法能还原单词 "fishing"、"fished"、"fish" 以及
"fisher" 为相应的词根 "fish"。这对通过词根加上前缀和后缀形式组成单词的语言特别有用。看看斯洛文尼
亚语的一个例子,这些是 "good" 的所有正确的语法形式:
• lep, lepa, lepo - singular, masculine, feminine, neutral
• lepši, lepša, lepše . - comparative, nominative, masculine, feminine, neutral, resp. Plural form of the
adjective
• najlepših - superlative, plural, genitive for M,F,N
2. 安装和使用
OmegaT中已包含了解析器。OmegaT会根据项目语言设置中的源语言和目标语言自动选择相应的解析
器。还可以在项目属性窗口中选择另一个解析器或当前解析器的不同版本。
不兼容性
如果在/plugin文件夹找到解析器则OmegaT将不会运行。在启动OmegaT前请删除/plugin文件夹
中的所有解析器。
84
Appendix E. LanguageTool插件
1. 介绍
LanguageTool [http://www.languagetool.org]是开源风格的文法较对软件,可用于英语、法语、德语、波
兰语、荷兰语、罗马尼亚语及其他语言(请参阅支持语言列表 [http://www.languagetool.org/languages/
])。
您可以把LanguageTool视为可检测出简单的拼写检查器无法发现的错误的软件,例如混用了there/
their、no/now等。它还可以检测一些语法错误。它不包括拼写检查。LanguageTool能发现对应于针对特
定语言的配置文件中已定义规则的错误。
Figure E.1. OmegaT中的LanguageTool
2. 安装和使用
LanguageTool插件包含在OmegaT中。如果选择了选项>语言检查器,则OmegaT会自动使用这个工具。
适用的规则(如果有的话)取决于项目的源语言和目标语言。触发规则后,编辑器中相应的短语会加上蓝
色下划线(请参阅上面图片中的also 和I didn't do nothing)。在加了下划线的短语上悬停鼠标时,会出现
相应的说明。
不兼容性
如果在/plugin文件夹中找到旧版本的LanguageTool,则它无法正常工作。请在启动OmegaT前删
除/plugin文件夹中的LanguageTool。
85
Appendix F. 脚本化插件
1. 介绍
OmegaT-脚本化支持在OmegaT中运行一些脚本语言编写的脚本。
2. 安装和使用
OmegaT的脚本化插件可以从OmegaT插件下载站 [http://sourceforge.net/projects/omegat-plugins/files]下
载。然后解压文件并把它们放到OmegaT安装目录(即包含OmegaT.jar的目录)的“plugins”文件夹中。若
不存在,则首先创建“plugins”文件夹。
这样会增加工具> 脚本子菜单。在脚本子菜单下,有12个放脚本的位置。点击脚本会打开脚本对话框:
您可在脚本对话框中加载已有的脚本到文本区并对当前打开的项目运行该脚本。要定制脚本功能,请执行
以下操作:
• 点击左面板列表中的脚本名称加载脚本到编辑器中。
86
脚本化插件
• 右键点击底面板中的“<1>”到“<12>”按钮并选择“添加”。在上面的例子中,已添加了两个脚本(位置1和
2)。
• 当您左键点击数字时,将运行选择的脚本。您还可以点击工具菜单下的脚本条目或按 Ctrl+Alt+F#(#表
示1到12)组合键运行选择的宏。
目前已支持下列脚本语言:
• NetRexx(http://www.netrexx.org/):它支持经典的REXX语法、无保留关键字,还包含了兼容Java对
象模型的面向对象编程风格的重要附加支持。所有现有的Java类库可以无需修改和特殊设置而直接使
用;在一些情况下Java程序员可以选择在运行时包中使用Rexx类以获得在Java语法的源程序中增强的
字符串处理功能。
• XSLT(扩展样式表语言转换):是用于转换XML文档的基于XML的描述性语言。原始的文档没有改
变,不过基于原有文档的内容创建了新文档。新文档可能是由处理程序以标准的XML语法或其他格式串
行化的,例如HTML或纯文本。XSLT最常用于在不同的XML模式转换数据或把XML数据转换为网页或
PDF文档。
• Groovy(http://groovy.codehaus.org):是用于Java虚拟机的动态语言。它构建于增强的Java之上,
含有从Python、Ruby和Smalltalk等语言获得灵感而实现的附加强大功能。
• JavaScript(不会与Java混淆时简写为JS):是动态、弱类型且具有一类函数的基于原型的脚本语言。
它是多范型语言,支持面向对象、命令和函数式编程风格。它工作于像Firefox这样流行软件的后台,是
开源领域中常见和首选的编程工具。
所有的语言都能访问OmegaT对象模型,其中的顶级对象为项目。例如下面的groovy代码片段扫描当前项
目所有文件中的所有片段,且当某个片段的翻译存在时打印出它的源和目标译文:
files = project.projectFiles;
for (i in 0 ..< files.size())
{
for (j in 0 ..< files[i].entries.size())
{
currSegment = files[i].entries[j];
if (project.getTranslationInfo(currSegment))
{
source = currSegment.getSrcText();
target = project.getTranslationInfo(currSegment).translation;
console.println(source + " >>>> " + target);
}
}
}
87
Appendix G. 网上的 OmegaT
1. OmegaT 站点和 OmegaT SourceForge 项目
OmegaT 网站 [http://www.omegat.org/]包含了众多 OmegaT 的资源链接。用户支持以OmegaT 雅虎
用户组 [http://tech.groups.yahoo.com/group/omegat/]的志愿者为基础来提供。在寻找问题的答案时 FAQ
[http://tech.groups.yahoo.com/group/OmegaT/database?method=reportRows&tbl=1] 是个不错的起点。
对于最新版本的 OmegaT,请参考 www.omegat.org 上的下载页。您还可以提交 bug 报告 [https://
sourceforge.net/p/omegat/bugs/]和改进要求。 [https://sourceforge.net/p/omegat/feature-requests/]
2. BUG 报告
请记住每份良好的 BUG 报告至少包括三方面内容:
• 重现 BUG 的步骤
• 您期望看到的情况
• 您实际看到的情况
更多内容请参阅 Joel Spolsky
fog0000000029.html]文章。
的那篇
无痛
Bug
跟踪
[http://www.joelonsoftware.com/articles/
您应该将文件的副本、部分日志、屏幕截图以及其他任何可以帮助开发人员找到并处理您所遇到的Bug的
内容添加到报告中。需要注意的是:BUG 报告和改进要求是公开可见的,因此请不要将敏感文件加入其
中。如果您想知道您的报告后续处理情况,您需要注册成为 SourceForge 用户,登录并提交一份 BUG 报
告,或者只需点击报告顶部的监控器。
3. 为 OmegaT 项目做贡献
为 OmegaT 做贡献:
首先请加入用户组
[http://tech.groups.yahoo.com/group/OmegaT/](通过网站或给
[email protected] [mailto:[email protected]] 发一封电子邮件)。想
参加 OmegaT 开发的话,您可以通过网站或者向 [email protected]
[mailto:[email protected]?subject=subscribe]
发送一份标题为
"subscribe" 的邮件加入开发人员组。
如果想翻译 OmegaT 的用户界面、用户手册或其他相关文档:
首先请阅读本地化和配置
OmegaT
[http://www.omegat.org/en/howtos/localizing_omegat.php]指
南,并通过网站或给
[email protected]
[mailto:[email protected]?subject=subscribe] 发一封标题为“subscribe”的电子邮件加入 OmegaT 翻
译者讨论组。
要为 OmegaT 项目提供资金支持
如果您想支持OmegaT的后续开发,我们很感激这种行为,请点击此链接前往OmegaT
PayPal账户
[https://www.paypal.com/cgi-bin/webscr?cmd=_s-xclick&hosted_button_id=9UB6Y2BBF99LL]。
88
Appendix H. 自定义快捷键
1. 自定义快捷键
在主菜单中的大部分菜单项可设置新的快捷键。通过 OmegaT 首选项文件夹(请参阅用户文件位置)中
的快捷键定义文件,您可改变已分配的快捷键或添加新的快捷键。
快捷键定义文件名称必须为 MainMenuShortcuts.properties,同时每行最多包含一个快捷键的定义。可接
受空行,而注释行应以 "//" 开头。在 "//" 后的所有内容将被忽略。
修改 MainMenuShortcuts.properties 文件后,必须重新运行 OmegaT 才能让新的快捷键生效。
快捷键定义的语法如下:<menu
item
1
而<shortcut>是用户指定的按键组合 .
code>=<shortcut>,其中<menu
item
code>取自下表,
<shortcut>必须为下面的形式:0或多个<modifier>后跟着0或1个<event>后跟着1个<key>,其中:
2
• <modifier> 可以为:shift, control, ctrl, meta , alt, altGraph
• <event> 可以为:typed, pressed, released
3
• 而 <key> 可以为您键盘上有效的任何键。 .
4
例如,缺省的OmegaT快捷键 ,其中可以看到:
• projectOpenMenuItem=ctrl O
• editCreateGlossaryEntryMenuItem=ctrl shift G
第一个是打开项目的快捷键,第二个为创建词汇表条目。
如果想用Shift+Ctrl+O来打开项目,请把MainMenuShortcuts.properties修改成这样:
projectOpenMenuItem=shift ctrl O.
如果您用Mac且想设置Shift+Command+S为工具
在MainMenuShortcuts.properties中添加此行:
→
统计的快捷方式,请
toolsShowStatisticsStandardMenuItem=shift meta S
然后保存文件并重新启动OmegaT。现在新的快捷键应该出现在刚修改的菜单项旁边。不会和系统快捷键
冲突的话,它们在OmegaT中应该有效了。
2. 项目菜单
Table H.1. 项目菜单
菜单项
缺省快捷键
菜单项代码
新建
projectNewMenuItem
打开
Ctrl+O
projectOpenMenuItem
1
按键(快捷键)的全部语法的定义在来自 Oracle Java 1.6 文档(页面底部):Java 1.6 快捷键 [http://docs.oracle.com/javase/6/docs/api/javax/
swing/KeyStroke.html]
2
在 Mac 系统中,必须使用 meta 修饰符来指定 command 键。
3
可用的按键事件在来自 Oracle 的 Java 1.6 文档中列出:Java 1.6 按键事件说明 [http://docs.oracle.com/javase/6/docs/api/java/awt/event/
KeyEvent.html]
4
缺省的 OmegaT 快捷键设置可从 Sourceforge 获取:缺省的 OmegaT 快捷键 [http://omegat.svn.sourceforge.net/viewvc/omegat/branches/
release-2-6/src/org/omegat/gui/main/MainMenuShortcuts.properties]
在Mac系统中缺省的OmegaT快捷键同样可从Sourceforge获取,其中把所有的“ctrl”都被替换为“meta”:Mac 系统上缺省的OmegaT快捷键 [http://
omegat.svn.sourceforge.net/viewvc/omegat/branches/release-2-6/src/org/omegat/gui/main/MainMenuShortcuts.mac.properties]
89
自定义快捷键
菜单项
缺省快捷键
菜单项代码
下载团队项目
projectTeamNewMenuItem
导入源文件
projectImportMenuItem
从MediaWiki导入……
projectWikiImportMenuItem
重新载入
F5
projectReloadMenuItem
关闭
Ctrl+Shift+W
projectCloseMenuItem
保存
Ctrl+S
projectSaveMenuItem
创建已译文档
Ctrl+D
projectCompileMenuItem
属性……
Ctrl+E
projectEditMenuItem
项目文件……
Ctrl+L
viewFileListMenuItem
退出
Ctrl+Q
projectExitMenuItem
菜单项
缺省快捷键
菜单项代码
取消前一操作
Ctrl+Z
editUndoMenuItem
重做前一操作
Ctrl+Y
editRedoMenuItem
用匹配替换
Ctrl+R
editOverwriteTranslationMenuItem
插入匹配
Ctrl+I
editInsertTranslationMenuItem
用机器翻译替换
Ctrl+M
editOverwriteMachineTranslationMenuItem
用源文本替换
Shift+Ctrl+R
editOverwriteSourceMenuItem
插入源文本
Shift+Ctrl+I
editInsertSourceMenuItem
插入源标签
Shift+Ctrl+T
editTagPainterMenuItem
导出选中部分
Shift+Ctrl+C
editExportSelectionMenuItem
创建词汇表条目
Shift+Ctrl+G
editCreateGlossaryEntryMenuItem
在项目中搜索……
Ctrl+F
editFindInProjectMenuItem
选择第一匹配
Ctrl+1
editSelectFuzzy1MenuItem
选择第二匹配
Ctrl+2
editSelectFuzzy2MenuItem
选择第三匹配
Ctrl+3
editSelectFuzzy3MenuItem
选择第四匹配
Ctrl+4
editSelectFuzzy4MenuItem
选择第五匹配
Ctrl+5
editSelectFuzzy5MenuItem
转换大小写为/小写
lowerCaseMenuItem
转换大小写为/大写
upperCaseMenuItem
转换大小写为/首字母大写
titleCaseMenuItem
循环转换大小写……
Shift+F3
cycleSwitchCaseMenuItem
用作缺省译文
editMultipleDefault
创建可选译文
editMultipleAlternate
菜单项
缺省快捷键
菜单项代码
后一未译片段
Ctrl+U
gotoNextUntranslatedMenuItem
3. 编辑菜单
Table H.2. 编辑菜单
4. 前往菜单
Table H.3. 前往菜单
90
自定义快捷键
菜单项
缺省快捷键
菜单项代码
后一片段
Ctrl+N或Enter或Tab
gotoNextSegmentMenuItem
前一片段
Ctrl+P或Ctrl+Enter或Ctrl+Tab
gotoPreviousSegmentMenuItem
片段序号……
Ctrl+J
gotoSegmentMenuItem
后一笔记
gotoNextNoteMenuItem
前一笔记
gotoPreviousNoteMenuItem
在历史中前进……
Ctrl+Shift+N
gotoHistoryForwardMenuItem
在历史中回退……
Ctrl+Shift+P
gotoHistoryBackMenuItem
菜单项
缺省快捷键
菜单项代码
标记已译片段
viewMarkTranslatedSegmentsCheckBoxM
标记未译片段
viewMarkUntranslatedSegmentsCheckBox
显示源片段
viewDisplaySegmentSourceCheckBoxMen
标记非独特片段
viewMarkNonUniqueSegmentsCheckBoxM
标记含笔记片段
viewMarkNotedSegmentsCheckBoxMenuI
标记非中断空白
viewMarkNBSPCheckBoxMenuItem
标记空白字符
viewMarkWhitespaceCheckBoxMenuItem
标记双向控制字符
viewMarkBidiCheckBoxMenuItem
修改信息/不显示
viewDisplayModificationInfoNoneRadioBut
修改信息/显示选中部分
viewDisplayModificationInfoSelectedRadio
修改信息/显示所有
viewDisplayModificationInfoAllRadioButton
菜单项
缺省快捷键
菜单项代码
检验标签
Ctrl +T
toolsValidateTagsMenuItem
统计(&S)
toolsShowStatisticsStandardMenuItem
匹配统计(&M)
toolsShowStatisticsMatchesMenuItem
菜单项
缺省快捷键
菜单项代码
使用 Tab 前进
optionsTabAdvanceCheckBoxMenuItem
退出前总是确认
optionsAlwaysConfirmQuitCheckBoxMenu
机器翻译
翻译提示/启用翻译提示
optionsTransTipsEnableMenuItem
翻译提示/精确匹配
optionsTransTipsExactMatchMenuItem
字体……
optionsFontSelectionMenuItem
5. 查看菜单
Table H.4. 查看菜单
6. 工具菜单
Table H.5. 工具菜单
7. 选项菜单
Table H.6. 选项菜单
91
自定义快捷键
菜单项
缺省快捷键
菜单项代码
文件过滤器……
optionsSetupFileFiltersMenuItem
分割规则……
optionsSentsegMenuItem
拼写检查……
optionsSpellCheckMenuItem
编辑行为……
optionsWorkflowMenuItem
标签验证……
optionsTagValidationMenuItem
团队……
optionsTeamMenuItem
外部 TMX ……
optionsExtTMXMenuItem
查看……
optionsViewOptionsMenuItem
保存和输出……
optionsSaveOptionsMenuItem
登录代理……
optionsViewOptionsMenuLoginItem
恢复主窗口
optionsRestoreGUIMenuItem
菜单项
缺省快捷键
菜单项代码
用户手册……
F1
helpContentsMenuItem
关于……
helpAboutMenuItem
8. 帮助菜单
Table H.7. 帮助菜单
92
Appendix I. 法律声明
1. 关于本文档
版权所有
本文档与包含用户手册及readme.txt文档的 OmegaT同时发布。本文档版权归©2013 Vito Smolej所有。五
分钟内学会OmegaT!章的作者是Samuel Murray,版权所有©2005-2012。
发布和修改
本文档是自由文档,在遵守自由软件基金会(FSF)发布的的 GNU 通用公共许可证的版本3或者更高版本
的前提下,您可以对它进行修改或者重新发布。
保证
该文档的目的是希望它有用,但没有任何担保,甚至没有适销性或针对特定用途的隐含的担保。请参阅
GNU 通用公共许可证了解更多信息。
2. 关于应用程序
版权所有
OmegaT is Copyright © 2000-2013 Keith Godfrey, Zoltan Bartko, Volker Berlin, Didier Briel, Kim Bruning,
Alex Buloichik, Thomas Cordonnier, Sandra Jean Chua, Martin Fleurke, Wildrich Fourie, Phillip Hall, JeanChristophe Helary, Thomas Huriaux, Hans-Peter Jacobs, Kyle Katarn, Piotr Kulik, Ibai Lakunza Velasco,
Guido Leenders, Aaron Madlon-Kay, Fabián Mandelbaum, John Moran, Maxym Mykhalchuk, Arno Peters,
Henry Pijffers, Briac Pilpré, Tiago Saboga, Andrzej Sawuła, Benjamin Siband, Yu Tang, Rashid Umarov,
Antonio Vilei, Martin Wunderlich and Michael Zakharov.
发布和修改
OmegaT 是自由软件,在遵守自由软件基金会(FSF)发布的 GNU 通用公共许可证的版本3或者更高版本
的前提下,您可以对它进行修改或者重新发布。
保证
OmegaT 发布的目的是希望它有用,但没有任何担保,甚至没有适销性或针对特定用途的隐含的担保。请
参阅 GNU 通用公共许可证了解更多信息。
93
Appendix J. 致谢
1. 感谢各位!
不论您可能在当前版本中发现不一致、遗漏或简单的错误,我宣布我们自己的。然而,这个手册如果没有
许多人的帮助和支持是不可能的。明确感谢下列各位:
• Marc Prior:由于热爱 OmegaT 和英语而改正我最初的草稿。
• Didier Briel:如果没有 Didier 耐心和持久的帮助,我处理不了 DocBook 复杂情况。还必须提及他的细
心和努力保持了代码库的完整和良好顺序。
• Samuel Murray:写了“五分钟内学会OmegaT”入门篇章。
• Will Helton:他查看草稿后的决定省去了我一堆麻烦。如果没有他无价的帮助,许多重要的基础工作仍
然是缺失的,可能有人对此感觉很惊讶。
• Jean-Christophe Helary:特别感谢 JC 对 OmegaT 运行和命令行参数及我注意到的所有其他细节的简
洁说明。
• 最后但同样重要的:感谢所有找出OmegaT 前一版本文档不一致性的OmegaT
sourceforge.net/p/omegat/documentation/]贡献者。继续好好努力!
94
文档跟踪器
[https://
Index
无格式, 40
(see also 源文件)
格式化, 40
(see also 源文件)
文件过滤器
全局与项目文件过滤器, 31
对话框, 32, 34
文件类型和文件名模式, 34
源、目标——编码, 34
编辑, 34
选项, 32
项目专用文件过滤器, 32
机器翻译, 67
Apertium, 68
Belazar, 68
介绍, 67
故障排除, 68
谷歌翻译, 67
杂项, 71
OmegaT 控制台模式, 71
字体设置, 72
用于Java属性的自动对齐器, 72
防止数据丢失, 72
标签, 46
复制, 46
成对的和单个的, 46
提示, 48
插入源标签, 23
操作, 46
组删除, 46
组嵌套, 47
组检验, 48
组重叠, 47
编号, 46
标签验证, 19
(see also 快捷键,标签)
窗口 - 配置, 19
(see also 标签)
标记
命名, 46
正则表达式, 59
(see also 分割规则)
(see also 搜索)
使用实例, 61
工具, 61
法律声明, 93
关于本文档, 93, 93
注解
注解面板, 18
源文件
PO双语文件, 40
其他文件格式, 41
文件格式, 40
文件类型和文件名模式, 34
格式化文本, 46
格式化文本文件, 40
混合 RTL 和 LTR 字符串, 42
添加文件到项目, 19
纯文本文件, 40, 45
编码, 34, 45
Symbols
分割规则
全局与项目规则, 31
匹配
匹配窗口设置——图示, 16
匹配窗格 - 图示, 16
匹配统计, 25
匹配统计, 20
(see also 工具菜单)
升级OmegaT
Windows, 5
团队项目
Subversion, 80
创建SVN版本库, 80
安装 OmegaT
Linux, 5
OS X, 6
Windows, 5
其他系统, 7, 8
定制OmegaT
Linux, 6
OS X
启动参数, 7
帮助菜单
帮助浏览器, 21
用户手册……, 21
快捷键
F1——帮助, 13, 21
复制文本——Ctrl+C, 19, 20
大小写选择——Shift+F3, 23
插入——Ctrl+I, 16
搜索——Ctrl+F, 56
替换文本——Ctrl+R, 16
机器翻译——Ctrl+M, 67
标签验证——Ctrl+T, 13, 48
粘贴文本——Ctrl+V, 19, 20
自定义, 89
选择匹配——Ctrl+N, 16
选择所有——Ctrl+A, 19, 20
项目属性——Ctrl+E, 13, 63
项目文件列表——Ctrl+L, 18
拼写检查, 69
拼写检查器
拼写检查器设置, 69
提示, 70
插件
LanguageTool, 85
脚本化, 86
解析器, 84
搜索, 56
使用通配符, 57
方式和选项, 57
高级选项, 57
搜索窗口
示例, 56
文件格式
95
Index
翻译更新过的源文件, 16
自右向左语言, 41
片段分割
创建新规则, 54
(see also 正则表达式)
源层分割, 54
示例, 55
规则, 54
中断规则, 54
例外规则, 54
规则优先级, 54
语句级分割, 54
片段标记, 15
用户界面
OmegaT主窗口, 13
其他窗口, 13
匹配窗口设置, 17
设置对话框, 13
(see also 项目设置)
目标文件
其他文件格式, 41
文件名, 34
文件格式, 40
文件转换工具, 41
格式化文本, 46
格式化文本文件, 40
(see also 标记文本)
混合 RTL 和 LTR 字符串, 42
纯文本文件, 40
编码, 34
自右向左语言, 41
统计, 19
(see also 菜单工具)
编码
Unicode, 45
中欧和东欧, 45
纯文本文件, 45
西方, 45
网上的 OmegaT , 88
SourceForge 项目, 88
为 OmegaT 做贡献, 88
反馈 bug, 88
开发,本地化, 88
资金支持, 88
网上的OmegaT
向OmegaT捐赠, 88
翻译记忆, 49
omegat 子目录, 49
(see also 项目文件)
PO和OKAPI TTX文件, 52
(see also 翻译记忆tm/auto子文件夹)
tm 子目录, 49
(see also 项目文件)
tm/auto 子目录, 49
(see also 项目文件)
tm/penalty-xxx子文件夹, 49
(see also 项目文件)
伪翻译, 52
分享, 52
(see also 项目,下载团队项目……)
匹配, 16
可选语言对, 52
备份, 50
多语种处理, 50
孤立片段, 16, 50
导入和导出, 51
打包, 49
更新句子分割规则, 53
语种, 50
重用翻译记忆, 51
项目主文件夹, 49
自右向左语言, 41
创建 RTL 目标文件, 42
创建 RTL 目标文本, 42
混合 RTL 和 LTR 字符串, 42
目标文件, 42
自右向左语言中的 OmegaT 标签, 42
自定义快捷键
查看菜单, 91
菜单, 22
前往, 24
工具, 25
帮助, 26
查看, 24
编辑, 22
选项, 25
编辑行为……, 43
项目, 22
菜单工具
匹配统计, 13
统计, 13
菜单选项
字体……, 72
拼写检查, 69
编辑行为
Empty translation, 43
允许译文和原文相同, 44
含可选译文的片段, 44
导出当前片段, 44
插入模糊匹配, 43
转换数字, 43
词典, 63
Britannica, 63
Merriam Webster, 63
(see also 词典)
StarDict, 63
Webster, 63
下载和安装, 63
朗曼, 63
相关问题, 63
词汇表, 17, 64
TBX 格式, 65
Trados MultiTerm, 66
创建词汇表, 65
可写词汇表的位置, 31, 65
微软术语集, 65
文件格式, 65
词汇表相关问题, 66
词汇表窗格
多单词条目, 64
96
Index
词汇表,词汇表窗格, 64
语言, 74
运行 OmegaT
Linux, 6
OS X, 7
Windows
INI 文件, 5
从源代码编译 OmegaT, 12
使用 Java Web Start, 8
其他系统, 8
启动脚本参数, 9
内存分配, 9
字体抗锯齿, 9
谷歌翻译 V2, 10
命令行启动, 8
命令行模式, 10
运行OmegaT
Windows, 5
启动脚本参数
Microsoft Translator, 10
no-team option, 10
代理主机IP地址, 10
代理主机端口, 10
用户国家, 9
用户界面语言, 9
选项菜单
分割规则, 13
文件过滤器, 13
编辑行为, 13
键盘快捷键, 26
其他, 28
前往, 27, 27
编辑, 27
项目, 26
项目
匹配统计, 25
启用语句级分割, 31
属性, 29, 54, 74
(see also 语言)
改变文件夹结构, 31
新创建/打开, 3
移除标签选项, 31
统计, 25
自动传播翻译选项, 31
选项, 54
项目管理快捷键, 26
预翻译, 49
项目文件
ignored_words和learned_words, 37
子目录omegat, 37
应用程序文件, 38
文件 omegat.project, 37
源子文件夹, 37
用户文件, 65
(see also 词汇表)
用户设置文件, 37
目标子目录, 37
统计文件, 37
翻译项目文件, 36
词汇表子目录, 64
项目菜单
属性, 13
新建……, 3
项目设置
字体, 13
文件过滤器, 13
片段分割, 13
编辑行为, 13
I
ISO语言代码, 74
L
Lucene (see 解析器)
O
OmegaT
团队项目, 80
(see also 团队项目)
OmegaT 控制台模式, 71
(see also 杂项)
OmegaT 窗口, 15
(see also OmegaT 窗口和窗格)
恢复原始设置, 15
OmegaT 窗口和窗格
主窗口, 14
匹配面板 - 图示, 16
搜索面板, 19
方框, 15
标签验证, 19
(see also 标签)
窗格 widget, 14
编辑器窗格, 15
词典窗格, 17
词汇表窗格, 17, 64
项目文件, 18
OmegaT窗口和窗格
匹配窗格设置——图示, 16
多选译文窗格, 18
机器翻译窗格, 18
模糊匹配窗格, 16
定制, 16
S
Stemmer (see 解析器)
T
TMX (see 翻译记忆)
97
">
/
Atsisiųsti
Tiesiog draugiškas priminimas. Dokumentą galite peržiūrėti tiesiog čia. Bet svarbiausia, kad mūsų AI jau jį perskaitė. Jis gali paaiškinti sudėtingus dalykus paprastais terminais, atsakyti į jūsų klausimus bet kuria kalba ir padėti greitai naršyti net ilgiausius ar sudėtingiausius dokumentus.
Reklama