语料库建设过程包括规划阶段、需求分析阶段、数据库框架设计、语料收集、语料导入、双语句子对齐、双语句子分词、语料校对。
1、在对文件编辑前,我们需要在Trados中创建对齐文件,在Trados中创建对齐文件将鼠标放在源文件各行,即可选中加亮目标文件中与之对齐的翻译行。
2、emmmmmm你说的是在trados怎么对齐双语文档吗?百度搜WinAlign,界面大概如图:这是比较老的版本了,新版的线还是有的。个人觉得线多了有些难受。前前后后换了几个对齐工具了,abby和tmxmall aligner。
3、我是用Tmxmall在线对齐网页链接来做的,直接在百度里搜这几个关键字就行。先把你手里的双语文档导入到在线对齐工具里。
4、Edit Segment项是用来在进行Align时修改译文用的。如果对Align的结果比较满意,别忘了用Commit进行确认。如果没有进行确认,在用Trados进行翻译时,在Trados Workbench的有关栏中会出现乱码或者出现中文竖排。
5、ABBYY Aligner,对齐界面是这样的 从界面可以看出ABBYY aligner只支持双文档的对齐,但是与SDL Trados WinAlign相比,对齐的效率可谓大幅提升了,因为它可以先进行段落的对齐再进行句对齐。
1、我是用Tmxmall在线对齐网页链接来做的,直接在百度里搜这几个关键字就行。先把你手里的双语文档导入到在线对齐工具里。
2、首先打开Trados并点击翻译记忆库按钮(1)进入翻译记忆库主界面。进入文件》新建》翻译记忆库菜单(1)。为新建的翻译记忆库设置存放位置(1)和名称(2),然后点击下一步。
3、方法/步骤 首先打开MultiTerm软件。进入创建术语库菜单(1)。设置术语库保存的位置和术语库的名称 进入术语库创建向导。点击下一步。点击使用预定术语库模板单选按钮(1),保留默认选择:双语词汇表。点击下一步。
4、创建项目:选择待译文档,指定翻译记忆库(TM)和术语库(TB)。创建项目时,memoQ将原语文档导入到工作区,并能确保译文导出时与原文格式保持一致。创建项目的同时,也可以新建翻译记忆库和术语库。
5、参考利用已有的语料库,提升翻译效率。自己可以建语料库(翻译记忆库)按照语料的语种,语料库也可以分成单语(Monolingual)、双语(Bilingual)和多语(Multilingual)。可以使用Tmxmall在线对齐制作双语对齐的语料。
6、有一定的英语基础:Trados并不是傻瓜式的机器翻译,翻译工作还是要自己来,所以自然要有“一定”的英语基础;爱折腾:动手能力差或不爱折腾的童鞋,直接点右上角即可。
以英汉平行语料库为例,每天一般可以处理20-40万字语料对齐,用Python 或 R 来词性标注,句法标注,依存标注等,这个效率很高,然后进行抽样校对。
建立单语语料库比较简单,只需要准备好相关语料(古代汉语/现代汉语/英文/其他语言),将语料导入AntConc软件进行检索即可。
双语语料库 (1)语料准备 准备英汉对照的双语文档。可以是两个文档,其中一个英文,一个中文;也可以是英中上下对照或左右对照的单文档。
建立语料库 整理好的语料需要建立语料库。语料库可以使用一些专业的语料库软件,如Ant Conc、Sketch Engine等。建立语料库时需要选择合适的语料库软件,根据语料的特点进行设置,如选择合适的分词工具、词性标注工具等。
1、语料库对于笔译的用处,简要地说,主要在于词法句法,译者能以语料库中的语料为参考,判断自己写出的字词句是否有毛病,也就是印证的作用。
2、问题一:怎样利用语料库 仅一个文本肯定是不够的,要有很多文本,而为了保证文本的真实性(不能自己凭空捏造),所以做科学研究的时候就需要建立在语料库的基础上,所以说是基于语料库的研究。
3、翻译主要用的是双语语料,即中英或中日这种对照的。
有时有些翻译记忆库是以其他形式储存,则必须透过一些格式转换才能进行导入。
一般ctrl+enter后,翻译句段就会存入翻译项目记忆库,译稿完成后,可执行定稿或更新主记忆库按钮便可将翻译句段存入主记忆库中。很多人以为按了ctrl+enter之后就送入了主记忆库中,这是错误的。
语料清洗和去重。翻译记忆库中是否掺有杂质对记忆库质量影响很大。大量的杂质还会导致调取记忆库的速度变慢,因此要对杂质进行清洗。例如原文与译文完全相同的条目,例如纯数字或者符号。需要进行清洗。
一般ctrl+enter后,翻译句段就会存入翻译项目记忆库了,译稿完成后,可执行更新主记忆库按钮便可将翻译句段存入主记忆库中。