自从 OpenAI 推出 GPT3,特别是 ChatGPT 以后,我们陆陆续续看到大语言模型在各种垂直领域中超出预期的应用。比如在文字翻译中,它展现了比传统方法更好的效果:
理解上下文
跟传统机器翻译工具相比,GPT 能够更准确地翻译长句和复杂句子,这是因为它能够“理解”上下文,能够综合考虑整个文本段落。
保持原来语气
GPT 可以根据原文的语气、文体风格来产出译文。相比之下,其他机器翻译工具可能更偏向于标准、中性的翻译,无法完全体现原文中的语气和情感。
更流畅的表达
GPT 善于构建和输出流畅的语句,这使得它的翻译结果更接近与人类翻译的效果,而传统机器翻译工具则可能产生结构不完整、或者语法不准确的句子。
更多的语言支持
GPT 的训练使用大量的不同语言的语料,这让它默认支持相当多的语言间的互译。
但包括 GPT 在内的大部分大语言模型,都是对话式,不能上传文档,而且每次对话的长度有限制。
如果我们要翻译完整的文档,比如一篇论文,一本电子书、一个产品手册,就得复制一段一段的文字喂给 GPT,然后把它的译文复制回来,再编辑成原来的文档。
这种枯燥耗时的工作,还是交给哪位程序员开发的应用来完成比较划算 -_-||
我们推出的文档翻译产品,就是基于大模型实现的,效果可以说是相当不错。
可以看看官网上的各种示例效果。
论文翻译:
桌游说明书翻译:
产品说明书翻译(一)
产品说明书翻译(二)
这里只通过截图展示视觉效果,如果要看全文的对照,可以进入示例页点击对应示例。
从前面的示例,我们可以看到翻译出来的文档的“视觉效果”的确非常好,至于具体的翻译质量,我们来将它跟号称世界上最准确的翻译软件 DeepL 的结果对比一下。
原文
SimplifyAI 版本
DeepL 版本
相比较而言,SimplifyAI 基于 GPT 的版本基本没什么问题。
DeepL 少翻译了一段,“there is a broader cost in the loss of ability to make non-reversible payments for non-reversible services.” ,所以必须扣一点分。另外 “CPU 算力”,也被普遍翻译成“CPU 能力”,没那么恰当。
DeepL 在有公式的情况下表现更差了。我们来看看有公式的第七页最后一段
原文
SimplifyAI 版本
DeepL 版本
在保留 PDF 的公式格式上,SimplifyAI 的版本比 DeepL 好很多。而且此时 DeepL 已经到了第 11 页,不像 SimplifyAI 版本,跟紧了原文,同在第 7 页。
我们再来看看翻译有明显差距的地方:原文第二第三第四页中的图示。
第二页图示:
原文
SimplifyAI 版本
DeepL 版本
第三页图示:
原文
SimplifyAI 版本
DeepL 版本
第四页图示:
原文
SimplifyAI 版本
DeepL 版本
DeepL 对这些图示的翻译质量就比 SimplifyAI 的版本差远了:Hash 有时候翻译成散列有时不翻译;Nonce 不翻译但在这篇文章的上下文中应该是随机数;Owner 有时候是业主、有时是所有者、甚至机主; Tx 有时候不翻译,有时候翻译成奇怪的“特克斯”;Block 则是不顾上下文,翻译成了“街区”。
而 SimplifyAI 在处理文档时,把所有上下文整合起来发给大模型,翻译后再拆分重新安装回图示的位置,保持了很好的翻译一致性和质量。
哪个 PDF 翻译的效果更好,可以说显而易见。如果你有需要翻译论文、电子书、产品手册,就赶紧试试吧。
使用起来很容易,进入 https://translate.simplifyai.cn ,点击“立即使用”,上传你要翻译的文档(电子书、论文、宣传手册、产品说明书等等等等),选择你要翻译的语言,点击“开始翻译”,稍等片刻,就可以看到效果了