在打开 CAT 工具前,先用 AI 预编辑源文本
混乱的源文件会严重拖慢翻译效率。让 Telegram 上的 AI 整理术语不一致、标记歧义句,把一份经过预编辑的干净文件交到你手上,帮你直接导入 Trados 或 memoQ。

没人为此付费的源文件问题
每位有经验的译员都遭遇过这样的一天。客户发来一份 40 页的源文件。你打开它,前三段还好。翻到第五页,一个项目符号列表的大小写突然乱了。第八页,同一个术语出现了两种不同写法。第十二页,某个句子因为客户审校时粘贴出错而缺少了谓语动词。第十五页有一处"见附件表格"的悬空引用,附件根本没有。第二十页有一节内容,像是由另一个人撰写,语气更正式、行话更多。
这些问题,你一分钱都拿不到,因为你的工作是翻译,不是校正。但如果你不修,译文就会继承源文件的所有问题,客户会把责任推到你身上。于是,在一个按字数计费的 40 页项目里,你要额外烧掉 45 分钟,在脑子里或者批注里梳理源文件,才能真正开始翻译。
解决办法理论上显而易见,实际操作却让人头疼:在源文件导入 CAT 工具之前,先跑一轮预编辑。大多数译员都跳过这一步,因为预编辑和翻译本身一样枯燥。AI 智能体能接手枯燥的部分,在你转发文件 10 分钟后,交还给你一份更干净、标注了歧义的源文件。
预编辑实际上要做什么
对源文档进行一次规范的预编辑,每次都要检查同样那几类问题。把它们列出来,你就会明白为什么这件事非常适合让 AI 来做。
- 术语不一致。 同一个概念,一段里叫"用户",另一段里叫"客户"。
- 大小写和连字符不统一。 "eCommerce""e-commerce""Ecommerce"出现在同一份文档里。
- 拼写或语法错误。 客户自己 QA 都没发现的错别字。
- 引用断裂。 正文写"见表3",表3 却没有附上,或者编号跳跃。
- 代词和主语模糊。 "他们需要审核它","他们"和"它"指谁根本不清楚。
- 语气不一致。 不同作者撰写的段落风格迥异。
- 残留的排版碎片。 模板遗留下来的"见附件:"。
- 文化与法律雷区。 格式模糊的日期、没有货币代码的金额、在目标市场无法直接套用的表述。
细心的人工译员能找到所有这些问题,但一份 40 页的文件需要花上一个小时。配备了预编辑提示词的 AI 智能体不到两分钟就能完成,每个问题都附上具体的行号,然后询问你打算如何处理。
AI 智能体如何执行预编辑
整个工作流程只需要一个 Telegram 对话,三步搞定。
1. 把源文件发到对话里
把 docx、pdf 或纯文本文件转发给你的 Hermes agent。你可以附上一句简短说明:"这份文件要翻成法语,市场营销风格,40 页。请检查一致性,并标记任何翻译时可能产生歧义的内容。"
2. 收到分诊报告
两分钟内,智能体会返回这样一份报告:
Pre-edit triage, client file "brochure-v3.docx" (2,840 words)
Consistency:
- "user" (used 14 times) and "customer" (used 7 times) refer to the same concept. Decide on one and I will normalize.
- Capitalization of "Platform" is inconsistent, 8 uppercase, 3 lowercase. Your client's style guide says lowercase, I will normalize unless you say otherwise.
Ambiguities:
- Page 8, line 4: "they will review it" - unclear if 'they' is customers or the support team. Flag for query?
- Page 14, footnote: "See attached table" - no table detected. Check with client.
Spelling and grammar:
- Page 3, line 21: "acces" should be "access"
- Page 11, line 9: extra space before comma, cosmetic
Target market issues:
- Date format "03/04/2024" on page 6 is ambiguous, reads as March 4 in US and April 3 in most of Europe. Recommend writing out the month.
- Page 22 claim "FDA-approved" does not apply to EU market. Flag for client or localize to "CE-marked" if applicable.
Recommended next step:
Approve my suggested normalizations for consistency and spelling. Draft a short query list for the client on the 2 ambiguities and 1 market issue. Then we can open the CAT tool with a clean source.
3. 确认,开始翻译
你读完报告,批准规范化建议,把疑问清单复制进一封邮件发给客户请求确认,然后在没有上述 11 个问题的干净源文件上打开 Trados 或 memoQ。等客户回复疑问邮件时,你可能已经翻完 30% 了。
这对你日常工作意味着什么
三项切实改变。
减少返工
大部分翻译返工,都源于对源文件歧义的错误判断。预编辑在早期将歧义浮出水面,意味着你在翻译之前就去问了客户,而不是交稿之后。仅此一点,长期来看就能大幅削减返工率。
提高初译速度
干净的源文件更容易翻译。句子表达更清晰,术语已经统一,错别字已经消除。你每小时的翻译字数会提升,而你付出的精力并没有增加。
提升客户眼中的专业形象
当你在翻译开始前就给客户发去五条有序的具体问题时,你在客户眼中是一位认真的合作伙伴,而不只是一个供应商。这些问题因为表述精准,很容易回答。久而久之,客户会主动向你提交更高质量的源文件,因为他们知道你一定会发现问题。
根据你的风格调整预编辑
每位译员想标记的内容略有不同,智能体会学习你的偏好。
告诉它哪些可以忽略。 "不要标记数字格式不一致,我会在 CAT 工具里用查找替换处理。"智能体就不再标记这类问题。
告诉它哪些要更严格标记。 "任何超过 30 个单词的句子都标记出来,提示可能需要拆分。"它会加入这条规则。
喂给它你的风格指南。 "以这份风格指南为基准,执行所有一致性检查。"它会把风格指南变成默认参照。
按客户保存不同的预编辑配置。 客户 A 需要高强度标记,客户 B 只要查拼写错误。你说一句"运行客户 A 预编辑配置",正确的方案就启动了。
预编辑不是什么
三件它不打算做的事。
不是翻译。 智能体不会翻译源文件,它只是在准备源文件。你还是要打开 CAT 工具,做真正的翻译工作。
不能取代人的判断。 如果智能体标记了某个歧义,但你凭上下文知道没有问题,直接忽略即可。"标记"意味着"值得看一眼",不等于"必须修改"。
不能替代与客户沟通。 预编辑生成的是一份疑问清单,这份清单还是得发给客户。机器解决不了歧义,人才行。
为它单独收费的理由
一点实际的商业建议。如果你经常为客户做预编辑,这项工作对他们有真实的经济价值。许多翻译公司会单独列出预编辑费率,大约是翻译费率的 50% 到 70%。有了 AI 智能体来执行这一步,这部分的利润率相当可观。
你有两种选择:
- 将"源文件审核"作为标准服务中的免费附加项,稍微提高每字单价来覆盖这部分时间成本。大多数客户更喜欢这种方式,因为只有一张发票,一项交付物。
- 将预编辑作为单独收费项。按翻译费率的 40% 到 60% 收费,将整理后的干净源文件作为独立交付物随译文一并提交。
两种方式都可行。选项 1 适合直接合作的自由职业客户,选项 2 适合习惯按项目逐项计价的翻译公司。
一个晚上完成配置
- 在 Hermify 上启动一个 Hermes agent。 60 秒搞定。
- 上传你的风格指南,以及几份你在时间充裕时会亲自写出的预编辑样例报告。 智能体会学习你期望的风格和深度。
- 对你最近完成的一个项目运行预编辑,作为测试。 对比智能体标记的内容与实际造成返工的问题,从中调整。
- 将预编辑步骤纳入你的项目接单流程。 每份新文件在进入 CAT 工具之前,都先过一遍智能体。
- 追踪一个月内节省的时间。 这些数据,是你下次谈判费率的底气。
更大的意义
译员之间的竞争,在于速度、质量与可靠性。预编辑是大多数自由译员在这三方面同时取得最高杠杆效益的单一改变。之所以没有更多人去做,唯一的原因就是手动版本和翻译本身一样枯燥。AI 智能体消除了枯燥,保留了所有好处。
你早就知道干净的源文件对工作意味着什么。从现在起,每个项目都从干净的源文件开始。