優れたAI翻訳は、一文ずつ正確であればよいというものではありません。契約書、証明書、技術資料、申請書では、翻訳後のファイルが元の構造、書式、用語、レイアウトを保ったまま使えることが重要です。
文の翻訳と文書の翻訳は違う
フロンティアAIモデルは、チャット欄に入力された文章の翻訳では非常に高い能力を発揮します。しかし実際の翻訳案件は、段落だけではなく、表、箇条書き、リンク、プレースホルダー、タグ、複数ページのレイアウトを含む文書として届きます。
ベンチマークで見たこと
私たちは24言語で、法律、マーケティング、技術、慣用表現、UI、タグ付き文書セグメントを使い、Gemini、Claude、GPT、Qwen、DeepSeek、Mistralを比較しました。総合ではGeminiが4.73、QwenとGPTが4.70、Claudeが4.56、DeepSeekが4.42、Mistralが3.94でした。
自然な表現だけでは足りない
自然な表現は大切です。ただし文書翻訳で求められるのは、自由に美しい表現を選ぶことではなく、用語、過去の承認訳、文書の目的、提出先の要件に従った「制御された自然さ」です。
Pikka AI の役割
Pikka AIはチャット翻訳ではなく、文書翻訳のためのワークフローとして設計されています。文書を分解し、構造を守り、用語集や翻訳メモリを反映し、翻訳済みファイルとして戻すことに重点があります。
Chat-style AI translation
- 短い文章の理解に強い
- 流暢な訳文をすばやく出せる
- コピーと貼り付けが必要
- 文書構造の保持は保証されない
Document-native AI translation
- DOCX、XLSX、PPTX、HTMLなどを前提に扱う
- タグ、リンク、変数を保護する
- 用語集と翻訳メモリを使う
- 翻訳済みファイルとして返す
書式も品質の一部
書式は見た目だけの問題ではありません。契約書の番号、表計算シートのセル、Web文字列の変数、証明書のレイアウトが崩れると、翻訳が正しくても実務では使いにくくなります。
実務での結論
短い文章を理解するだけなら、チャット型AI翻訳で十分な場合があります。しかし納品物としての文書が必要なら、同じ形式で戻ってくるかどうかが品質評価の中心になります。
