自治体が発行する在住外国人向けニュースレターの英訳のお手伝いをさせていただいています。
権利書である特許文書とは異なり、広く一般に公開される文書であるため、できるだけ読み易くかつ迅速に仕上げる必要があります。そこで、生成AIなどのツールを最大限に活用し、翻訳の効率化と品質の両立を目指して日々研究を重ねています。
実際に行っている作業内容
以下のようなステップで進めています。
① 過去案件の一括取得
自治体のウェブサイトから、これまでに公開されたニュースレターのPDFファイルをまとめてダウンロードします。
使用ツール:ブラウザのアドイン「DownThemAll」
② ChatGPTを使った原文と訳文の抽出・整形
PDFには、日本語原文と英訳文が並列表記されているものが多いのですが、そのままでは扱いづらいため、ChatGPTを活用して以下のように整形します。
-
テキストを抽出し、日本語文からルビ(ふりがな)を削除
-
セクションごとに、日本語と英語のペアを見やすく並べる
-
英訳文の内容には手を加えず、構成とレイアウトのみ調整
これにより、「ルビなしの日本語原文」と「整形済みの英訳文」がセットになったWordファイル(.docx形式)を作成します。
このファイルは新規案件の翻訳準備として使います。
③ ChatGPTに過去データを覚えさせる
②で整えたファイルを使って、ChatGPTに「自治体独自の訳語や語り口、翻訳のトーン」を学習させます。
たとえば、「~できます」「~しましょう」といったやさしい表現や英訳の流れ、これまで使用されてきた訳語などをAIが再現できるようにしておきます。
④ ChatGPTによる新規原稿の翻訳
準備が整ったら、新たに届いた日本語原稿をChatGPTに翻訳させます。
過去データを学習済みの状態なので、文体や言い回しもある程度安定します。
⑤ 訳文チェックと微調整
AIが出力した訳文を人の目で確認し、訳抜けや表現の強さなどをチェックします。必要に応じて、ChatGPTに再翻訳を依頼します。
例:訳抜け・誤訳の修正
-
原文
「第2回目の募集は、ひらがな・カタカナが読み書きできるかた向けに、オンラインで学べるレベル2の教室です。自宅から授業を受けることができます。」 -
最初の訳文
”This Level 2 course is designed for learners who can read and write hiragana and katakana. Classes will be held online, so you can join from home.”
→「第2回目の募集」が訳されていない! -
修正後の訳文
”The second round of enrollment is now open for Level 2 classes, which are held online and designed for learners who can read and write hiragana and katakana. You can take the class from the comfort of your home.”
→申込はまだ始まっていない! -
再修正後の訳文
”The second round of enrollment will be for Level 2 classes, which are designed for learners who can read and write hiragana and katakana, and will be held online. You can take the class from the comfort of your home.”
※ちなみに、「第2回目の募集」が何を指しているのかを確認するために、過去のニュースレターを遡ってチェックし、「第1回目はレベル1クラス向けだった」という前提を把握しておきました。この辺のチェック作業は人間がまだ行う必要がありそうです。
準備段階のステップ①〜③には約2時間かかりましたが、翻訳作業(ステップ④)自体はわずか5分で完了。ただし、ステップ⑤は意外と時間がかかり、修正と読み直しを何回か行ったので1時間ほど要しました。
今後もこのように、AIの力を活用しながら、スピードと品質のバランスを取った翻訳スタイルを模索していきたいと思っています。
※この記事もChat君の力を借りて執筆しました。