現代において、地球はとても小さくなり、多くの海外の情報が入ってくるようになりました。情報の流れは速く、そしてその大部分は外国語で書かれており、機械翻訳は私たちにとって必要不可欠なツールとなっています。しかし、機械翻訳については、翻訳精度が悪くなってしまうことが多いという課題があります。
この記事は、そんな機械翻訳の精度を上げるためにできることをまとめたものです。私たちが翻訳を依頼する際の文章の作り方、専門用語辞書の活用方法、文脈の理解などについて、実用的なアドバイスを提案します。
明確で簡潔な文の作成をするべき
まず、機械翻訳は、複雑な文章を翻訳することが苦手です。これはChatGPTなども同様で、複雑で長い文章の作成はまだ最新のAIでも難しいのです。そのため、可能な限り明確で簡潔な文を作成することが重要です。文章の解釈に曖昧さを減らすことで、機械の翻訳エンジンが文の意味を適切に理解しやすくするからです。
簡潔に書くと、機械は反応しやすい
簡潔さは機械翻訳の精度において重要な要素です。長い文は通常、多くの副句や関係節を含む傾向があります。これらは一つの文の中で複数の思考を結合しますが、これが文の解釈を難しくします。そのため、一つの文で一つの思考を述べ、文をできるだけ短く保つことが推奨されます。
注:英語の文章は、修飾する語彙が後に続くため、慣習的に長くなりがちです。
例えば、以下の文はとても複雑です。
“When I went to the store, which is located in the city and is often busy on weekends, I bought some milk, which I needed for cooking.”
筆者の訳:「私は、街中にある、週末はよく混んでいる店舗に行って、料理に必要な牛乳を買いました。」
Google翻訳:「市内にある週末は混むお店に行ったときに、料理に必要な牛乳を買いました。」
しかし、これを以下のように分割し、というように短く、単純な文にすると、機械翻訳の精度が向上します。
“The store is in the city. It is often busy on weekends. I went there and bought some milk. I needed the milk for cooking.”
注:これは極端な例です。
同様に、日本語→英語でも行ってみます。以下の文章は長くて複雑です。
「彼は、スパイファミリーというギャグ漫画を読むのが好きで、日曜日の晴れている日は、近所の公園の近くにある友達のおしゃれなカフェで、漫画を読んでいるんだ。」
Google翻訳:He likes to read a gag manga called Spy Family, and on sunny Sundays, he reads comics at a friend’s fancy cafe near the neighborhood park
この例では、文が複数の情報や行動を同時に含むことで複雑さが生じています。具体的には、「彼の好み」、「読んでいる漫画のジャンルとタイトル」、「彼の行動の特定のタイミング」、「彼が漫画を読む場所」、「その場所の特性」など、異なる情報が一つの文に混在しています。
このような長い文は、翻訳エンジンが複雑な文構造を正確に理解し、それを適切に別の言語に変換することが困難であるため、誤訳を引き起こす可能性があります。
そのため、一つの文で伝える情報を減らし、文を分割することで、機械翻訳の精度が向上する可能性があります。
「彼は”スパイファミリー”というギャグ漫画が好きだ。彼は、晴れた日曜日に、近所のカフェでその漫画にふけている。そのカフェは友人が経営しているお洒落な店である。」
改善点は以下の通りです。
- 「彼が好きなのは”スパイファミリー”というギャグ漫画である。」:この文では、彼の好みについて話しています。複雑な文から最初のアイデアを取り出し、それを単純明快に述べています。
- 「彼は、晴れた日曜日には、近所のカフェでその漫画にふけている。」:この文では彼の行動、特に彼が何をするのか、それがいつ起こるのかを述べています。これも原文から取り出したアイデアを単純化し、独立した文にしています。
- 「そのカフェは友人が経営しているお洒落な店である。」:この部分では、彼が漫画を読む場所について述べています。場所の詳細とその特性について明確に説明しています。
このように一つのアイデアを一つの文に分けることで、文は読みやすくなり、機械翻訳の精度も向上します。
明確に書くべき
また、文が明確であることも同様に重要です。曖昧な表現や意味が二重になっている語句は、翻訳エンジンにとって解釈が難しい場合があります。したがって、可能な限り具体的な表現を使用し、一意の解釈を可能にすることが望ましいです。
有名な例だと、”She saw a boy with a telescope.”という英語の文は、彼女が望遠鏡を使って男の子を見たのか、あるいは彼女が望遠鏡を持っている男の子を見たのか、曖昧です。このような文は、可能な限り明確に書き直すことが推奨されます。
She saw a boy through a telescope.”(彼女は望遠鏡を使って男の子を見た。)
She saw a boy who had a telescope.”(彼女はテレスコープを持った男の子を見た)
次に、日本語→英語の例を示します。
「彼が部屋に入って本を開いた。それは彼にとって大切なものだった。」
この文は、「それ」が何を指しているのかが曖昧です。「それ」は部屋を指しているのか、それとも本を指しているのか明確ではありません。
(注:人間にはもちろん本だと分かりますが、機械は分かりません。ちなみにChatGPTのような高度なAIは識別できる場合もありますが、統計的に識別しているに過ぎないです。)
これを「彼が部屋に入って本を開いた。その本は彼にとって大切なものだった。」と書き直すと、”本”が大切なものであることが明確になり、翻訳がより正確になります。
このような具体性と明確性が欠けた表現は、翻訳の誤解を生む可能性があるため、明確で具体的な表現を使用することが重要です。
専門用語の辞書の作成と使用
独自の専門用語や固有名詞がある場合、これらを適切に翻訳することは質の高い翻訳を作成する上で重要です。特に、IT業界など特定の業界では一般的な辞書には載っていない専門用語が数多く存在します。これらの言葉を正確に翻訳するためには、専門用語の辞書を作成し、それを機械翻訳システムに追加する方法があります。
※これは大抵の場合は有料版の機能です。ChatGPTの場合は割と気にせずに訳してくれます。
※外国語をそのままカタカナにして外来語を「創作」したり、そのままカタカナに直せばよいものをわざわざ変な日本語に直す場合がある、ということを押さえて欲しいです。
専門用語の辞書の作成
専門用語の辞書を作成するためにはまず、自分の業界や専門分野で頻繁に使用される用語やフレーズをリストアップします。これらの用語やフレーズに適切な翻訳を付けて辞書を作成します。このプロセスは時間と労力を必要としますが、専門用語が正確に翻訳されることで、結果的に翻訳の全体的な品質が向上します。
例:プロトコル→規則 と直してしまう。
注:あまり翻訳を使わない場合、一度やってみて間違っていた部分をその都度登録するのでも良いかもしれません。キーボードの「ユーザー辞書」のような感じです。(ユーザー辞書は顔文字を登録する所として使う方がほとんどだと思いますが…)
更新と保守
業界のトレンドやテクノロジーの進化により、新たな専門用語が生まれることがよくあります。それらを追加し、既存の翻訳を更新または改善することで、辞書を常に最新の状態に保ちましょう。
※翻訳を使う際に、その都度訂正することが重要です。
専門用語の辞書の作成とその使用は、機械翻訳の精度を向上させるための強力なツールとなるでしょう。
文脈の理解
文脈は言葉が持つ意味を正確に理解する上で極めて重要です。文脈を無視した翻訳は、しばしば誤解や混乱を招きます。現代の機械翻訳システムは、文脈に基づいた翻訳を行う能力を持つものもありますが、以下のポイントを考慮することで、その性能を最大限に引き出すことが可能です。
1.全体の文脈を提供する
機械翻訳システムに一文だけを与えるのではなく、可能な限り多くの関連文を含めて入力しましょう。これにより、システムは前後の文から文脈を推測し、より正確な翻訳を出力できます。たとえば、文書全体を一度に翻訳することで、機械翻訳は、各部分がどのように関連しているかを理解するのに役立つ情報を得ることができ、より適切な訳を作り出せます。
2.明確な参照を使用する
曖昧な代名詞(「それ」「これ」など)よりも、具体的な名詞を使うと、機械翻訳システムが正確な対象を理解しやすくなります。具体的な名詞を使用することで、文の意味がより明確になり、翻訳の精度が向上します。
不明確な参照の例:
日本語の原文: “メイさんが瑠奈さんに試験に落ちたと伝えた。”
この文章では、「試験に落ちた」のが田中さんなのか、それとも佐藤さんなのか明確ではありません。これを機械翻訳すると、誤った解釈に基づく翻訳が出力可能性があります。(メイさんが自分の試験の結果を報告しているのか、メイさんが教師で、瑠奈さんの試験の結果を通知しているのかが分からない。)
明確な参照の例:
日本語の原文: “メイさんが瑠奈さんに、メイさんが試験に落ちたことを伝えた。”
この文章では、「メイが試験に落ちたこと」を明確にしているため、誤解を生む余地がありません。これにより、機械翻訳の結果もより正確になります。
3.曖昧さを避ける
翻訳を行う際には、原文が曖昧さを持たないように注意が必要です。たとえば、「彼」や「それ」が何を指しているのかが不明瞭な場合、機械翻訳は正しい解釈を見つけることが困難です。(人間は分かっても、機械は分からない。)特に、日本語は主語が抜けることがとても多いです。このような曖昧さを避け、すべての情報が明確であるようにすると、より良い翻訳結果が得られます。
曖昧な表現の例:
日本語の原文: “昨日、公園で友人と遊んだ後、家に帰った。荷物を下ろして、疲れていたのですぐにソファに座った。そして、昼食を作った。最近は自炊をすることが多い。テレビをつけて、ニュースを見ながら食事をした。”
筆者の訳: Yesterday, after hanging out with my friends in the park, I returned home. I unloaded my bags, I immediately sat on the sofa because I was tired. Then, I made lunch. Recently, I have been cooking a lot. I turned on the TV, and ate while watching the news.
Google翻訳:Yesterday, after playing with my friends in the park, I went home. I unloaded my luggage and sat down on the sofa as soon as I was tired. and made lunch. Recently, I often cook for myself. I turned on the TV and ate while watching the news.
私を知っている人からは、
お前いつもコンビニばっか行ってるだろ、嘘ばっかつきやがって
Lunaちゃん友達いたの?知らなかった!パソコンばっかりやってるgeekとかnerdだと思ってた!
…なんて言われそうですが、そこは一旦置いておきます。学校や会社などで提出する文章は、このくらい(わざとらしい)「おりこうさん」の方が周りから変な目で見られなくて良いのです(実話)。
Google翻訳は、概ね正確な翻訳を行っていますが、若干間違いがあります。たとえば、「疲れていたのですぐにソファに座った」という日本語の文を “I sat down on the sofa as soon as I was tired” と訳しています。この訳文は、「疲れてからすぐ、ソファーに座った」というような、求めていたものとは違う文章が出力されてしまっています。ここでは筆者の訳 “I immediately sat on the sofa” がより自然な英語表現となります。
また、”荷物を下ろして” を “I unloaded my luggage” と訳した点でも、Google翻訳の表現は少々硬い印象を与えます。上述したように、日常の会話では “I unloaded my bags” の方が一般的です。
これらの点から、機械翻訳の一つの弱点は、文脈を完全に理解し、それを自然な表現に変換することの難しさにあると言えます。翻訳作業は、単に単語や文法を別の言語に変換するだけでなく、元の文のニュアンスや意図を理解し、それを目的言語の文化や習慣に合わせて表現する作業でもあるため、完全な自動翻訳が難しいのです。
筆者のような自然な英訳が出てくるような日本語の文章を書いてみます。
「昨日は公園で友人と遊んだ後、家に帰りました。帰宅後すぐに荷物を下ろし、疲れていたので早速ソファに腰掛けました。それから、昼食を作りました。最近は自炊をすることが増えました。その後、テレビをつけて、ニュースを見ながら食事をしました。」
「ので」は理由を示すときに使えば、かなり正確に文脈を理解してくれます。また、時系列については特に意識しましょう。
これでダメなら諦めてChatGPTなどの、より優れた翻訳ソフトを使ってね!
確認・編集
なぜ確認や編集が必要なのか
機械翻訳は、人間のようには考えられません。それはあくまで数百万のテキストを学習し、そのパターンを再現するためのアルゴリズムであり、文化的なニュアンスや固有の表現に対する理解が不足しています。したがって、そのような細部まで正確に翻訳するためには、人間による後編集が必要となります。
効果的な確認・編集の方法とその手順
後編集の基本的な手順は以下のとおりです:
- 全体を読む: まずは翻訳文全体を一度読んでみてください。その際には特に、全体の流れや翻訳の自然さ、意味の通りが良いかどうかを確認します。
- 細部のチェック: 次に、各文や単語レベルで細かくチェックします。誤訳や意味のわかりにくい部分がないか確認し、必要に応じて修正します。
- スペルチェックと文法チェック: スペルチェックや文法チェックツールを使用して、翻訳文のスペルや文法を確認します。必要に応じてツールを使いましょう。
- 再度全体を読む: 最後に、再度全体を読んでみてください。その際には、修正した部分が全体の文脈に適合しているかどうかを確認します。
これらの手順を踏むことで、機械翻訳の結果を大きく改善することが可能です。しかし、この確認・編集にはある程度の知識が必要であり、全く知らない言語を訳すのは不可能です。
高品質な後編集を達成するためのヒント
後編集を行う際には、以下のような点に注意を払うと良いでしょう:
- ターゲット言語の適切な使用: 機械翻訳は完全には信用できないため、ターゲット言語(この場合は日本語)の正しい表現方法を自分自身で理解しておくことが重要です。
- 一貫性の確保: 文章全体を通して用語や表現の一貫性を確保することで、文章が自然で理解しやすいものにします。
- 時間をかけること: 確認・編集は時間がかかる作業です。時間をかけて丁寧に行うことで、より高品質な翻訳文を得ることができます。自分で書くよりは遥かに速いので、ここはしっかりと集中して確認しましょう。
これらを参考に、翻訳の品質を向上させてください。
まとめ
機械翻訳の精度を高めるためには、明確で簡潔な文の作成、専門用語の辞書の作成と使用、文脈の理解、そして確認・編集が必要です。これらに気を付けて訳そうとすると、意外と時間がかかってしまいますが、外部に提出する文書であるならば、これが現行の技術における、最も早い方法であると思われます。
コメント