Google翻訳の精度が向上した理由は?さらに精度をあげるコツも解説!
近年、Google翻訳の精度が向上したと評判なのをご存知でしょうか。Google翻訳の精度が向上した理由は、ニューラルネットワークを利用した翻訳システムにありました。進化したGoogle翻訳の精度をさらに向上させるコツもご紹介します。
目次
Google翻訳の精度が向上した理由は?
Googleが開発している「Google翻訳」の精度が、2017年秋頃から格段に精度が向上したとの評判です。これまでは、機械翻訳では限界があり不自然な日本語訳になることが多く、機械翻訳は参考程度の扱いでした。今や専門家が認めるほどにGoogle翻訳の精度が向上しました。Google翻訳の機能とともに、精度が向上した理由を解説していきます。
まず、Google翻訳の機能についてご紹介します。Google翻訳は、PCからもスマホからも使用可能な翻訳サイトで、オンラインでもオフラインでも使えます。(オフライン時は事前に登録等の手順が必要)オンラインでは、ウェブブラウザから翻訳サイトに接続して機械翻訳を実行します。Google翻訳のメインの機能(PC・スマホ共通)は次の3つになります。
- テキスト(文章)入力(タイピング・手書き)
- ページ(URL)の翻訳
- 音声入力・出力
Google翻訳スマホアプリでは、「リアルタイム検索」(カメラで読み取った文字を翻訳)、「タップして翻訳」(Androidのみ)もあり、旅行先や外出先で利用するのに役立ちます。
では、Google翻訳の精度が向上した理由について解説していきます。まず、従来の機械翻訳の仕組みは「PBMT」と言われるものでした。「PBMT」とは「phrase-based machine translation」の略です。フレーズベース翻訳とは、それぞれのフレーズの意味を翻訳し、それらを文章として組み合わせて翻訳するのです。例えば、「I」→「私は」、「am」→「です」、「Tom」→「トム」というそれぞれのフレーズを組み合わせて、「I am Tom」→「私はトムです」と翻訳するのです。
これらのフレーズと言語モデルや翻訳モデルとともに大量にデータ化し、機械翻訳していたのが従来のGoogle翻訳サービスでした。(統計機械翻訳)これらはフレーズの意味が元になっているので、不自然な翻訳になることが多く、機械翻訳の限界とされてきました。
ここで、2017年にGoogleが「GNMT」を導入すると発表したのです。(「GNMT」とは、「Google Neural Machine Translation」の略)このニューラル機械翻訳とは、ニューラルネットワークを利用した翻訳システムのことを指します。では、「ニュートラルネットワーク」とは何でしょうか。
「ニュートラルネットワーク」とは、「ニューロン」という人間の脳内にある神経細胞のつながり、つまり神経細胞網を人工ニューロンで示したものです。それぞれのニューロン自体は単純な仕組みでも、ニューロン同士のつながりが多層にわたっているため、複雑な計算量を処理できるようになりました。
「GNMT」を導入したGoogle翻訳は、単語の意味のみならず、単語の位置や接頭辞、語幹などを多層的に分析して、自然な文章で翻訳することが可能になりました。これがGoogle翻訳の精度が向上した理由です。
Google翻訳とその他の翻訳を比較
では、Google翻訳とその他の翻訳を比較してみましょう。翻訳サイトは、Google翻訳の他に、エキサイト翻訳、Webilio翻訳、BingTransferなどがあります。翻訳サイトはまだまだ発展途上ですが、Google翻訳は翻訳のスピードが速いこと、翻訳文の精度が高いことで他のサイトに比べて高評価を得ています。
「英語翻訳」をいうサイトでは、翻訳した文章を入力すると(上の画像で赤枠部分)様々な翻訳サイトでの翻訳結果を参考にできます。画像青枠部分にある、6種類の翻訳サイトから選択してクリックするとそのサイトの翻訳結果が表示されます。一度の入力でサイト別の翻訳を比較できる便利なサイトです。
Google翻訳VSエキサイト翻訳の精度を比較
ではGoogle翻訳と、エキサイト翻訳の精度を実際に比較してみましょう。今回は「日本映像翻訳アカデミー」のサイトにある練習問題を元にそれぞれの翻訳結果を示してみます。
①英文に対する日本語訳を正してください
Your opinion couldn’t be less important.
君の意見が重要じゃないなんて、そんなことあり得ないね。
<解答・解説>
①君の意見なんてどうでもいい。
この文のnotが否定しているのはless importantです。「これより重要じゃないことはあり得ない」とは重要性が最も低いということ。つまり「どうでもいい」という意味になります。
これに対してGoogle翻訳の和訳は「あなたの意見はそれほど重要ではないでしょう。」となり、重要ではない、と「less import」否定した正しい文章になっています。
これに対して、エキサイト翻訳では「あなたの意見はそれにも劣らず重要であるかもしれない」と翻訳されました。「それにも劣らず」という訳が不要であり、「重要であるかもしれない」と「less import」を否定していません。
続いては、こちらの例文を翻訳してみます。「north of」が「more than」と同等の訳になるというのが、細かい精度を求められる英文解釈です。
②和訳してください
Dinner for two can cost north of ¥30,000 at the restaurant.
②その店でディナーを食べると2人で3万円を超えることもある。
ポイントはnorth ofという表現です。頭の中に地図を思い浮かべてください。地図は通常、北が上になるように描かれています。ここからnorth ofにはmore than(上回る)という意味が出てきます。つまり問題の英文はDinner for two can cost more than ¥30,000 at the restaurant.と書き換えられるので、訳例のような意味になります。
Google翻訳では「2名様分のディナーはレストランで30,000円以上かかります。」と翻訳されました。「north of」を「以上」と、正しく英文解釈できています。非常に精度が高いといえます。
続けて、エキサイト翻訳では「レストランで2のためのディナーが¥30,000の北についてコストを見積もることができる」と翻訳されました。破綻した文章になってしまいました。問題の「north of」もそのまま「北」と翻訳されています。人数を表す「two」もそのまま「2」と翻訳されています。
Google翻訳とエキサイト翻訳の比較では、進化したGoogle翻訳の精度が高いことがよくわかりました。
Google翻訳の精度をさらに向上させる方法
このように精度の高い進化したGoogle翻訳ですが、さらに精度を向上させる方法があります。
主語述語目的語を入れる
Google翻訳の精度を更に向上させる方法1つ目は、主語・述語・目的語をしっかりと入れることです。例えば、日本語で友人に「ミホから電話がきたらメールする」と言っても意味が通じます。Goole翻訳で翻訳すると、「Email me when Miho receives a call」となります。ミホが電話を受ける、メールをして、と翻訳されてしまいました。
日本語では、主語である一人称(私は、僕は)を省略して会話をすることが多いので、主語を必ず使う英語に翻訳しづらいのです。ですから、日本語から英語に翻訳したい場合は、主語・述語・目的語を使いましょう。
英語を学習し始めた中学生が、直訳したような日本語で入力するとさらに精度が向上されます。上の文章を「私はミホから電話がかかってきたらあなたにメールします」と訂正しました。
「I will mail you when a call comes from Miho」と正確に翻訳されました。また、「、」、「。」といった句読点も正しく入力するとより精度が上がります。
翻訳する日本語をなるべくシンプルにする
Google翻訳の精度をさらに向上する方法2つ目は、翻訳する日本語をなるべくシンプルにすることです。主語・述語・目的語の他に、名詞や動詞を修飾する修飾語(咲かない花、きれいに描くなど)や、用言を修飾する副詞(よく~する、たいそう~など)が入り長くなると文章が難しくなります。省略できるフレーズは削り、シンプルな日本語で入力しましょう。
漢字をなるべく使用する
Google翻訳の精度をさらに向上する方法3つ目は、できる限り漢字を使用することです。「やさしい」は「親切な」と「簡単な」という2つの意味があります。「はな」も「花」と「鼻」があります。英語にすると、「kind」、「easy」、「flower」、「nose」と誤訳の原因になります。特に文章が長くなる場合にはできる限り漢字を使用したほうがより精度が上がります。
Google翻訳で「鼻が痛い」という翻訳をした結果です。「いたい」が「行きたい」と捉えられています。「痛い」と入力すると正しく「hurt」(傷める)になりました。主語「私は」を入れると「i havoe a sore nose」と自然な英文になります。
進化したGoogle翻訳の精度はすごい!
新しいニューラルネットワークを利用した機械翻訳に進化したGoogle翻訳。その精度とスピードは他のサイトと比較してもとても向上していることがわかりました。Google翻訳は海外での実践英会話や英文解釈にも対応できるレベルになっています。従来の機械翻訳に不信感がある方は、精度の向上したGoogle翻訳を試してみましょう。