2016年11月までに、最も使用されているオープンな機械翻訳プラットフォームであるGoogle翻訳に何かが起こりました。世界中のユーザー(主に英語から中国語、スペイン語、フランス語、日本語、ドイツ語、韓国語、ポルトガル語、トルコ語の組み合わせで翻訳しているユーザー)は、機械翻訳の結果が大幅に改善され、突然文章全体を翻訳し、より広い文脈で作業し、より人間らしくなったことに気づきました。Google自身は、このプラットフォームが「過去10年の間に見たことのないほど」改善されたと主張しています。だから何が起こったのか?
SMTとNMTの比較
要するに、ニューラルネットワークとAIが起こったのだ。ニューラルネットワークは、「力ずく」で問題を解決する統計的手法に頼るのではなく(より複雑なデータベースと計算能力を利用できれば、より良い結果が得られる)、計算における人工ニューロンを利用し、生物学的な脳の実際のモデルを緩やかに模倣しています。グーグルの統計的機械翻訳(SMT)は、100以上の言語(正確には現在103)において、単語や短いフレーズを多少なりとも許容できる精度で翻訳する能力で世界を驚かせた。しかし、新たに実装されたニューラル機械翻訳は、それを超えるものだ。ディープラーニングの技術を使い、まず、限られたフレーズだけでなく、文の文脈に合った翻訳に最も適した変種を想定し、それを可能な限り人間の音声や文法に合うように変換します(上の写真で実証されている通りです)。
NMTはどこまで良くなるのか
もちろん、ニューラルネットワークは学習することでより良くなっていきますが、GoogleのNMTはまだまだ学習が必要なようです。プロフェッショナルな人間翻訳主に屈折した言語が対象です(ラテン語とギリシャ語が最後になりそうです)。しかし、最近の技術の進化は、機械翻訳の飛躍的な向上を示している。今後数年間で、Googleはカバーする103の言語すべてのNMT結果を完成させ、「インテリジェント」オンラインプラットフォームやアプリのまさにDNAに翻訳機能を実装する予定である。
Google翻訳が登場して10年が経ちましたが、今後10年後にGoogle翻訳がどうなっているか、また、プロの翻訳者にどのような影響を与えるか、興味深いところです。2027年には、翻訳者は、さらに必要な専門性とスキルを備えたヒューマンエディターになっているのだろうか。