AI技術の一端を感じたければーアプリ『Google翻訳』

スポンサードリンク

Contents

今はもう 6.41.0 とバージョン更新進めている Google翻訳というアプリですが、この記事を最初に書いた当時は 5.5.1、6年前の春でした。

もうすでに「もう完成しているね」と感じさせるアプリだと思っていましたが、機能もインターフェイスの面でも磨きをかけていたのですね^^

当時、バージョン5.5.1になっていたGoogle翻訳はマイクからの音声認識もカメラを使った文字認識も同時通訳のようなタイミングで、ダイナミックに変化する文字情報、音声情報にも即座に対応することを目指していたようにみえました。

たとえばカメラを使った文字認識からの翻訳－そもそも、カメラで文字を映すステップがそのまま翻訳するというステップにつながっていて、そのスピーディさがちょっとショックを感じるほどだというのがGoogle翻訳の動きでした。

文字認識、つまりOCRと言えば、読み取ろうとする情報を「まず画像化しましょう」、というステップがそのあとの工程とはっきり分かれているイメージがあったのですが、[文字を画像化しましょう][文字を認識しましょう]というステップをほとんどゼロにしてしまっていました。

画像としての文字情報から文字の部分を読み取る－その認識の精度を高められるだけ高めてから翻訳しよう、精度の低い翻訳では意味がないだろうと言わんばかりだった文字認識に対する私たちの常識を完全に変えてしまう動き方だったのです。

文字認識の精度がそれほど高いということにもなるのですが、バージョン5.5.1での動き方は、認識できたレベルで翻訳してしまうという、ある種の挑戦のように見えるスピード化が図られているように感じたものでした。

読み取りをカメラモードにして文字に向けるとその文字を含んだ景色の文字だけがターゲット言語に差し変わって見えるのですから、街の看板に何が書かれているかとか、何の店なんだろうというようなシチュエーションで使うことを提案していたのだろうなと思います。

ユーザーインターフェース（使い方やデザイン）の面ではこの2年、Google翻訳には大きな変更はなかったように感じます。

ということは?…
翻訳の精度、文字認識の精度という、目には見えにくい部分で完成度を高めてきたんだなと思うのです。

見えたものをその場で翻訳しよう! というスピード感は、まとまった量の文章を読ませてみてもよく分かります。

スポンサードリンク

これまでなら、まず写真にして、その画像をGoogle翻訳に翻訳させるという手順だったのですが、新しいモードを使えば、カメラを向けたその場で翻訳がはじまります。

しかも、見え方が微妙に変わるのに合わせて文字認識の様子が変化し、翻訳結果も少しずつ、その場で変化するのです。

さて、このGoogle翻訳の文字認識＋翻訳力、どんなふうに活かしたらいいでしょう?^^

スポンサードリンク

Google翻訳－ AI技術の一端を感じるアプリ