Google翻訳はバージョン5.5.1

実用性を越えて完成度を目指す!?

もうすでに「もう完成しているね」と感じさせるアプリだと思っていましたが、機能もインターフェイスの面でも磨きをかけているのですね^^

バージョン5.5.1になったGoogle翻訳はマイクからの音声認識もカメラを使った文字認識も同時通訳のようなタイミングで、ダイナミックに変化する文字情報、音声情報にも即座に対応することを目指しているようです。

 

たとえばカメラを使った文字認識からの翻訳 - そもそも、カメラで文字を映すステップがそのまま翻訳するというステップにつながっていて、そのスピーディさがちょっとショックを感じるほどだというのがGoogle翻訳の動きでした。

文字認識、つまりOCRと言えば、読み取ろうとする情報を「まず画像化しましょう」、というステップがそのあとの工程とはっきり分かれているイメージがあったのですが、[文字を画像化しましょう][文字を認識しましょう]というステップをほとんどなしにしてしまっているのです。

画像としての文字情報から文字の部分を読み取る - その認識の精度を高められるだけ高めてから翻訳しよう、精度の低い翻訳では意味がないだろうと言わんばかりだった文字認識に対する私たちの常識を完全に変えてしまう動き方です。

文字認識の精度がそれほど高いということにもなるのですが、バージョン5.5.1の動きを見ていると認識できたレベルで翻訳してしまうという、ある種の挑戦のように見えるスピード化が図られているように感じます。

読み取りをカメラモードにして文字に向けるとその文字を含んだ景色の文字だけがターゲット言語に差し変わって見えるのですから、街の看板に何が書かれているかとか、何の店なんだろうというようなシチュエーションで使うことを提案しているのだろうなと思います。

 

論より証拠? - 使ってみて確かめたい そのスピード感
常識なんてにゃんセンス

出典:『常識なんてにゃんセンス』

見えたものをその場で翻訳しよう! というスピード感は、まとまった量の文章を読ませてみてもよく分かります。

これまでなら、まず写真にして、その画像をGoogle翻訳に翻訳させるという手順だったのですが、新しいモードを使えば、カメラを向けたその場で翻訳がはじまります。

スポンサードリンク

しかも、見え方が微妙に変わるのに合わせて文字認識の様子が変化し、翻訳結果も少しずつ、その場で変化するのです。

 

 

 

actual translation by google trans

Google翻訳の翻訳

さて、このGoogle翻訳の文字認識+翻訳力、どんなふうに活かしたらいいでしょう?^^