コンタクトレンズ型ウェアラブル機器から個が主体となる音声認識の可能性を考えてみる


昨日、このような記事を見つけました。

リンク:コンタクトレンズがスクリーンになる「ポリマー薄膜コーティング」技術

誰かが開発しているだろうと思っていましたが、本当にしていました。コンタクトレンズ型のウェアラブル機器の可能性がいよいよ出てきました。発売されるのは、かなり後だと思いますが、こちらの記事は、音声認識技術の形について考えさせられました。

ここで、私自身が思った事を載せてきます。

コンタクトレンズに反応したわけ

この記事に反応した理由は、コンタクトレンズ型のウェアラブル機器があれば、もしかしたらより音声認識技術が活用できるかもしれないと考えたからです。

今現在は、聞こえにくい人が使用する機器ではなく、聞きにくい人を対応する人達が使用する技術になっています。私自身としては、周囲の方が使用するのではなく、聞こえにくい個人が使用できるようになると、より良くなると考えており、その一歩をコンタクトレンズ型ウェアラブルが踏み出してくれるのではないかと感じました。

しかし、考えて行く内に、問題の部分も見えてきました。それは、大きく分けると

  • マイクの必要性
  • ディバイスの問題性

この二つに分けられます。

マイクの必要性

音声認識は、音声を拾うマイクがなければ機能しません。仮にコンタクトレンズ型にするとなると、スマートフォンをマイク代わりにするか、それとも外付けのマイクを用意し、スマートフォンと連携させ、文字を可視化しなければなりません。

そして、マイクの必要性の問題点は、音声認識を必要としているお話しを理解したい人が使うのではなく、聞こえにくい人にお話しを伝えたいと考えている方が使用する事です。相手にマイクを持ってもらい、お話しする事で、初めて音声認識は機能します。

この問題点は、ディバイスの問題点にも影響してきます。

ディバイスの問題点

上記に記載しました通り、コンタクトレンズ型のディバイスになると、個人が主体となる音声認識技術になるのではないかと一瞬期待をしたのですが、個が主体となる音声認識技術を確立させるには、ちょっと問題があります。その問題点は

  • 常時マイクを持ってもらう環境が必要
  • 複数の音声はどのようにするのか
  • 認識ルートは、どのようにするか

の三つがあります。上記の通り、音声認識には、音声を入れなければ反応しません。そして、仮に世の中全員がマイクを常時装用している状態になったとしても、どの音声を入れるのか、どのように理解するのか、という問題も起こってきます。

音声に関しては、優先順位をつけ、会話の表示をしていかないと音の認識そのものもできませんし、仮にそこは気にせず、認識できるとしても、手当たり次第、入れてしまうと文字で画面が埋め尽くされ、どの内容を読んだら良いのかもわかりません。数が多くなった時の問題は、どのようにするのかが問題です。

そして、仮にマイクを常時装用する世界になったとしても、どのように通信するかも問題ですね。今現在は、ペアリングをして、通信しあっている状態ですので、そのペアリングをする必要があれば、手間もかかってしまう事になります。

似たようなディバイスであるGoogle glassには、少し前にGoogle glassのみで音声認識させるアプリがありました。Google glassそのものにマイクを利用し、そこから音を認識してスマートフォンに音を転送。そして、音声認識エンジンが内容を読解し、読解した内容をメガネに送るという方法でした。このような方法であれば、確かに個人が音声認識を使える世界になります。しかし、この方法では、音や話し手の音声が非常に捉えづらく、このような方法で認識しようとしたGoogle glassを使った音声認識アプリは、今はどうなっているのかわかりません。

個を主体とする音声認識はまだまだ先になりそう

コンタクトレンズ型ウェアラブル機器から色々と考えてみましたが、正直、かなり難しい部類に入りそうです。Google glassにアプリで聞くパターンは、最も正解に近そうでしたが、搭載されているマイクで拾える音からは、かなり難しい事がわかっています。

となると、次は、常時マイクを相手に持ってもらう事ですが、ここは、よくわかりません。何かのテクノロジーが進化し、このような状態になるかもしれませんが、ならないかもしれません。Google glassのようなディバイスで期待されているのは、会話内容の自動翻訳だと思いますので、何らかそのようなアプリで、上記の問題点を解決してくれれば、可能性はありますね。その技術を応用し、翻訳を翻訳せずに使えば、音声認識アプリに変わります。

色々と可能性を感じる反面、問題点も感じます。コンタクトレンズ型ウェアラブル機器から感じたのは、このような事でした。

 

この内容をご覧になった方は、こちらの内容もお勧めです。

リンク:Please Tagの未来は、どのようになっていくのか

リンク:スマートフォン単体のみで音声認識を活用するのは、難しいと思う理由

リンク:赤ちゃんの語彙量を記録するデバイスStarling

リンク:髪で音を感じるONTENAというものがあるらしい……