2つの視点を持つ人が書いている耳・補聴器ブログ

東京都墨田区で補聴器の販売をしている難聴者のブログ。補聴器や耳に関する事を書いています

スマートフォン単体のみで音声認識を活用するのは、難しいと思う理由

Pocket

最近、本当に音声認識を活用したアプリが増えてきましたね。先日のソフトバンクのこえ文字トークもその一部です。このブログでは、この他、色々な音声認識アプリを紹介してきました。そこで感じる事は、音声認識アプリほど、活用する仕組みを作らなければ使いこなすのは、難しいな……と感じる事です。

音声認識アプリや技術によりバリアフリーのようになっていくのは、大変歓迎です。しかし、技術を使いこなす方法、気をつけるポイントを理解しておかないと、有効利用する事ができなくなります。こちらの内容で、使うヒント、音声認識技術の特徴を掴められれば幸いです。

スマートフォン単体では難しい理由

スマートフォン単体のみで、難しい理由は、マイクの問題です。これにより

  • スマートフォン単体では難しい
  • お話しする方に協力いただく必要がある

この二点が発生します。音声認識技術を活用するには、一人の力で完結するものではなく、他の人にご協力をいただく事で、状況を改善させる事ができます。

スマートフォン単体では難しい

結論からいいますと、スマートフォンは、電話をする事が主体になっているため、音声認識がしにくい状態であると言えます。スマートフォン単体で、音声認識を行う場合、端末そのものの形状により、音声認識そのものがしにくくなります。

スマートフォンは、電話の延長線上にあるものであり、活用用途は、電話をする事をベースに考えられています。その点から、マイクが必ず、使用者に向きます。ここが、音声認識を活用するうえで、気をつけないといけない点であり、欠点となります。写真で表現しますとこのようになります。

devis

画像の中で起動させているのは、UDトークという音声認識アプリです。個人的には、現状では、最も優れた音声認識アプリだと考えています。これには、

  • 音声認識の精度
  • 双方にとって使い勝手が良い

この二点があります。ひと言でいいますと、音声認識技術を活用する仕組みがしっかりしている優れたアプリです。ソフトバンクのアプリは、試せていない状態なの、一抹の不安はありますが……。

さて、話しを戻しまして……。一般的に自分でスマートフォンを持つと上記の図のようになります。その際、マイクは、下の位置にあります。スマートフォンは、電話も行うディバイスですので、マイクが必ず下に来ます。電話の際は、そのマイクに話して、音声を相手に送ります。

しかし、音声認識技術を活用する場合、相手の声を理解したいので自分にマイクを向けても仕方がありません。そして、マイクを自分に向けた状態ですと音量がかなり小さくなってしまい、有効に音声を入れる事ができなくなります。その結果、認識できなかったり、誤変換の元となります。

すると、次に行うのは、このようになります。

devis2

このようにマイクを相手に向けます。しかし、画像の通りですが、マイクを相手に向けたとしても画面はその通りに切り替わりません。仮に聞こえにくい方が使用する場合、これでは、使用しづらいままになります。本当は、回転できれば(自分側の向きになれば)、良いと思うのですが、なかなかそうはなりませんね。

相手に協力いただく必要がある理由

では、この問題を自分の向きに回転できるようにする事によって、仮に解決できた場合、音声認識技術の精度は、良くなるかを考えますと、良くなる事はある反面、それでも難しいところは、出てくるのではないかと思っています。

音声認識技術で大切なのは、マイクの部分です。できるだけ口元にマイクを持っていく事で、理解しやすい(はっきりとした)音声をシステムに送りやすくなります。その結果、音声認識技術で理解しやすくなり、必要としている人も理解しやすくなります。

この場合、仮にこの問題を解決しても、マイクの部分をできるだけ口元に持っていくという動作(問題)は、変わりません。状況別にいいますと、初対面の人には、行いにくく、ある程度認識がある方には、行いやすいと考えられます。

初対面、あるいは、そのような機器がわからない方から、いきなりスマートフォンを口元に持ってこられれば、警戒しますし、びっくりします。一方、理解されている方であれば、活用する事で、より理解しやすくなる可能性はあります。

このような点から、音声認識技術には、相手のご協力、あるいは、相手の受容(ご協力)が必要となります。

各社が試みている事

音声認識技術のアプリを出している各社の動向を見てみますと、スマートフォンにマイクを別途使用したり、スマートフォンそのものをWifi、あるいは、Bluetoothで通信し合い、理解したい側の方のスマートフォンをディスプレイ、お話ししたい方のスマートフォンをマイクのみの機能にし、音声認識技術を活用しているのが伺えます。このようにしているのは、まさに、マイクが重要だからだという証拠でもあります。そして、そのような事をする場合、必ず相手の方にご協力いただく必要が出てきます。

各社の動向から見えるのは、マイクをどのようにするか、また、どのようにしたらより活用しやすくなるかになります。もし、音声認識アプリの活用を考えている場合は、マイクをどのようにするかは、考えなければならない課題とも言えますね。その際は、テレビのMCが持っているマイクのようなものを繋いでも良いですし、その他のマイクを繋いでも良いです。それ以外には、Wifi、あるいは、Bluetoothで繋いでも良いでしょう(※対応できるアプリに限ります)。

ただ、そのためには、相手の方にもご協力をいただく必要が出てきます。マイクであれば、持っていただく、あるいは、そのマイクに話しかけていただく必要がありますし、WifiやBluetoothでは、その方のスマートフォンにも操作、設定が必要です。

もちろん、使い方、あるいは、活用する仕組みに関しても考えていく必要があります。このような内容を考えて活用するのが、音声認識アプリです。

スマートフォンにあるアプリという事で、スマートフォンのみで完結しそうに感じるかもしれませんが、音声認識技術は、スマートフォン単体のみで活用するのは、難しいのが現状です。しっかり使いこなすには、マイク(音声をどうしっかり認識させるか)についてしっかり考える必要があります。

こちらの内容が理解に役立てば幸いです。

 

この内容をご覧になった方は、こちらの内容もお勧めです。

リンク:グループ会話をテキスト化するアプリ登場

リンク:音を振動やライトで教えてくれるアプリOtoSense

リンク:補聴器落下防止器具は必要?原因から紛失防止策を考える

リンク:自立コムサイト一新、サイト上から商品を借りれるように!

Pocket

この記事を書いた人:深井 順一
自己紹介
聞こえにくい人を支援するお店、パートナーズ補聴器、代表。生まれつきの難聴者である事、補聴器の販売をしている事、この二つの視点で、ブログを書いています。お店では、耳の状態を理解した後、効果的な補い方を導き出し、お客様の聞こえを改善しています。私に関する内容は、書いている人の詳細をご覧下さい。当店の特徴は、こちらです。場所は、東京都墨田区の本所吾妻橋駅(都営浅草線)より徒歩3分のところにあります。

補聴器で耳を改善させる手引き書、作りました

聞こえにくい事でお悩みの方のために、補聴器で耳を改善させる手引き書を用意しました。

  • 自分の症状に合う補聴器は何か
  • 自分の聴力に合う補聴器は何か
  • 補聴器の種類、性能、違いを知りたい

などお考えでしたら、こちらをご覧下さい。補聴器で耳を改善させる内容のみに絞って記載してみました。お役に立てば幸いです。

お困りごとのご相談、承ります

Webサイトに訪れる方のご要望にお応えするため、東京都墨田区に店舗を構えました。

  • 聞こえにくい事で困っている
  • どこに相談したら良いかわからない
  • お使いの補聴器でうまく聞こえない

などお悩みがございましたら、お気軽にご相談下さい。当店で行なっていること、よくいただくご相談は、リンク先の通りです。

〜更新情報のお知らせ〜
こちらのいずれかにご登録いただきますと更新時、お知らせします。お気軽にご登録ください。なお、Twitterでは、私自身が興味を持った記事や自分のエントリーについてツイートしています。もしよろしければフォロー、ご登録いただけるとうれしいです!
検索フォーム