IT・AIなどのテクノロジー

ソフトバンクが音声認識を利用したこえ文字トークを発表

ソフトバンク株式会社が音声認識を利用した会話アプリを出したようです。その名も「こえ文字トーク」。こちらは、スマートフォンに入った音声を文字にして、ディスプレイに写し出してくれるアプリです。この手のものは、多くなってきましたね。記録もかねて、こちらに記載していきます。気になった方は、使用してみては、いかがでしょうか。

手っ取り早く知りたい場合は、ソフトバンクのWebサイトをご覧いただく事をお勧めします。

リンク:ソフトバンク こえ文字トーク

こえ文字トーク

こえ文字トークのイメージ図は、こんな感じです。

sound-talk

ソフトバンク株式会社 こえ文字トークより引用

私自身、使用しようとしましたが……

sound-foto

Android4.1以上(5.1)ですが、使用できず。ネクサス5のsimフリースマホなのですが、どうも使用できません……。という事で、検証なしで、以下記載していきます。

なお、初めに記載しますと、このアプリの対象機種は、Android4.1以上、iOS8.0以上(※一部使用できない端末あり)しかし、動作に関しては、ソフトバンクで契約したスマートフォンのみ、動作保障をしています。

さて、本編です。

こえ文字トークの特徴は、グループでも使用が可能なところになります。一部の音声認識(UDトーク)でも、グループ使用が可能ですが、こえ文字トークでもできるようです。基本的な内容は、

  • 一対一で使用する
  • グループで使用する
  • スマホをマイク代わりにできる

の三つがあります。料金は、基本無料、スマホをマイク変わりにする事のみ、有料になります。料金はiOS 360円(税込)、Android 324円(税込)です。

音声認識アプリというよりも、スマートフォンを活用して、聴覚障害の方をサポートするアプリと言う方が、イメージとしては、わかりやすいかもしれません。

一対一で使用する

相手のお話しを自分のスマートフォンで認識し、音声を文字にしてくれます。アプリをダウンロードしたスマホに話しかける事で、音声を文字に変換できるようです。この点は、他の音声認識アプリと同様ですね。

やり方としては、ご自身のスマートフォンでアプリを立ち上げ、その中にあるマイクボタンを押し、音声認識を起動させた後、話しかける事によって音声を文字に変更します。そして、その文字を見て、理解する……という流れです。

大抵の音声認識アプリでは、マイク入力を自分で操作する事が多くなります。

グループで使用する

グループで使用する場合、Androidであれば、Android同士、iOSであれば、iOS同士で行う必要(制限)があるようですが、このアプリでも複数の人で使用する事ができるようです。

どのような感じになるのかは、使用してみなければわかりませんが、少々気になりますね。絵だけを見ると、複数使用の場合は、予めアプリをインストールしておき、自分のディバイス(Android、iOS)に話す事でできるように見えます。わかりにくい表現ですが、使用する人というよりお話しする人もインストールが必要のように思えます。こちらは、未確認です。

スマホをマイク代わりにできる

スマートフォンのマイクで拾った音を大きくさせる事で、疑似集音器のような働きをさせる事も可能のようです。有料ではありますが、このような動作もできます。

まとめ

このアプリは、

  • 一対一で使用する
  • グループで使用する
  • スマホをマイク代わりにできる

という特徴があります。一つのアプリで色々できるようになっていますね。すごいです。

ご自身のスマートフォンが対応するのであれば、一度使用してみてはいかがでしょうか。音声認識は、使い方を考えないといけない点はありますが、音声が文字になって可視できるというのは、耳が聞こえにくい方にとっては、非常に期待される技術です。

感想

このアプリを見て感じたのは、可能なら、一対一で会話する場合においても二つのパターンがあると良いかもしれないと思いました。

一つは、自分自身でアプリを起動して行う自己完結型、もう一つは、予めお話しする方にもアプリをインストールさせておき、二つの機器を同期して、役割分担する(マイクと文字表示の役割を分担、言い換えれば、マイクとディスプレイの分担ともいえますね)同期型です。一対一でも、この二つが使えるようになると、より良くなるのではないかとも思います。

私が思った同期型とは、聞こえにくい方のみが、アプリをインストールするのではなく、一対一で会話する場合においても、音声を聞き取りたい方(お話しする側)のディバイスにアプリをインストールしておく事で、その方のディバイスを使って、音声認識ができる仕組みを作るというものです。

この際、使用するベースは、一対一で使用するベースで良いと思います。独立したUIにできるのでしたら、それが最もベストですが、試験的に行うのでしたら、ベースは、同様でもよさそうです。

音声認識を利用する際、注意が必要なのは、マイクです。言い換えれば、どのように音声を認識させるかになります。こちらにより、精密度は、格段に変化します。仮にアプリで、二つの機器を同期する事が可能になれば、話しかける側のディバイスをマイク代わりにし、そして、その音声を音声認識で理解したい方のディスプレイに文字化したものを表現する方が、精密度、理解度も変わってくるのではないかと考えました。

今現在、耳にイヤホンを差し込み、電話のように使うというより、スマートフォンに向かって話す仕草をしている方も多く、そこまで大きな心理的負担、あるいは、違和感もないように感じます。であれば、この流れの内にできるというのもポイントです。もしかしたら、どこかでは、もうこのような取り組みをしているかもしれませんね。

音声認識は、どのように認識するかでも大きく成果が異なります。そのため、マイクの部分は、よく考える必要があります。このように状況によって変化できると、より密度を上げられるのではないかと思いました。

また、親しい人同士であれば、あるいは、理解がある方同士であれば、インストールしていただくハードルは、低いとも考えられます。親しい人達同士であれば、より理解しやすく、そうでない場合に関しては、そのまま使用できるようにするという使い分けができると、音声認識の力を+αできると考えています。

あとがき

ソフトバンクがアプリを出したという事で、書いてみました。私自身のスマホでは、ダウンロードできないため、どのようなものなのかがわかりませんでしたが、紹介と記録を残すという意味で記載しました。

音声認識技術も徐々に発達してきた事から、このような製品も増えてきましたね。今後もたくさん出てくると考えられますので、またその際は、紹介したいと思います。

気になったら試してみるのもお勧めです。

 

この内容をご覧になった方は、こちらの内容もお勧めです。

リンク:遂に3Dスキャンにて耳型採取をするところが出た

リンク:発話障害を音声認識で改善させるTalkitt

リンク:音声をリアルタイムで翻訳するCaptioning on Glass

リンク:新たな手話通訳、Google Gestureが創り出す繋がる世界

ABOUT ME
深井 順一
聞こえにくい人を支援するお店、パートナーズ補聴器、代表。生まれつきの難聴者で補聴器を使っている事、補聴器の販売を行っている事、この二つの視点で、ブログを書いたり、補聴器のご相談をしています。書いている人の詳細は、こちら。お店に関しては、こちらに詳細を書いています。お店の場所は、東京都墨田区、都営浅草線本所吾妻橋駅より徒歩2分のところに、あります。
補聴器で聞きにくさを改善する方法、まとめました

聞きにくさがあり、お悩みの方のために、補聴器で聞きにくさを改善する方法をまとめてみました。

書いてある内容は?
  • 難聴の症状別に、どう補聴器で改善すると良いか
  • 補聴器の基本から、種類の特徴、金額による違い
  • ご自身に適した補聴器の選び方

聞きにくさにお悩みの方は、参考にしてみてください。また、お客様の改善事例には、実際の耳の状態から、実際に改善させた方法を中心に記載しています。

補聴器の改善まとめお客様の改善事例

なお、お店に関する内容は、以下にまとめています。そして、ご来店いただいた方の当店の評価もまとめてみました。

お店の特徴を見るお客様の評価一覧