アンオフィシャル - Aldebaran Robotics NAO とそのほかロボットについて

NAO とそのほかロボットについての情報を発信。ここの情報はアルデバラン非公式です。内容に誤りがあった場合はごめんなさい。

Aldebaran Robotics 社の NAO、そのほかロボットに関連する情報を発信します。

NAO の音声認識と音声合成機能について

NAO には標準機能として、音声認識音声合成の機能が備わっています。

複数言語に対応しており、日本語にも対応しています。

デベロッパープログラムで入手した NAO には現状2カ国語までインストールすることができるようになっています。言語の切り替えは、パソコンから NAO にアクセス、設定画面を通して適時行うことができます。

言語を切り替えることで、NAO はその言語用に最適化された音声設定に切り替わります。以降、システムメッセージはこの言語を使って伝えられ、アプリはその言語に対応している場合、この言語で会話をするようになります。

 

音声認識はあらかじめアプリ内で用意しておいた複数のキーワードのうち、どれに一番近い音声を聞き取ったかということをアプリが音声認識システムから取得することにより行います。 例えば、あらかじめ ”はい” 、と ”いいえ” というキーワードを設定しておき、音声認識を開始する前に “ダンスを踊りましょうか?” と発声します。その後、音声認識を開始し、”はい”、”いいえ” のどちらが伝えられたかを判定、これによって以降の処理を分岐するといった具合で使います。

あらかじめ用意されたキーワードしか受け付けられないというのは何かと不便ではあります。アプリ側では例えば “ダンスを踊りましょうか? はい、か、いいえ、で答えてください” みたいな感じで期待通りの応答をしてもらえるよう工夫をする必要があるかもしれません。

 

音声認識音声合成技術は今後ロボットと人間との間のインターフェースとしての重要な役割を担っていくと考えられます。実は NAO に搭載されている音声認識音声合成の技術は iPhone の音声アシスタント機能である Siri の技術を提供している Nuance Communications 社より技術提供を受け実現をしています。また、つい最近 Nuance Communications 社 と Aldebaran Robotics 社は NAO に搭載する音声認識音声合成技術をより進化したものに発展させるべく協業していることを発表しました。

 

http://www.aldebaran-robotics.com/pressroom/Press_release_-_Aldebaran_Robotics_EN_29-10-2013.pdf

 

Aldebaran、Nuanceの音声認識技術をヒト型ロボット「NAO」に搭載 | マイナビニュース

 

2014年には出るらしい、この新しい機能、詳細はわたしも知らないのですが、ロボットとより自然に会話ができるようになる時代はもうすぐそこに来ているのかも知れません。