アンオフィシャル - Aldebaran Robotics NAO とそのほかロボットについて

NAO とそのほかロボットについての情報を発信。ここの情報はアルデバラン非公式です。内容に誤りがあった場合はごめんなさい。

Aldebaran Robotics 社の NAO、そのほかロボットに関連する情報を発信します。

NAO のアプリ開発フレームワークが提供する標準モジュール トップ6 (4位 ~ 6位)

f:id:takuji_kawata:20140115160929j:plain

前回の続きです。今回は 4位から6位の発表です。 なお、この順位は完全にわたしの個人的な意見に基づくもので、何ら Aldebaran Robotics 社からの何らかのドキュメントや発表に基づいたものというわけではないことをご理解いただければと思います。 

 

4. ALTextToSpeech

NAO に言葉をしゃべらせる機能を提供します。この機能については、前回「NAO の音声認識と音声合成機能について」でも紹介しているので、こちらも参照いただければと思います。

ちなみに NAO の口にあたるスピーカーは顔の両サイドにある人間でいう耳の部分になります。 また目にあたるカメラはおでこのところにある小さな穴と、人でいう口の部分にあたるところにある小さな穴の2か所。耳に当たるマイクは頭の四方についています。 NAO の頭は人間と似たパーツの作りになっていますが、それぞれのパーツの役割は人間のそれとは結構異なっています。 単に手本となる対象になるべく近づけるというアプローチではなく、状況に応じて思い切って独自の変更を加えるデザインに対する思いっきりの良さ、さすがフランスの会社だなって気がします。

 

5. ALSpeechRecognition

NAO に人の言葉を理解する機能を提供します。

こちらも 前回「NAO の音声認識と音声合成機能について」でも紹介した機能です。

NAO は言葉を話すだけでなく、人が話した言葉を理解する機能も標準で備えています。 日本語だって理解できます。 日本語以外にも、英語、フランス語、など多カ国語について、しゃべる、と聞く、の機能を備える NAO。 インターナショナルです。 現状、NAO を最初にセットアップするときに、任意の2か国語を本体に設定する必要があり、以降、一体のNAOが扱える言語はこの設定した2言語のいずれかです。 通常は英語 + 母国語 という設定になると思います。 

キーボードやマウスを持たない NAO、 インターフェースをとるうえで、音声認識は一つの重要な機能といえます。 個人的には現状 NAO の「耳が遠い」ことについて若干の不満があります。 結構 NAO の耳元(マイクの近く)で話さないと NAO はうまく言葉を認識してくれないのです。 おそらく NAO 以外と話している会話や、雑音を極力誤って拾わないようにチューニングされた結果なんだと思いますが、できれば普通に人と話すように NAO とコミュニケーションをとりたいものです。 たとえば 声を発している人と目があっている間だけ音声認識を行うとか、なにか工夫のしようはありそうです。

 「NAO の音声認識と音声合成機能について」でもあったようにこのあたりの機能は今後改善されるようですので、今後の動向に期待です。

 

6. ALAudioPlayer

NAO が音楽ファイルを再生する機能を提供します。

このモジュールを使うことで wav ファイルなどの音楽ファイルを再生することができます。

効果音を発したり、あらかじめレコーディングしておいた音声を再生したりと使い方は様々です。 

音声合成による文章の読み上げはどうしても単調になりがちです。 ボリュームを変化させたり、言葉と言葉の間に間隔をあけたりと工夫のしようは色々とありますが、物語を読み聞かせるような用途のためには、人をひきつけ、飽きさせないために、これらを組み合わせた洗練されたテクニックが必要です。

もしあらかじめレコーディングされた音声データがあるのであれば、音声合成ではなく、このレコーディングされた音声を聞かせるというのは一つの有効なテクニックです。

また音楽にあわせて NAO を躍らせるようなアプリであれば、その音楽を NAO 本体で再生しながら、NAO にダンスを躍らせるというのが、音楽との同期という点でも、設備が最小限で済むという点においても最もシンプルで汎用性のある手法といえます。