このシステムで最大のポイントとなるのは、音声認識と視線入力を併用していることだ。たとえばドアを開けるコマンドを発する場合、音声認識だけだと「Open the right door.(右のドアを開けて)」と開けたいドアを音声で指定する必要があった。これに視線入力を加えれば、開けたいドアの方向を見ながら「Open the door.(ドアを開けて)」といえば、希望するドアを明けることができる。これは窓を開ける時などでも有効だ。
さらに、デモでは外側の風景と連動してコマンドをこなすことができる。たとえば、見ていると思われる建物が何であるかを知りたい時、その建物を見ながら「What is this building?(この建物は何ですか?)」と発話すると答えが出てくる。その様子は本当にガイドが横に座って答えてくれているかのようだ。