Talk To Meコンピュータ:音声コントロールがオフになっています

予期せぬパッケージがあなたのドアの上に現れ始める場合は、あなたのスマートデバイスの1つに言葉を言いたいかもしれません。

今月初め、ダラスの6歳の女性が、 アマゾンエコー 人形館のためのスマートなスピーカー。 AmazonのSiriのような人工アシスタントのAlexaはすぐに 家に注文した.

サンディエゴテレビのニュース番組がこの話を拾い上げ、ニュースアンカーの1人がコメントしたときに誤ってそれを繰り返した。「私は、「Alexaは私に人形館を注文する」と言って、この小さな女の子を愛している」これを聞いて、サンディエゴ より多くの人形館を購入しようとした.

CW6 San Diegoは、Alexaの偶然のドールハウスの購入に関するニュースを報じています。

{youtube}oI2KLIULjXc{/youtube}

AppleのSiriやMicrosoftのCortanaとの会話をしようとしている人には、話が聞こえるかもしれない。 私たちのデバイスは、私たちの声を聞くことでかなり上手くなりましたが、それは必ずしも彼らが理解しているとは限りません。

マイクロソフトの研究者は、最近、これを今日の話すインタフェースの潜在的な問題として特定しました。彼らは巧妙なジョークと世俗的な知識を持つ「インテリジェントな」アシスタントとして販売されていますが、


インナーセルフ購読グラフィック


小規模な研究研究者は、時間の経過とともにデジタルアシスタントと話を続けた人々は、最も低い期待で始まった人々であることを発見しました。

音声インターフェイスは実際に何をしますか?

音声インターフェイスを話すときは、次のことが必要です。

  • あなたの声の音を聞き取り、それをバックグラウンドノイズと区別する
  • "umms"と "ahhs"を無視して、それぞれの単語の始まりと終わりを把握してください
  • 各単語の音を辞書内の単語にマッチさせ、文脈から正しいものをピックします ホモフォン
  • 文全体の意味を正しく解釈する
  • あなたの要求に合った意味のある有用な応答を生成します。

これらはいずれも複雑な技術課題であり、さまざまなテクノロジー企業がさまざまな分野で進歩を遂げています。

Google Nowは、Googleのサービスを利用している場合、ウェブに関するデータやGoogleの個人的な活動の恩恵を受けるため、さまざまなリクエストに対して適切な回答を出すことができます。

Amazon Echoは、雑音を除去する遠距離場マイクロホンアレイのおかげで、騒々しい部屋からのあなたの要求を聞くのに特に優れています。 もちろん、Amazonで購入することもできます。

ここ数年の間に、音声インターフェイスは、たやすく慎重に言葉で指示されたコマンドではなく、日常的な「自然な」スピーチを理解する上で非常によくなってきました。 「Australian Openでプレーしている人」のような簡単なクエリを扱うのは依然として優れており、「今年初めてAustralian Openでプレイしている人」などのより複雑な要求に苦しむ傾向があります。 "決勝戦には雨が降るだろうか?"

Siriは40の言語や方言をサポートしていますが、今のところAlexaは英語とドイツ語しか利用できません。 しかし、これらの機能はすべて着実に向上しています。

音声インターフェイスが吃音する場所

このように、映画で予測されているように、音声インタフェースはすぐに私たちの技術のすべてを引き継ぐでしょう 彼女? 技術調査会社のガートナーは、 予測している 来年までに、技術との対話の30%は音声対応のインターフェイスとの会話になるでしょう。

しかし、音声インタフェースには限界があり、そのすべてがより良い技術で解決できるわけではありません。

ボイスは、スパイク・ジョンズの映画「彼女」のテクノロジとのインターフェイスの中心的な手段です。

{youtube}ne6p6MfLBxc{/youtube}

騒音公害は一つの大きなハードルです。 あなたのデバイスはあなたの周りの周囲の騒音からあなたが言っているものを区別することができますか? ノイズリダクション、パーソナライズされた音声認識、リップリーディングなど、テクノロジーがこれを支援します。

しかし、あなたのスマートデバイスと話すことによって他人のために作り出している背景ノイズはどうですか? オフィスや飛行機の隣に座っている人が読もうとしているときにSiriとチャットをすると、音声インターフェイスが常に社会的に受け入れられるとは限らないことがわかります。

もう1つの問題は、音声インタフェースの精神的な要求から来ています。 音声ベースのシステムを使用することを学ぶことは、特に画面がない場合、Amazon Echoの場合のように、難しい場合があります。

これまでに銀行や電話会社に電話をしたことがある人は、必要なものを待っている間にすべてのオプションから合成音声リストを聴いてミックスしないようにして集中と退屈という悲惨な組み合わせを知っていますアップ。 従来のグラフィカルインターフェイスでは、使用可能なオプションを表示して選択肢をすばやくタップすることで、この問題を回避しています。

音声コマンドを学んだら、それらを使用すると気を散らすことができます。 研究者は、音声コマンド 思考の列車を脱線させる マウスとキーボード以上のもの

これは、車載用の音声インタフェースでは特に危険です。ユタ大学の研究では、ドライバが 27秒まで注意散漫 音声コマンドを使用した後

ユタ大学/交通安全研究のためのAAA基金

{vimeo} 108281698 {/ vimeo}

その声を見つける?

だから、音声インタフェースは完全に引き継がれることはありませんが、彼らは私たちの生活の中で有用なニッチを見つけるでしょう。 彼らは車でよく使われているので、技術が向上するにつれて混乱を避けることができます。

キッチンでは、あなたの手が忙しい料理である間に、レシピを使ってあなたに話したり、買い物リストを更新したりするようAlexaに頼むことができます。 バーチャルで拡張されたリアリティでは、音声インターフェイスにより、手が全く見えないときにシステムを制御できます。

語学学習では、発音を練習するために使用できます。 最も重要なのは、音声インターフェイスは、障害を克服するための運動障害、RSIまたは失読症を持つユーザーを支援することです。

音声インターフェイスは待望の技術であり、最終的に自分の時間が来たと考える良い理由があります。 ただ、彼らはまだ彼らが聞こえるほど巧妙ではないかもしれないことを覚えておいてください。 また、子供がいる場合は、音声購入にPINコードを付けることもできます。

会話

著者について

フレーザー・アリソン、ヒューマン・コンピュータインタラクションのPhD受験者、 メルボルン大学

この記事は、最初に公開された 会話。 読む 原著.

関連アイテム

{amazonWS:searchindex = KindleStore;キーワード= AmazonEcho "target =" _ blank "rel =" nofollow noopener "> InnerSelfMarketとAmazon