検索エンジンは、情報と誤った情報の歪んだブレンドを提供することがよくあります。 Crispin la valiente / Goment via Getty Images, BY-ND CC
検索エンジンは、情報や人々への社会の主要なゲートウェイのXNUMXつですが、誤った情報の経路でもあります。 に似ている 問題のあるソーシャルメディアアルゴリズム、検索エンジンは、あなたや他の人が以前にクリックしたものを提供することを学びます。 人々はセンセーショナルなことに惹かれるので、アルゴリズムと人間性の間のこのダンスは、誤った情報の拡散を助長する可能性があります。
検索エンジン会社は、ほとんどのオンラインサービスと同様に、広告を販売するだけでなく、ユーザーを追跡してデータを販売することで収益を上げています。 リアルタイムビッダーを通じて その上に。 人々は、センセーショナルで面白いニュースへの欲求や、物議を醸す情報や自分の見解を裏付ける情報によって、誤った情報に導かれることがよくあります。 ある研究によると、糖尿病に関するより人気のあるYouTube動画は 医学的に有効な情報を持っている可能性が低い たとえば、このテーマに関するあまり人気のないビデオよりも。
ソーシャルメディアプラットフォームのような広告主導の検索エンジンは、検索会社がビジネス指標を高めるのに役立つため、魅力的なリンクをクリックすることで報酬を得るように設計されています。 研究者として 検索および推奨システムを研究します、私と私の同僚は、企業の利益の動機と個人の感受性のこの危険な組み合わせを示しています 問題の修正が困難になります.
検索結果がうまくいかない方法
検索結果をクリックすると、検索アルゴリズムは、クリックしたリンクが検索クエリに関連していることを学習します。 これは呼ばれます 関連性のフィードバック。 このフィードバックは、検索エンジンが将来そのクエリに対してそのリンクにより高い重みを与えるのに役立ちます。 十分な数の人がそのリンクを十分な回数クリックして、関連性の高いフィードバックを提供すると、そのWebサイトは、そのリンクおよび関連するクエリの検索結果で上位に表示され始めます。
人々は 上に表示されたリンクをクリックする可能性が高くなります 検索結果リストにあります。 これにより、正のフィードバックループが作成されます。つまり、Webサイトが高く表示されるほどクリック数が多くなり、その結果、そのWebサイトがより高く移動するか、より高く維持されます。 検索エンジン最適化技術は、この知識を使用してWebサイトの可視性を高めます。
この誤った情報の問題には、検索アルゴリズムがどのように評価されるか、そして人間が見出し、タイトル、スニペットにどのように反応するかというXNUMXつの側面があります。 ほとんどのオンラインサービスと同様に、検索エンジンは一連の指標を使用して判断されます。そのXNUMXつがユーザーエンゲージメントです。 あなたが読みたい、見たい、または単にクリックしたいものをあなたに与えることは、検索エンジン会社の最大の利益です。 したがって、検索エンジンまたは任意のレコメンデーションシステムが提示するアイテムのリストを作成すると、アイテムをクリックする可能性が計算されます。
従来、これは最も関連性の高い情報を引き出すことを目的としていました。 しかし、人々が検索を使用して検索を行っているため、関連性の概念はあいまいになっています 面白い検索結果と真に関連性のある情報.
あなたがピアノ調律師を探していると想像してみてください。 誰かがあなたにピアノを弾く猫のビデオを見せたら、あなたはそれをクリックしますか? たとえそれがピアノの調律とは何の関係もないとしても、多くの人はそうするでしょう。 検索サービスは、肯定的な関連性のフィードバックで検証されたと感じ、人々がピアノ調律師を検索するときにピアノを弾いている猫を見せても問題ないことを学びます。
実際、多くの場合、関連する結果を表示するよりも優れています。 人々は面白い猫の動画を見るのが好きで、検索システムはより多くのクリックとユーザーエンゲージメントを獲得します。
これは無害に見えるかもしれません。 では、人々が時々気を散らして、検索クエリに関係のない結果をクリックした場合はどうなるでしょうか。 問題は、人々が刺激的なイメージとセンセーショナルな見出しに惹かれるということです。 彼ら 陰謀説やセンセーショナルなニュースをクリックする傾向があります、ピアノを弾く猫だけでなく、そうする 実際のニュースをクリックするだけではありません または関連情報。
有名だが偽のクモ
2018年、「新しい致命的なクモ」を検索 グーグルで急上昇 新しい致命的なクモが複数の州で数人を殺したと主張したFacebookの投稿に続いて。 私の同僚と私は、このトレンドクエリの最初の週に「新しい致命的なクモ」を検索したGoogle検索の上位100件の結果を分析しました。
チラグ・シャー, BY-ND CC
この話が判明しました 偽物だった、しかしそれを探している人々は、元の偽の投稿に関連する誤った情報に大部分さらされていました。 人々がその誤った情報をクリックして共有し続けると、Googleは検索結果の上部にそれらのページを提供し続けました。
このスリリングで未確認のストーリーが出現し、人々がそれらをクリックするというパターンは続いており、人々は明らかに真実に関心がないか、Google検索などの信頼できるサービスがこれらのストーリーを表示している場合はストーリーが真実でなければならないと信じています。 最近では、 反証された報告 中国がコロナウイルスを研究室から漏らしたと主張することは、この悪循環のために検索エンジンで勢いを増した。
誤った情報を見つける
人々が正確な情報と誤った情報をどれだけうまく区別するかをテストするために、私たちは「グーグルかどうか。」 このオンラインゲームは、同じクエリに対してXNUMXセットの結果を表示します。 目的は単純です–信頼できる、信頼できる、または最も関連性のあるセットを選択してください。
チラグ・シャー, BY-ND CC
これらの2,100つのセットの30つには、XNUMXつまたはXNUMXつの結果があり、それらは検証され、誤った情報または暴かれたストーリーとしてラベル付けされます。 ゲームを公開し、さまざまなソーシャルメディアチャネルを通じて宣伝しました。 全体として、XNUMXか国以上からXNUMX件の回答を収集しました。
結果を分析したところ、 人々が誤ってセットを信頼できるものとして選んだ時間の約半分で、XNUMXつかXNUMXつの誤った情報の結果が出ました。 何百人もの他のユーザーを何度も繰り返して行った実験でも、同様の結果が得られました。 言い換えれば、人々が陰謀説や偽のニュースを含む結果を選んでいる時間の約半分です。 より多くの人々がこれらの不正確で誤解を招く結果を選ぶにつれて、検索エンジンはそれが人々が望んでいるものであることを学びます。
ビッグテックの規制と自主規制の問題はさておき、人々がこれらのシステムがどのように機能し、どのようにお金を稼ぐかを理解することが重要です。 そうでなければ、市場経済と人目を引くリンクに引き付けられるという人々の自然な傾向は、悪循環を続けます。
著者について
Chirag Shah、情報科学の准教授、 ワシントン大学
この記事はから再公開されます 会話 クリエイティブコモンズライセンスの下で 読む 原著.