あなたが幸せか悲しいかどうかをインターネットがどのように知っているか

幸せまたは悲しい5 28

Facebookであなたの友人と共有したことを今日考えてみてください。 それは「ストレス」「失敗」、あるいは「喜び」「愛」「興奮」の気持ちでしたか? 私たちがソーシャルメディアに投稿するたびに、私たちは気分の痕跡を残します。 会話

私たちの感情は貴重な商品であり、多くの企業がセンチメント分析と呼ばれるプロセスでそれを認識するための自動ツールを開発しています。

最近、漏洩した報告書 明らかになった 若者が脆弱だと感じる時期はFacebookが特定できるが、 分析を使わなかったと主張した 広告でユーザーをターゲットに設定する フェイスブック また謝罪した 2014で 実験 「ポジティブ」または「ネガティブ」のいずれかの感情を伴う投稿がユーザーのフィードから除外された「感情的伝染」について

明らかに、テキストから感情を検出する能力は、ソーシャルメディア企業や広告主にとって大きな関心事です。 しかし、感情分析はどのように機能し、なぜ有用であり、何が危険であるか?

感情分析はどのように機能しますか?

Facebook自身のアルゴリズムの詳細は公式には知られていませんが、ほとんどのセンチメント分析手法は監督されているか監督されていないという2つのカテゴリに分類されます。

監督された方法は、ラベル付けされたデータに依存する。 言い換えれば、これらは正または負の感情を含んでいると手動で分類された投稿です。

次いで、統計的方法を用いてモデルを訓練し、例えば「ストレス」または「リラックス」などの予め特定された単語またはフレーズの存在に基づいて新しい記事を自動的に分類する。

一方、教師なしの方法は、異なる単語のスコアの辞書を構築することにしばしば依存する。 1つのそのような辞書 私の共同作業者が開発した1の9をさまざまな言葉に8.06の幸福度を付けて、平均した結果、「虹」は2.52、「役に立たない」はXNUMXを得ました。

次に、フレーズの全体的な感情は、ポスト内のすべての単語を見ることによって得点を付けることができる。 例えば、「私のママはいつも「人生はチョコレートの箱のようだ」」というこのポストの平均得点は、この辞書によると平均以上の6.02であり、それが肯定的な感情を表していることを示唆している。

センチメント分析とは何ですか?

センチメント分析は、 傾向を調査し、製品の推奨事項を作成する.

新しい携帯電話がリリースされたとしましょう。 電話に関するソーシャルメディアの記事のセンチメント分析は、企業の実績をリアルタイムで把握する貴重な貴重な情報源となります。

感情分析には幅広いアプリケーションがあります。 研究者は最近 彼の大統領選の最初の100日にドナルド・トランプのTwitterの感情を追跡   マーケットトレードを行うためのボットを構築 彼が特定の企業について積極的にまたは否定的につぶやくとき。

科学者は他のテキストの感情的な傾向も追跡できます。 たとえば、感情分析を使用して、脚本を通して1,000以上の映画の感情的な弧を研究しました。 2013 DisneyフィルムFrozenの弧を下に示します。

プライバシー 映画のための感情的な凍結。

多くの映画は、最終的な解像度とハッピーエンディングの前に、映画の中で特に大きな谷の80%(すべての希望が失われています!)が続き、規則的なピークと緊張の谷と同様のパターンを示しています。 同様の分析を小説に適用すると、 ほとんどの物語は、6つの基本的なストーリーアーク.

感情分析ではそれほど優れていません

センチメント分析は、しばしばソーシャルメディアの投稿に依存しているため、大きな倫理的懸念が生じます。 この議論は始まったばかりです。 しかし、言語と意味の複雑な性質は、誤りを起こしやすくなります。

私たちの辞書の分析を使って5.35を得点する「あなたと一緒にいてもいいですか? どのスターウォーズファンにとっても、それはもちろん、非常に肯定的なフレーズですが、「力」という言葉が平均以下の4.0と評価されたため、私たちのテストでは控えめなスコアでした。

これは孤立してこの単語を評価するときに理解できますが、文脈では意味がありません。

したがって、Facebookのセンチメント分析機能の妥当性に対するいくつかの疑念が正当化されています。 口語訳のフレーズであるFacebookに何かを「完全に病気」として記述すると、個人の感情状態が誤って分類される可能性があることは完全に考えられます。

感情分析がいつ行われるかを理解するには、特定の結果を導く言葉を調べることが重要です。

これを行うために、私たちは "ワードシフト"ダイアグラムは、以下のようなものです。 これは、 "悲しみ"と "恐怖"の言及が多いが、奇妙なことに、より美しい "悲しみ"という言葉が、幸せな結末より悲しい脚本のクライマックスを作り出した言葉を示している。

プライバシー 冷凍のクライマックスとそのハッピーエンドを比較したプロット。 チャートの上部にある青色のバーは、得点差の上位の貢献語を示しています。

約束と警告

感情分析は強力なツールですが、それは若い科学であり、慎重に使用する必要があります。

科学者は、「フードの下で」仲間を呼んで、特定のアルゴリズムがなぜ結果を生むのかを理解するためのツールを開発しなければなりません。 これは、異なる方法で問題を診断する唯一の方法であり、さらに重要なことは、現場の可能性と限界について一般に周知することです。

感情分析の研究は、大部分の公共のデータセット、特にソーシャルメディアから構築されています。 私たちが無意識のうちにデータを提供することは、それが使えるものと使用できないもの、そしてその方法を理解することが重要です。

著者について

ルイスミッチェル、アデレード大学応用数学講師。 Michelle Edwardsはこの記事に貢献しました。

この記事は、最初に公開された 会話。 読む 原著.

関連書籍:

{amazonWS:searchindex =本;キーワード=インターネットのプライバシー; maxresults = 3}

enafarZH-CNzh-TWnltlfifrdehiiditjakomsnofaptruessvtrvi

InnerSelfをフォロー

Facebookのアイコンさえずり、アイコンrss-icon

電子メールで最新情報を取得する

{emailcloak =オフ}