Twitterが科学者に人間の幸せと健康の窓を与える仕組み

数年前に公開されて以来、Twitterは、友人の間でのソーシャルネットワーキングプラットフォーム、スマートフォンユーザー向けのインスタントメッセージングサービス、企業や政治家向けのプロモーションツールとして使用されてきました。

しかし、複雑な社会システムの中で人間がどのように感じ、機能しているかを研究したいと望む研究者や科学者にとっても、貴重なデータ源です。

つぶやきを分析することで、私たちは制御された実験室実験の外で、何百万人もの人々の社会的相互作用に関するデータを「野生の中で」観察して収集することができました。

それは私たちが 大集団の集団的な感情、 を見つける 米国で最も幸せな場所 他 ご相談に対応

だから、Twitterはコンピュータ社会科学者のためのユニークなリソースになるのですか? それが私たちに何を発見させましたか?


インナーセルフ購読グラフィック


Twitterの最大の研究者への贈り物

7月に15、2006、Twittr(それが知られていたように) 公然と 打ち上げ 友人のグループがSMSでランダムな思考を跳ね返らせるモバイルサービス。無料の140文字グループのテキストを送信する機能は、多くの早期採用者(自分自身を含む)がプラットフォームを使用するのを助けました。

時間とともに、ユーザー数 爆発しました:20の2009百万人から200の2012人、そして今日310人の百万人。 友人と直接コミュニケーションをとるのではなく、ユーザーは自分のフォロワーにどのように感じたかを伝えるだけでなく、肯定的または否定的なニュースに反応したり、冗談をはけたりするだけです。

研究者のために、Twitterの最大の贈り物は、大量の公開データの提供です。 Twitterは、研究者が特定の種類のつぶやき(特定の言葉を含むつぶやきなど)を検索することを可能にする、アプリケーションプログラミングインターフェイス(API)と呼ばれるものを通してデータサンプルを提供する最初の主要なソーシャルネットワークの1つでした。 。

この結果、このデータを利用した研究プロジェクトが爆発的に増加しました。 今日、「Twitter」をGoogle Scholarで検索した結果、600万回のヒットが得られたのに対し、「Facebook」は500万回でした。この違いは、Facebookがおおよそ Twitterの5倍のユーザー (そして2歳以上です)。

興味深い科学的研究が主流のメディアによって取り上げられたので、Twitterの寛大なデータ政策は間違いなく、同社の優れた自由な宣伝につながった。

幸福と健康を勉強する

伝統的な国勢調査データを収集するのが遅く、費用がかかるので、Twitterのような公開データフィードは、大規模な人口の変化をリアルタイムで確認する可能性があります。

バーモント大学 計算ストーリーラボ 2006に創設され、応用数学、社会学、物理学の問題を研究しています。 ストーリーラボは、2008以来、Twitterの「Gardenhose」フィードを通じて数十億個のつぶやきを収集しました。このAPIは、すべてのパブリックツイートの10%のサンプルをリアルタイムでストリーム配信するAPIです。

私はComputational Story Labで3年間過ごし、このデータを使った多くの興味深い研究の一部になれて幸運でした。 たとえば、 ヘドノメータ リアルタイムでTwittersphereの幸福を測定する。 スマートフォンから送信された地理的に離れたつぶやきに注目することで、 地図 米国で最も幸せな場所です。 恐らく驚くことではないが、 ハワイで最も幸せな州とワイン栽培ナパは、最も幸せな都市 2013ため。 

幸福で色づけされた13からの2013百万個のジオラックの米国のつぶやきの地図。赤は幸福を示し、青は悲しみを示しています。 PLOS ONE、著者提供幸福で色づけされた13からの2013百万個のジオラックの米国のつぶやきの地図。赤は幸福を示し、青は悲しみを示しています。 PLoSのONE、著者提供。これらの調査には、より深いアプリケーションがありました。Twitterの単語の使用状況を人口統計と関連付けることで、都市の基礎的な社会経済パターンを理解するのに役立ちました。 たとえば、単語の使用状況を肥満などの健康状態と結びつけることができるため、 レキシカルカロリメータ ソーシャルメディアの投稿の「カロリーコンテンツ」を測定します。 高カロリー食品を言及した特定の地域のつぶやきは、その地域の「カロリー量」を増加させ、運動活動を言及しているつぶやきは我々の測定基準を減少させた。 我々は、この単純な尺度 他の健康および幸福の指標と相関する。 言い換えれば、つぶやきは特定の瞬間に、都市や地域の全体的な健康状態のスナップショットを私たちに与えることができました。

豊富なTwitterデータを使用して、 人々の日常的な動きのパターンをこれまでにないほど詳細に見る。 人間のモビリティのパターンを理解することは、疾患モデリングを変容させる能力を持ち、新しい分野を開拓します。 デジタル疫学.

他の調査では、旅行者が自宅にいる人よりTwitterでより大きな幸せを表現しているかどうかを調べました。 幸せな人は、ソーシャルネットワークで一緒にくっつく傾向があります (やり直してください)。 確かに、 陽性は言語そのものに焼き付けられているようだ私たちは否定的な言葉よりも肯定的な言葉を持っているという意味でです。 これはTwitterだけでなく、さまざまな種類のメディア(書籍、映画、新聞など)や言語にまたがっています。

これらの研究 - 世界中からの彼らのような何千もの人々 - はTwitterのおかげで可能でした。

次10年

では、次の10年の間にTwitterから何を学ぶことができるでしょうか?

最もエキサイティングな仕事のいくつかは、現在、病気の流行などの人口レベルの現象を予測するために、ソーシャルメディアデータを数学的モデルと結びつけることを含んでいます。 研究者は、すでにインフルエンザを予測するために、Twitterデータを用いて疾患モデルを増強することにいくつかの成功を収めている FluOutlook Northeastern UniversityとScientific Interchange Instituteが開発したプラットフォームです。

それでも、多くの課題が残っています。 ソーシャルメディアのデータには、「信号対ノイズ比」が非常に低いという問題があります。つまり、特定の研究に関連するつぶやきは、無関係の「ノイズ」によって溺死することがよくあります。

したがって、私たちは、何が "ビッグデータハリス新しい方法を開発し、結果を誇りに思うことはありません。 これに接続することは、これらのデータから(ブラックボックス予測とは対照的に、アルゴリズムが隠されているかどうかにかかわらず)解釈可能な「ガラス・ボックス」予測を生成することを目指すべきである。

ソーシャルメディアのデータは、しばしば(かなり)批判され、 代表的でないサンプル より広い人口の。 研究者にとっての大きな課題の1つは、統計モデルでこのように歪んだデータをどのように説明するかを考え出すことです。 しながら 毎年多くの人々がソーシャルメディアを利用しています私たちはこのデータの偏りを理解し続ける必要があります。 例えば、データは、高齢者を犠牲にして若年者を過度に表現する傾向があります。

より良いバイアス補正方法を開発した後にのみ、研究者はつぶやきから完全に自信を持って予測することができます。

著者について

ルイスミッチェル、応用数学講師、 アデレード大学

この記事は、最初に公開された 会話。 読む 原著.

関連書籍

at InnerSelfMarketとAmazon