差別的なプライバシーがデータをどのように保護できますか? マルコ・バーチ/フリッカー、 CC BY 

技術企業は、個人のプライバシーを維持しながら、差分プライバシーを使用してユーザーの習慣に関する集計データを収集して共有することができます。

フェイスブック、グーグル、アップル、アマゾンなどの大手企業が毎日私たちの膨大なデータを収集するために私たちの個人的、社会的な交流にますます浸透していることは秘密ではありません。 同時に、サイバースペースにおけるプライバシー侵害は、定期的にフロントページのニュースを作成します。

だから、データが収集され、スピードと創意工夫が増して共有される世界で、プライバシーはどのように保護されるべきですか?

差別的プライバシーはサイバーセキュリティの新しいモデルであり、賛成派が従来の方法よりもはるかに優れた個人データを保護できると主張しています。

数年前に10が開発した数学は、Appleによって採用されました。 でログイン 近年では。


インナーセルフ購読グラフィック


差分プライバシーとは何ですか?

差別的なプライバシーは、ハイテク企業が個々のユーザーのプライバシーを維持しながら、ユーザーの習慣に関する集約情報を収集して共有することを可能にします。

たとえば、人々が公園を歩くときに最も人気のあるルートを表示するとします。 あなたは、定期的に公園を歩いている100の人々のルートと、彼らが道を歩いているのか、草を通り抜けているのかを追跡します。

しかし、各ルートを取る特定の人々を共有するのではなく、時間の経過とともに収集された集計データを共有します。 あなたの結果を見ている人は、60の人々の中の100が、60の人々ではなく、草刈りを好むことを好むかもしれません。

なぜそれが必要なのでしょうか?

世界各国の政府の多くは、ハイテク企業がユーザーデータを収集し共有する方法について厳しいポリシーを設けています。 ルールに従わない企業は、巨額の罰金に直面する可能性があります。 A ベルギーの裁判所が最近Facebookを注文した 外部ウェブサイト上のユーザーのブラウジング習慣に関するデータの収集を停止するか、1日あたり€250,000の罰金に服します。

多くの企業、特に異なる管轄区域で営業している多国籍企業にとって、これは顧客データの収集と使用に関しては微妙な立場にあります。

一方で、これらの企業は、パーソナライズされた推奨事項など、ユーザーにとって有益な高品質のサービスを提供できるように、ユーザーのデータを必要とします。 一方、ユーザデータを収集するか、ある管轄区域から別の管轄区域にデータを移動しようとすると、料金が発生する可能性があります。

暗号化などの従来のプライバシー保護ツールでは、このようなジレンマを解決できません。これは、技術企業がデータにまったくアクセスできないためです。 そして、匿名性はデータの価値を低下させます。あなたの習慣がわからない場合、アルゴリズムはあなたに個人的な推奨を提供することができません。

システムを教えてください。

公園を歩くルートの例を続けてみましょう。 あなたが研究に含まれている人物のアイデンティティを知っているが、誰がどのルートをとったのかわからない場合は、プライバシーが保護されていると思われるかもしれません。 しかしそれはそうでないかもしれません。

あなたのデータを見ている人が、ボブが芝生を歩いているのか、道を歩いているのかを確かめたいとします。 彼らは、99の人々が道を歩き回り、40が草を歩き回ることを好むことを伝える他の59の人々に関する背景情報を得ました。 したがって、彼らは、データベース内の100th人であるBobが、芝生を歩くことを好む60th人であると推測することができます。

このタイプの攻撃は、差別化攻撃と呼ばれ、誰かが獲得できるバックグラウンド知識の量を制御できないため、防御することは非常に難しいです。 差分プライバシーは、この種の攻撃に対して防御することを目的としています。

あなたの歩行ルートを推測する人はそれほど深刻ではないかもしれませんが、歩行ルートをHIV検査結果に置き換えると、深刻なプライバシー侵害の可能性があることがわかります。

差分プライバシーモデルは、データセット内の99人の100に関する完全な情報を誰かが持っていても、最終的な人物の情報を推測することはできません。

これを達成するための主なメカニズムは、ランダムなノイズを集約データに追加することです。 経路の例では、59の正確な数ではなく、61または60が草を横切ることを好む人の数を言うかもしれません。 不正確な数はボブのプライバシーを保護することができますが、パターンにはほとんど影響しません.60%の人々は、ショートカットを取ることを好みます。

ノイズは注意深く設計されています。 AppleがiOS 10で差別化されたプライバシーを採用したとき、個々のユーザーの入力にノイズが加わりました。 つまり、たとえば最も頻繁に使用される絵文字を追跡できますが、個々のユーザーの絵文字使用は隠されています。

シンシアDwork、 差分プライバシーの発明者差分プライバシーの要件を達成するのに十分なノイズがどれだけあるかに関する素晴らしい数学的証明を提案しています。

その実用的なアプリケーションは何ですか?

差分プライバシーは、推奨システムからロケーションベースのサービスやソーシャルネットワークまであらゆるものに適用できます。 林檎 差分プライバシーを使用する iPhone、iPad、Macなどのデバイスから匿名の使用状況を収集することができます。 この方法はユーザーフレンドリーであり、 合法的には法的に.

差額のプライバシーは、Amazonのような会社があなたのパーソナライズされたショッピング設定にアクセスし、あなたの過去の購入リストに関する機密情報を隠すことも可能にします。 Facebookは、それを使って、国のプライバシーポリシーに違反することなく、ターゲット広告の行動データを収集することができます。

将来どのように使用できますか?

国によってプライバシーポリシーが異なります。機密文書は、現地で移動する前に手作業で確認する必要があります。 これは時間がかかり、高価です。

最近、 ディーキン大学 各国のクラウドシェアコミュニティ内のプライバシープロセスを自動化するための差分プライバシー技術を開発しました。

会話彼らは、データが適合することを保証するために「ミドルウェア」(ソフトウェア)に翻訳できる各国のプライバシー法をモデル化するために数式を使用することを提案している。 このように差分プライバシーを採用することで、ユーザーのプライバシーを保護し、ハイテク企業のデータ共有の頭痛を解決することができます。

著者について

Tianqing Zhu、サイバーセキュリティの講師、理学部、工学および構築環境、 ディーキン大学

この記事は、最初に公開された 会話。 読む 原著.

関連書籍

at InnerSelfMarketとAmazon