Deepfakeのビデオとは何ですか?目の瞬きを検出する

2018中期選挙キャンペーンが熱くなるにつれて、新しい形の誤報がオンラインコミュニティを介して広がる可能性があります。 後に「deepfakes」と呼ばれる 技術を普及させた仮名のオンラインアカウント このプロセスは「ディープ・ラーニング」と呼ばれる技術的手法を使用しているため、その名前を選択した可能性があります。これらの偽のビデオは非常に現実的です。

これまでのところ、人々はdeepfakeの動画を ポルノ & 風刺 有名人が通常はやりたくないことをしているように見せます。

しかし、それはほとんど確実です キャンペーンシーズンにDeepfakesが表示されます、候補者を描写すると主張する 物事を言っている または実際の候補者が行かない場所に行くことができます。

それはバラクオバマだ - それとも?

{youtube}cQ54GDm1eL0{/youtube}

これらのテクニックは新しいものなので、実際のビデオとディープフェイクビデオの違いを伝えるのは難しいです。 私の仕事私の同僚であるMing​​-Ching ChangとPh.D. 学生のYuezun Liは、 真実の動画を真実の動画から確実に伝える。 技術が向上するため、恒久的な解決策ではありません。 しかし、それはスタートであり、コンピュータが人々がフィクションから真実を伝えるのを助けることができるという希望を提供する。


インナーセルフ購読グラフィック


とにかく「deepfake」って何?

ディープフェイクビデオを作ることは、言語間の翻訳のようなものです。 好きなサービス Google翻訳 機械学習を使用する - 何千ものテキストのコンピュータ分析 複数の言語で - 〜へ 単語使用パターンを検出する 彼らは翻訳を作成するために使用します。

Deepfakeアルゴリズムは、同じ方法で動作します。 深いニューラルネットワーク 一人の顔の動きを調べる。 その後、彼らは類似の動きをする他の人の顔の画像を合成する。 そのようにすることで、ソースの人物がやったことをするように見える対象の人物のビデオが効果的に作成されます。

ビデオをどのようにディープフェイクするか。

{youtube}8LhI-e2B8Lg{/youtube}

彼らが適切に動作するには、深いニューラルネットワークでは、偽装のソースまたはターゲットとなる人物の写真など、多くのソース情報が必要です。 ディープフェイクアルゴリズムをトレーニングするために使用される画像が多いほど、デジタル偽装が現実的になります。

点滅の検出

この新しいタイプのアルゴリズムにはまだ欠陥があります。 それらの1つは、シミュレートされた顔がどのように点滅するか、またはしないかに関係しています。 健康な大人の人間が点滅する 2と10の間のどこかに、1回の点滅が必要 10分の1秒と4分の1秒との間。 それは、話している人のビデオで見るのが普通のことです。 しかし、それは多くのディープフェイクのビデオで起こることではありません。

本当の人が話している間に点滅する。

{youtube}https://www.youtube.com/watch?v=-MMXXEA3UaM{/youtube}

擬似顔は実際の人間のやり方を点滅させません。

{youtube}EttSA9-YIuI{/youtube}

ディープフェイクアルゴリズムが人物の顔画像に訓練されている場合、訓練データとして使用できるインターネット上で利用可能な写真に依存する。 頻繁に撮影された人でも、オンラインで目を閉じることができる画像はほとんどありません。 人々の目はほとんど開いているので、まれな写真があるだけでなく、写真家は通常、主要被写体の目が閉ざされた画像を公開しません。

人々の訓練画像を点滅させることなく、ディープフェイクアルゴリズムは、通常点滅する顔を作成する可能性は低い。 瞬きの全体的な速度を計算し、それを自然の範囲と比較すると、実際の人と比較して、ディープフェイクビデオのキャラクターが頻繁に点滅することがわかりました。 私たちの研究は、 ビデオで目の開閉を調べる.

これは、ディープフェイクのビデオを検出するインスピレーションを与えます。 次に、映像中の人物がいつ点滅するかを検出する方法を開発する。 具体的には、問題のビデオの各フレームをスキャンし、その中の顔を検出して、自動的に目の位置を特定します。 次に、別の深いニューラルネットワークを利用して、目の外観、幾何学的特徴および動きを用いて、検出された目が開いているか閉じているかを判定する。

我々は、私たちの研究がdeepfakeアルゴリズムを訓練するために利用可能な種類のデータの欠陥を利用していることを知っています。 似たような欠陥に陥るのを避けるために、私たちは開いた目と閉じた目の両方の大きな画像ライブラリでシステムを訓練しました。 この方法はうまくいくと思われ、その結果、95%以上の検出率を達成しました。

もちろん、これはdeepfakesを検出するための最終的な言葉ではありません。 この技術は 迅速に改善する偽の動画の生成と検出の競合は、チェスゲームに似ています。 特に、目を閉じた顔画像を含めるか、またはトレーニングのためにビデオシーケンスを使用することによって、ビデオを暗くするために点滅を加えることができる。 一般の人々を混乱させたい人は、偽のビデオを作ることでよりうまくいくでしょう。テクノロジー界の私たちも他の人たちも、それを検出する方法を引き続き見つけ出す必要があります。会話

著者について

Siwei Lyu、コンピュータサイエンスの准教授; コンピュータビジョンと機械学習ラボのディレクター、 ニューヨーク州立大学アルバニー校

この記事は、最初に公開された 会話。 読む 原著.

関連書籍

at InnerSelfMarketとAmazon