シャッターストック/ヴァレンティン640

1956 年、20 代前半の XNUMX 年間にわたるロンドン旅行中に、数学者で理論生物学者のジャック D. コーワンはウィルフレッド テイラーと彼の奇妙な新しい「学習機”。到着すると、彼は目の前に現れた「巨大な装置の塊」に当惑した。コーワンは「機械がその仕事をしている」ことをただ傍観することしかできなかった。それは「連想記憶スキーム」を実行しているように見えました。接続を見つけてデータを取得する方法を学習できるようでした。

それは、大量のワイヤやボックスを手作業でハンダ付けした、不格好な回路ブロックのように見えたかもしれませんが、コーワンが目撃したのは、初期のアナログ形式のニューラル ネットワークであり、今日の最先端の人工知能の先駆けでした。たくさん議論されました AI言語モデルを活用してコードのデバッグからデータの異常検出まで、 ほぼすべてのコマンドに応答して書き込みコンテンツを生成する機能を備えています。 ChatGPT の基礎となるテクノロジーはニューラル ネットワークです。

コーワンとテイラーは立って機械の動作を観察していましたが、機械がどのようにしてこのタスクを実行しているのか、正確にはわかりませんでした。テイラーの謎の機械脳に対する答えは、その「アナログ ニューロン」のどこか、その機械のメモリによって作られる連想の中に、そして最も重要なことに、その自動化された機能が実際には完全には説明できなかったという事実の中に見つけることができる。これらのシステムがその目的を見つけ、その力が解放されるまでには数十年かかるでしょう。

ニューラル ネットワークという用語には、幅広いシステムが組み込まれていますが、中心的には、 IBMによると、これらの「ニューラル ネットワーク (人工ニューラル ネットワーク (ANN) またはシミュレートされたニューラル ネットワーク (SNN) とも呼ばれる) は、機械学習のサブセットであり、深層学習アルゴリズムの中心です。」重要なのは、この用語自体とその形式と構造が「人間の脳からインスピレーションを受けており、生物学的なニューロンが互いに信号を送る方法を模倣している」ということです。

初期段階ではその価値について疑問が残っていたかもしれませんが、年が経つにつれ、AI の流行はニューラル ネットワークへとしっかりと傾いてきました。現在では、それらは AI の未来であると理解されることがよくあります。それらは私たちにとって、そして人間であることの意味にとって大きな影響を及ぼします。聞いたことがあります 最近こうした懸念が反響を呼んでいる その影響への信頼を確保するために、新しい AI 開発を 6 か月間一時停止するよう求める声も上がっています。


インナーセルフ購読グラフィック


ニューラル ネットワークを単に光沢のある人目を引く新しいガジェットに関するものとして無視するのは間違いです。それらはすでに私たちの生活にすっかり定着しています。実用性において強力なものもあります。 1989 年に遡り、AT&T ベル研究所のヤン ルカン率いるチームは、逆伝播技術を使用してシステムをトレーニングしました。 手書きの郵便番号を認識する。 最近 マイクロソフトによる発表 Bing 検索が AI によって強化され、AI が「Web の副操縦士」になるということは、私たちが発見するものとそれを理解する方法が、今後ますますこの種の自動化の産物となることを示しています。

膨大なデータを利用してパターンを見つける AI も同様に、画像認識などを高速に実行できるように訓練することができ、その結果、AI は 顔認識、 例えば。パターンを識別するこの機能は、次のような他の多くの応用につながりました。 株式市場を予測する.

ニューラル ネットワークは、私たちの解釈やコミュニケーションの方法も変化させています。興味深いタイトルの開発者 Google Brain チーム, Google翻訳 ニューラル ネットワークのもう 1 つの著名なアプリケーションです。

チェスや将棋もプレイしたくないでしょう。彼らはルールを理解し、戦略と記録されたすべての動きを思い出せるということは、彼らがゲームにおいて非常に優れていることを意味します(ただし、ChatGPT は ワードルとの格闘)。人間の囲碁プレーヤー (囲碁は、非常にトリッキーな戦略ボード ゲームであることで有名です) とチェスのグランドマスターを悩ませているシステムは、次のとおりです。 ニューラルネットワークで作られた.

しかし、彼らの範囲はこれらの事例をはるかに超えており、拡大し続けています。 「ニューラル ネットワーク」という語句そのものの言及のみに限定して特許を検索すると、135,828 件の結果が得られます。この急速かつ継続的な拡大により、AI の影響を完全に説明できる可能性はますます低くなる可能性があります。これらは私が研究で検討してきた疑問です そしてアルゴリズム的思考に関する私の新しい本.

「不可知性」の神秘的な層

ニューラル ネットワークの歴史を振り返ると、私たちの現在を定義する自動化された意思決定、または将来さらに深刻な影響を与える可能性のある意思決定について重要なことがわかります。彼らの存在は、時間の経過とともに、AI の決定や影響を私たちがさらに理解できなくなる可能性があることも示しています。これらのシステムは単なるブラック ボックスではなく、目に見えず理解できないシステムの隠された部分だけでもありません。

それは何か違うものであり、これらのシステム自体の目的と設計に根ざしたものです。説明できないことへの長年の追求があります。不透明であればあるほど、システムはより本物で先進的であると考えられます。それは単にシステムが複雑になったり、アクセスを制限する知的財産の管理(これらは一部ではありますが)に関するものではありません。むしろ、彼らを動かしている精神には、「不可知性」に対する特定の埋め込まれた関心があると言えます。その謎は、まさにニューラル ネットワークの形式と言説にさえコード化されています。これらには深く積み上げられた層があり、そのためディープラーニングという言葉が使われていますが、その深さの中にさらに神秘的に聞こえる「隠れた層」があります。これらのシステムの謎は水面下の奥深くにあります。

人工知能が私たちの生活に与える影響が大きければ大きいほど、どのように、そしてなぜそうなるのかを私たちが理解できなくなる可能性は十分にあります。現在、説明可能な AI が強く求められています。私たちは、それがどのように機能し、どのように決定や結果に至るのかを知りたいと考えています。 EUは、潜在的に「容認できないリスク」、さらには「危険な」アプリケーションを非常に懸念しており、現在進めている 新しいAI法 「安全で信頼できる倫理的な人工知能の開発」のための「世界標準」を設定することを目的としています。

それらの新しい法律は説明可能性の必要性に基づいているでしょう。 それを要求する 「高リスクの AI システムの場合、AI によってもたらされる基本的な権利と安全性に対するリスクを軽減するために、高品質のデータ、文書化とトレーサビリティ、透明性、人間の監視、正確性、堅牢性の要件が厳密に必要です。」これは自動運転車などに限った話ではなく(安全性を確保するシステムはEUのハイリスクAIの範疇に入るが)、将来的には人権に影響を及ぼすシステムが出現するのではないかという懸念もある。

これは、AI の活動をチェック、監査、評価できるよう、AI の透明性を求める広範な要求の一環です。別の例としては、王立協会の 説明可能なAIに関する政策説明会 その中で彼らは、「世界中の政策論争において、AI対応システムの設計と導入に倫理原則を組み込む取り組みの一環として、何らかの形でAIの説明可能性を求める声が高まっている」と指摘している。

しかし、ニューラル ネットワークの物語は、将来的にはその目標に近づくどころか、遠ざかってしまう可能性が高いことを示しています。

人間の脳からインスピレーションを得て

これらのニューラル ネットワークは複雑なシステムですが、いくつかの核となる原理があります。人間の脳からインスピレーションを得た彼らは、生物学的および人間の思考の形態をコピーまたはシミュレートしようとしています。構造とデザインの点では、次のようになります。 IBMも説明しています、「入力層、1 つ以上の隠れ層、および出力層を含むノード層」で構成されます。この中で、「各ノードまたは人工ニューロンが別のノードに接続」されます。出力を作成するには入力と情報が必要なため、「トレーニング データに依存して学習し、時間の経過とともに精度を向上させます」。これらの技術的な詳細は重要ですが、人間の脳の複雑さに基づいてこれらのシステムをモデル化したいという願望も重要です。

これらのシステムの背後にある野心を把握することは、これらの技術的な詳細が実際に何を意味するのかを理解する上で極めて重要です。で 1993インタビュー、ニューラルネットワーク科学者のテウヴォ・コホネンは、「私たちの神経系が本能的に行っていることのようなもの」を動作させる「自己組織化」システムが「私の夢である」と結論付けました。一例として、コホーネン氏は、「自己組織化」システム、つまり自らを監視し管理するシステムが、「あらゆる飛行機、ジェット機、原子力発電所、あらゆる機械の監視パネルとして使用できる」とイメージしました。車"。これは、将来的には「システムがどのような状態にあるのかがすぐにわかるようになる」ことを意味すると彼は考えた。

最も重要な目的は、環境に適応できるシステムを構築することでした。それは即時的かつ自律的であり、神経系のスタイルで動作するでしょう。それは、人間の介入をほとんど必要とせずに自動的に処理できるシステムを実現するという夢でした。脳、神経系、現実世界の複雑さと未知の部分が、すぐにニューラル ネットワークの開発と設計に反映されるようになります。

「何か怪しいことがある」

しかし、1956 年のあの奇妙な学習マシンに戻ってみると、すぐにコーワンの注意を引いたのは、テイラーがそれを構築する際にとった実践的なアプローチでした。彼は部品の組み立てに明らかに汗をかいていた。テイラー、 コーワンは観察した これらのシステムについての自身のインタビューの中で、彼は「理論に基づいてやったわけではないし、コンピュータでやったわけでもない」と述べた。代わりに、ツールを手に「実際にハードウェアを構築」しました。それは物質的なものであり、部品の組み合わせであり、おそらくはからくりでさえありました。そして、それは「すべてアナログ回路で行われ」、「組み立てて遊ぶのに数年かかった」とテイラー、コーワンは記している。試行錯誤のケース。

当然のことながら、コーワンは自分が見ているものを理解したいと考えていました。彼はテイラーにこの学習機械について説明させようとした。説明は得られなかった。コーワンさんはテイラーにそれがどのように機能するのか説明してもらうことができなかった。アナログニューロンは謎のままでした。さらに驚くべき問題は、テイラーが「何が起こっているのか自分でもよく理解していない」ことだとコーワンは考えた。これは、異なる専門分野を持つ二人の科学者間のコミュニケーションが一時的に途絶えただけではなく、それ以上のものでした。

1990年代半ばのインタビューテイラーのマシンを思い出しながら、コーワンは「今日に至るまで、出版された論文ではそれがどのように機能するのか完全には理解できていない」と明らかにしました。この結論は、未知のものがどのようにニューラルネットワークに深く埋め込まれているかを示唆しています。これらの神経システムの説明不可能性は、約 70 年前の基礎的および発達段階から存在していました。

この謎は今も残っており、進化する AI の中に見出されます。テイラーの機械によって作られた関連付けの機能が不可解だったため、コーワンは「何か怪しいものがあるのではないか」と疑問に思いました。

長くて絡み合った根

数年後、コーワンは自身の作品の受け入れについて尋ねられたとき、テイラーとの短期間の訪問を振り返った。 1960 年代になると、人々は「アナログ ニューラル ネットワークの要点を理解するのが少し遅れた」とコーワン氏は振り返ります。コーワン氏の回想によれば、テイラー氏の1950年代の「連想記憶」に関する研究は「アナログニューロン」に基づいていた。ノーベル賞を受賞した神経システムの専門家、 レオン・N・クーパー、結論 1960年代の脳モデルの応用に関する開発は「深い謎の一つ」とみなされていたという。この不確実性のため、ニューラル ネットワークが何を達成できるかについては懐疑的な見方が残っていました。しかし、状況はゆっくりと変わり始めました。

約30年前、神経科学者のウォルター・J・フリーマンは、次のように驚いた。顕著」 ニューラル ネットワークで発見されてきたさまざまな応用例について、同氏はニューラル ネットワークを「根本的に新しい種類のマシン」とは見ていないという事実についてすでにコメントしていました。最初にテクノロジーが登場し、その後そのテクノロジーの応用が見つかるという、ゆっくりとした取り組みでした。これには時間がかかりました。実際、ニューラル ネットワーク テクノロジーのルーツを見つけるには、コーワンがテイラーの謎のマシンを訪問したときよりもさらに遡るかもしれません。

ニューラルネット科学者のジェームズ・アンダーソンと科学ジャーナリストのエドワード・ローゼンフェルド 気づいた ニューラル ネットワークの背景は 1940 年代に遡り、彼らが説明するように、「人間の神経系を理解し、少なくとも少しは私たちと同じように動作する人工システムを構築する」という初期の試みに遡ります。そして、1940 年代には、人間の神経系の謎は、計算論的思考と人工知能の謎にもなりました。

この長い話を要約すると、コンピューター サイエンスのライターは次のように述べています。 ラリー・ハーデスティ氏が指摘した ニューラルネットワークの形での深層学習は「70年以上流行ったり廃れたりを繰り返してきた」という。より具体的には、これらのニューラルネットワークは、「最初の認知科学部門と呼ばれることもあるものの創設メンバーとして1944年にMITに移ったシカゴ大学の研究者であるウォーレン・マカロックとウォルター・ピッツによって1952年に初めて提案された」と彼は付け加えた。

他の場所で、 1943 テクノロジーの初年度として指定された日付が指定されることもあります。いずれにせよ、およそ 70 年間、ニューラル ネットワークが流行ったり消えたりを繰り返し、無視されることが多かったものの、時には定着し、より主流のアプリケーションや議論に移行していたことを示唆する記述があります。不確実性が続いた。これらの初期の開発者は、自分たちの研究の重要性が、多くの場合数年、場合によっては数十年後にその目的が見つかるまで見落とされていたと頻繁に説明しています。

1960 年代から 1970 年代後半にかけて、これらのシステムの未知の特性に関するさらなる物語を見つけることができます。 1986 年が経った今でも、ニューラル ネットワークはまだ目的意識を見出していませんでした。心理学の背景があり、後にニューラル ネットワークへの注目が再び戻ることになる XNUMX 年に出版された一連の本の共著者であるデイビッド ルメルハートは、気がつくとニューラル ネットワークの開発に協力していました。 同僚のジェイ・マクレランドと.

彼らは同僚であるだけでなく、ミネソタ州での会議でも最近会ったばかりで、そこでの「ストーリー理解」に関するルメルハートの講演が参加者の間で議論を引き起こした。

その会議の後、マクレランド氏は、モデルを組み合わせてよりインタラクティブになる可能性のあるニューラル ネットワークを開発する方法についての考えを戻ってきました。ここで重要なのは ルメルハルトの回想 「何時間も何時間もコンピューターをいじり続ける」こと。

私たちは座ってコンピューター上でこれらすべてを行い、これらのコンピューターモデルを構築しましたが、まったく理解できませんでした。なぜ機能するのか、なぜ機能しないのか、何が重要なのかを私たちは理解していませんでした。

テイラーと同じように、ルメルハートもシステムをいじくり回していることに気づきました。彼らも機能するニューラル ネットワークを作成しましたが、重要なことに、データから学習して関連性を見つけたようで、そのように機能する方法や理由もわかりませんでした。

脳を模倣する - レイヤーを重ねる

ニューラル ネットワークの起源について議論するときに、脳のイメージとそれが引き起こす複雑さが決して遠いところにあることに気づいているかもしれません。人間の脳は、これらのシステムの一種のテンプレートとして機能しました。特に初期段階では、依然として未知の領域の 1 つである脳が、ニューラル ネットワークがどのように機能するかについてのモデルとなりました。

したがって、これらの実験的な新しいシステムは、その機能自体がほとんど知られていないものをモデルにしたものでした。ニューロコンピューティングエンジニアのカーバー・ミード氏 暴露的に話した 彼が特に魅力的だと感じた「認知的な氷山」の概念について説明しました。それは私たちが認識し、目に見える意識の氷山の一角にすぎません。残りの規模と形状は表面下では不明のままです。

1998年には、 ジェームズ·アンダーソンしばらくニューラルネットワークの研究に取り組んでいた同氏は、脳の研究に関して「私たちの大きな発見は、何が起こっているのか本当に分からないという認識のようだ」と述べた。

詳細なアカウントでは、 2018 年のフィナンシャル タイムズテクノロジージャーナリストのリチャード・ウォーターズは、ニューラルネットワークが「人間の脳がどのように機能し、識別可能なパターンが現れるまで人工ニューロンの層にデータを渡すかについての理論に基づいてモデル化されている」と述べた。 「従来のソフトウェア プログラムで使用されている論理回路とは異なり、このプロセスを追跡して、コンピューターが特定の答えを導き出す理由を正確に特定する方法はない」ため、これは連鎖問題を引き起こすとウォーターズ氏は提案しました。ウォーターズの結論は、これらの結果を取り消すことはできないというものです。このタイプの脳モデルを適用すると、多くの層を介してデータが取得されるため、答えを簡単にたどることはできません。多層化がその理由の大きな部分を占めています。

最強 また、これらのシステムは「人間の脳を大まかにモデル化している」ことも観察されました。これにより、脳と一致させるために、さらに複雑な処理を組み込もうとする熱意が生じます。この目的の結果、「高密度に相互接続された数千、さらには数百万の単純な処理ノードで構成される」ニューラル ネットワークが誕生しました。データはこれらのノードを一方向にのみ移動します。 Hardesty 氏は、「個々のノードは、データを受信するその下の層の複数のノードと、データを送信するその上の層の複数のノードに接続される可能性がある」と観察しました。

人間の脳のモデルは、これらのニューラル ネットワークが最初からどのように考え出され、設計されたかの一部でした。これは、脳自体が当時の謎であったこと(そして多くの点で今でも謎であること)を考えると、特に興味深いことです。

「適応こそがゲームのすべてだ」

ミードやコホーネンのような科学者は、その世界に真に適応できるシステムを作りたいと考えていました。それはその条件に応じてくれるでしょう。ミード氏は、ニューラル ネットワークの価値は、この種の適応を促進できることであることを明確にしていました。当時、そしてこの野心を振り返って、 ミードが追加されました 適応を生み出すことが「ゲーム全体」だという。 「現実世界の性質のため」この適応が必要であると彼は考え、「現実世界は変化しすぎて絶対的なことはできない」と結論づけた。

この問題は特に考慮する必要がある。なぜなら、これは「神経系がずっと前に解明した」ものだと彼は考えていたからである。これらの革新者たちは、脳とその未知のイメージを扱うだけでなく、これを「現実世界」とそれがもたらす不確実性、未知数、変動性のビジョンと組み合わせていました。ミード氏は、システムは状況に対応して適応できる必要があると考えた。 無し 命令。

1990 年代の同時期、数学、心理学、生物医学工学にまたがる認知システムの専門家であるスティーブン グロスバーグ氏が、 とも主張した 適応は長期的には重要なステップとなるだろう。グロスバーグ氏は、ニューラル ネットワーク モデリングに取り組みながら、すべては「生物学的測定および制御システムが、急速に変動する世界にリアルタイムで迅速かつ安定して適応するように設計される方法」であると考えました。先ほどコホネンの「自己組織化」システムの「夢」で見たように、「現実世界」の概念が、応答と適応がこれらのシステムにコード化される文脈になります。現実世界をどのように理解し、想像するかによって、これらのシステムが適応するように設計される方法が形作られるのは間違いありません。

非表示レイヤー

層が増えるにつれて、ディープラーニングは新たな深さを掘り下げました。ニューラル ネットワークは、次のトレーニング データを使用してトレーニングされます。 ハーデスティの説明、「最下層、つまり入力層に供給され、後続の層を通過し、複雑な方法で乗算され、加算されて、最終的に出力層に根本的に変換されて到着します。」レイヤーが多いほど、変換が大きくなり、入力から出力までの距離が長くなります。たとえばゲームにおけるグラフィックス プロセッシング ユニット (GPU) の開発により、「1960 年代の 1980 層ネットワークと 15 年代の 50 ~ XNUMX 層ネットワークが、XNUMX 層、XNUMX 層、さらには XNUMX 層のネットワークにまで発展することが可能になりました」とハーデスティ氏は付け加えました。今日の層ネットワーク」。

ニューラルネットワークは深化しています。実際、ハーデスティ氏によれば、このレイヤーの追加こそが「『ディープラーニング』の『ディープ』が指すもの」なのです。 「現在、人工知能研究のほぼすべての分野で最高のパフォーマンスを発揮するシステムはディープラーニングによって担われている」ため、これは重要だと同氏は提案する。

しかし、謎はさらに深まります。ニューラル ネットワークの層が高くなるほど、その複雑さは増大しました。また、これらの深さ内の「隠れ層」と呼ばれるものの成長にもつながりました。ニューラル ネットワークにおける隠れ層の最適な数についての議論は進行中です。メディア理論家 ベアトリス・ファジはこう書いている 「ディープ ニューラル ネットワークの動作方法は、ニューロンの最初の層 (入力層) と最後の層 (出力層) の間に挟まれた隠れたニューラル層に依存しているため、ディープラーニング技術は多くの場合、不透明であったり、人間にとっても判読不能であったりします。最初にそれらを設定したプログラマー。」

層が増えるにつれて (隠れた層も含めて)、層はさらに説明できなくなります。結局のところ、層を作成した人たちでさえも説明が難しくなります。著名で学際的なニューメディア思想家のキャサリン・ヘイルズも同様の指摘をしている また指摘した 「システムについて、つまりニューラルネットや深層学習アルゴリズムの『隠れ層』に関連する結果についてどれだけ知ることができるか」には限界があるという。

説明できないことを追求する

これらの長い発展を総合すると、テクノロジー社会学者の考えの一部です。 タイナ・ブッチャー 「未知の問題」と呼ばれています。科学的知識に関する影響力のある研究を AI の分野に拡張するハリー・コリンズ それを指摘しました ニューラル ネットワークの目的は、少なくとも最初は人間が作成できるようにすることですが、「一旦作成されると、プログラムはいわば独自の人生を歩みます。多大な努力がなければ、プログラムが正確にどのように動作するかは謎のままになる可能性があります。」これには、自己組織化システムという長年の夢が反映されています。

これに付け加えたいのは、未知のもの、そしておそらくは不可知なものさえも、初期の段階からこれらのシステムの基本的な部分として追求されてきたということです。人工知能が私たちの生活に与える影響が大きければ大きいほど、どのように、そしてなぜそうなるのかを私たちが理解できなくなる可能性は十分にあります。

しかし、今日では多くの人にとってそれはうまくいきません。私たちは、AI がどのように機能し、AI がどのようにして私たちに影響を与える決定や結果をもたらすのかを知りたいと考えています。 AI の発展により、私たちが何を発見し、どのように扱われ、どのように学習し、消費し、交流するのか、世界についての私たちの知識と理解が形成され続けるにつれて、この理解への衝動は増大するでしょう。説明可能で透明性の高い AI に関しては、ニューラル ネットワークの話から、将来的にはその目標に近づくどころか、遠ざかってしまう可能性が高いことがわかります。

デビッドビール、社会学の教授、 ヨーク大学

この記事はから再公開されます 会話 クリエイティブコモンズライセンスの下で 読む 原著.