ダブースト / シャッターストック

最近の解雇と迅速な再雇用 OpenAIによるサム・アルトマン氏の著書で、人工知能(AI)の開発と使用に関する議論が再び注目を集めている。 さらに珍しいのは、メディア報道における顕著なテーマが、 数学を行うための AI システム.

どうやら、OpenAI でのドラマの一部は、同社の新しい開発に関連していたようです。 Q*と呼ばれるAIアルゴリズム。 このシステムは大きな進歩であると話題になっており、その顕著な特徴の XNUMX つは数学的に推論する能力でした。

でも、AIの基礎は数学ではないでしょうか? コンピューターや電卓は数学的タスクを実行できるのに、AI システムが数学的推論に問題を抱えているはずがありません。

AI は単一の存在ではありません。 これは、人間からの直接の指示なしに計算を実行するための戦略のパッチワークです。 これから説明するように、一部の AI システムは数学に優れています。

しかし、現在の最も重要なテクノロジーの XNUMX つである、ChatGPT などの AI チャットボットの背後にある大規模言語モデル (LLM) は、これまでのところ、数学的推論をエミュレートするのに苦労しています。 これは、言語に集中するように設計されているためです。


インナーセルフ購読グラフィック


同社の新しい Q* アルゴリズムがまだ見ぬ数学的問題を解決できるのであれば、それは十分にあり得ることです。 重要な進歩となる。 数学は人間の推論の古代の形式であり、 大規模言語モデル (LLM) これまで真似するのに苦労してきました。 LLM は、次のようなシステムの基礎となるテクノロジーです。 OpenAI の ChatGPT.

この記事の執筆時点では、Q* アルゴリズムとその機能の詳細は限られていますが、非常に興味深いものです。 したがって、Q* が成功したと判断する前に、さまざまな微妙な点を考慮する必要があります。

たとえば、数学は誰もがさまざまな程度に取り組む科目ですが、Q* がどのレベルの数学に対応できるかは依然として不明です。 ただし、研究レベルの数学を進歩させるために別の形式の AI を使用する学術研究が発表されています (自分で書いたものも含めて、および Google DeepMind の研究者と協力して数学者のチームによって書かれたもの)。

これらの AI システムは数学に優れていると言えます。 ただし、Q* は学者の研究を支援するために使用されているのではなく、別の目的を目的としている可能性があります。

それにもかかわらず、たとえ Q* が最先端研究の限界を押し広げることができなかったとしても、その構築方法には、将来の開発に魅力的な機会をもたらす可能性のある何らかの重要性が見出される可能性が非常に高いです。

ますます快適に

私たちは社会として、あらかじめ決められた種類の問題を解決するために専門家向け AI が使用されることにますます慣れています。 例えば、 デジタルアシスタント, 顔認識, オンライン推薦システム ほとんどの人にとって馴染みのあるものとなるでしょう。 とらえどころのないものは、いわゆる 「汎用人工知能」(AGI) 人間に匹敵する幅広い推論能力を持っています。

数学は、私たちがすべての学童に教えたいと願っている基本的なスキルであり、AGI の探求における基本的なマイルストーンにふさわしいものであることは間違いありません。 それでは、数学的に有能な AI システムが他にどのように社会に役立つでしょうか?

数学的考え方は、コーディングやエンジニアリングなどの多くのアプリケーションに関連しているため、数学的推論は人間と人工知能の両方にとって重要な応用可能なスキルです。 皮肉なことに、AI は基本的なレベルで数学に基づいているということです。

たとえば、AI アルゴリズムによって実装される技術の多くは、最終的には次のような数学的領域に集約されます。 行列代数。 マトリックスは単なる数値のグリッドであり、デジタル画像はそのよく知られた例です。 それぞれのピクセルは、 単なる数値データに過ぎない.

大規模な言語モデルも本質的に数学的です。 テキストの膨大なサンプルに基づいて、機械は、以下の単語の確率を学習できます。 ユーザーからのプロンプト (または質問) に従う可能性が最も高い チャットボットに。 事前トレーニングされた LLM を特定のトピックに特化させたい場合は、数学文献やその他の学習領域に基づいて微調整できます。 LLM は、あたかも数学を理解しているかのように読めるテキストを生成できます。

残念ながら、そうすることで、ハッタリは得意だが詳細が苦手な LLM が生成されます。 問題は、数学的ステートメントは定義上、 明確なブール値 (つまり、真か偽)。 数学的推論は、以前に確立されたものから新しい数学的ステートメントを論理的に演繹することになります。

悪魔の代弁者

当然のことながら、言語的確率に依存する数学的推論へのアプローチは、そのレーンを逸脱することになります。 これを回避する XNUMX つの方法は、アーキテクチャ (まさに LLM の構築方法) に何らかの形式的検証システムを組み込むことです。これにより、大規模な言語モデルによる飛躍の背後にあるロジックが継続的にチェックされます。

これが行われたことを示す手がかりは Q* という名前にある可能性があり、これはおそらく次のことを指す可能性があります。 1970 年代に開発されたアルゴリズム 演繹的推論を助けるために。 あるいは、Q* は、正しい結論をテストして報酬を与えることによって、時間の経過とともにモデルを改善できる Q 学習を指すこともあります。

しかし、数学的に能力のある AI を構築するには、いくつかの課題が存在します。 たとえば、最も興味深い数学の中には、非常にありそうもない出来事で構成されているものがあります。 小さな数字に基づいてパターンが存在すると考えていても、十分なケースをチェックすると予想外に崩れてしまうという状況はよくあります。 この機能をマシンに組み込むのは困難です。

もう XNUMX つの課題は意外かもしれません。数学研究は非常に創造的になる可能性があります。 実践者は新しい概念を発明しながらも、その概念を堅持する必要があるため、そうである必要があります。 古代の主題の正式な規則.

既存の数学のパターンを見つけるためだけに訓練された AI 手法では、おそらく真に新しい数学を生み出すことはできません。 数学とテクノロジーの間にパイプラインがあることを考えると、これは新しい技術革命の構想を妨げているように思えます。

しかし、少しの間悪魔の代弁者になって、AI が本当に新しい数学を生み出すことができるかどうか想像してみましょう。 これに対する先の議論には欠陥があり、人間の最高の数学者も既存の数学のみで訓練されているとも言えるという点です。 大規模な言語モデルは以前にも私たちを驚かせましたが、再び驚かれるでしょう。会話

トム・オリバー、コンピュータ理工学部講師、 ウェストミンスター大学

この記事はから再公開されます 会話 クリエイティブコモンズライセンスの下で 読む 原著.