Christopher Marloweの可能な肖像画。 (クレジット:ウィキメディアコモンズから匿名)

新しい統計的分析は、Christopher MarloweがWilliam Shakespeareの3つの全ての共著者である ヘンリー六世 演劇。

シェイクスピアが本当に彼の演劇のあらゆる場面ですべての言葉を書いているかどうかという疑問は、彼自身の生涯以来循環し続けている。 ワイルドな陰謀理論は、劇作家が決して本当に存在しなかったと主張するか、または俳優であり劇作家ではないと主張する。 文学の学者は、どの演劇が共著されているのか、そしてその公認されていない共著者が誰であるのかを議論した。

デン・モンフォール大学でシェイクスピアの学者とともに働いているペンシルベニア大学の工学と応用科学の学校の情報科学者は、新しい統計的方法を使ってこの問題の最下部に到達しています。

シェイクスピアが助けてくれた

次回のエッセイで シェイクスピア四半期、彼らは3つすべて ヘンリー六世 演劇は別の著者によって書かれた言語を含んでいる。 彼らの分析は、他の作家も同様に関与しているかもしれないが、Christopher Marloweを可能性のある候補者と特定する。

「より信頼性の高いアプローチは、意味のある単語ではなく機能的な単語を使用することです:「the」「and」「or」「to」など。


インナーセルフ購読グラフィック


一つのことは確かです。シェイクスピアはこれらの演劇を自分で書いていませんでした。

文学の学者は、コンピュータの登場以前にも、帰属問題を解決するために著者のスタイルを定量化しようと試みてきました。 しかし、手作業によるカウントを含むことが多い、利用可能な技術の厳格さは、紛争の原因となっていました。 計算上のアプローチは、信頼性と客観性の向上を約束して、この分野を活性化させました。

「情報科学を使用して論争を起こした著者についての質問に答えることは、20年後に始まり、コンピューティング・パワーと共に成長しました。 しかし、私たちのアプローチは数え切れないほどのものです。」と電気・システム工学部門のアレハンドロ・リベイロ助教授は言います。

小さな言葉に焦点を当てる

これまでの計算手法では、語彙や使用法を用いて文体のスタイルを定量化しようとしていました。 特定の単語の頻度を数え、それらのテキストを比較することによって、著者のボキャブラリのプロファイルを作成しました。 しかし、このアプローチには欠点があります。テキストに使用されている単語の分布は、著者よりも主題の影響を強く受ける可能性があります。

「より信頼できるアプローチは、意味のある言葉ではなく、機能的な言葉を使うことです。サンティアゴ・セガラ(Santiago Segarra)はこう語っています。「the」「and」「to」「to」などです。 「誰もがこれらの言葉を使用しなければならないので、著者の違いがどのように分析されているかは、「スタイル」の客観的尺度に近づいています。

そのような言葉の頻度を単純に数えるのではなく、ペンのチームは互いの接近度を測定しました。 研究者は、ターゲットテキストに現れる50-100機能語のリストを作成した後、アルゴリズムを適用して「ワード隣接ネットワーク」を導出します。

機能的な単語の各対には、互いに何個の単語が離れているかに基づいてスコアが与えられます。 これらのスコアは、同じ著者による異なるテキスト間で著しく一貫しており、一種の文体「指紋」として機能します。

リベイロ氏は、「私がこのシステムを訓練し、サンティアゴの演劇で訓練し、私たちが書いたもう1つの演劇を与えた場合、どの人がそれを98%と書いているのかを知ることができます。 "

アルゴリズムのトレーニング

シェイクスピアの原作者に関する進行中の議論を知っているペン・チームは、De Montfortでのシェイクスピア研究の教授であるGabriel Eganと協力し、彼らが学術的コンセンサスの範囲内で働いていることを確認しました。 例えば、学者は現在シェークスピアの後の演劇の共著者としてジョン・フレッチャーを広く受け入れているが、 二ノーブル近親。 シェイクスピアの初期の作品の中には、 ヘンリー六世 演劇と タイタス·アンドロニカス共同作業であると考えられていたが、どれだけ多くの人が誰であるかは不明であった。 これにより、より深い分析のための良いターゲットとなりました。

「言語は究極の「大きなデータ」問題です。」

研究者はシェイクスピアの演劇コーパス全体にアルゴリズムを訓練し、彼のために文体指紋を作成した。 また、フレッチャー、クリストファー・マーロー、トーマス・ミドルトン、ベン・ジョンソン、ジョージ・ピールなどの著名な時代の指紋を開発しました。 最後に、彼らはすべての候補者からのすべてのテキストを、その時代の英語の著者のために本質的に「平均的な」指紋という単一のプロファイルにまとめました。

Shakespeareanコーパスの単語隣接ネットワーク指紋の分析は、3つの ヘンリー六世 演劇はシェイクスピアの演劇の中の文体的なアウトライアーでした。 この異常は、Shakespareが完全にこれらの演劇を完全に書いたことはほとんどありませんでした。他のグループの計算手法によって生成された結果を確認します。

Egan氏は、「独立したアプローチが収束すればするほど、我々はもっと自信が持てる」と述べています。

自信を持って ヘンリー六世 演劇がアウトライヤーであった場合、次の作業は、他に彼らが含むかもしれない文体の指紋を誰かが見ることでした。 Christopher MarloweとGeorge Peeleは、長い間、 タイタス·アンドロニカス、2つの主要な候補者だった。

「候補者を1人選ぶ必要があれば、それはマーローだろう」とセガラ氏は言う。 「2つ選ぶ必要があるなら、MarloweとPeeleに行くだろうが、後者のケースでは、分類器を完全に訓練するのに十分なサンプルがない。 一度これを歴史的証拠と組み合わせると、Marloweは明らかに好ましい共著者になります。

Eganは歴史的な証拠がMarloweに比例すると確信しています。 "まったく異なるアプローチを使用している他の調査者は、最近Marloweを主要候補にする証拠を明らかにしました。

「非常に有名な暴動のシーンがあります ヘンリー六世、Part 2、 "Eganは、"革命的なJack Cadeの信者の一人が、「まず、私たちがやることは、すべての弁護士を殺しましょう」と言います。 私はMarloweがJack Cadeシーンを担当したと思う。 もちろん、一緒に座って共著者として働いたかどうかはわかりません。 例えば、シェイクスピアが後にこれらのパッセージを適用したかもしれない」

シェイクスピアとマーロー

Eganとその共同編集者 ニュー・オックスフォード・シェイクスピア・コンプリート・ワークス Marloweをシェイクスピアの共著者と特定します。 ヘンリー六世 演劇。 ニューオックスフォードシェイクスピア現代と元の両方の綴りと、分析と解説の両方でシェイクスピアの著書のすべての版を含んでおり、劇作家の最も権威ある学術的資源の中にあると考えられている。

「ENIACを使って、これらの言語に関するこれらの質問がコンピュータの発祥の地で取り組まれていることは間違いありません」とEgan氏は言います。

「言語は究極の「大きなデータ」の問題であり、著作者を正当な所有者に帰属させることは技術的な課題であり、編集者にとっては道徳的な義務です。 異なる背景と異なるが補完的なスキルを持つ21世紀の作家のコラボレーションは、起源が同様に多様であった16世紀のコラボレーションを明らかにするはずである」

情報源: ペンシルベニア大学

関連書籍:

at InnerSelfMarketとAmazon