源氏物語のオリジナルはどこ?計量文献学の挑戦【第114号】
2️⃣手書きコピーには写し間違いが生じるため原文が徐々に失われていきます
3️⃣一方で,写し間違いを追いかけることで原文のありかや伝播の様子を見つけることができます
📖今週の書籍:真贋の科学―計量文献学入門
🐻今週のTEDトーク:統計を好きになるべき理由
📨Q&A:欧米ではネギは一般的な食材ではないですか?
いちです,おはようございます.
対話AIのChatGPTが話題ですね.学術論文を書けるかもしれないとか,共通テストで高得点が取れたとか,ついに「エヴァ」のMAGIシステムができたとかがニュースになっています.いまのところChatGPTは英語しか理解しないのですが,我々のデッキにはDeepLという高性能翻訳AIがいますから,日本語話者でも一工夫すれば使えます.
そこで,ひょっとしたらこのニュースレターもChatGPTが書いてくれるかもしれないと思って,尋ねてみました.
What is the interface between science and art?
(科学とアートの境界面はなに?)
回答を機械翻訳した結果はこうでした.
科学とアートの接点は,科学の原理や手法がアートの創作にどのように用いられているか,またアートが科学の研究や理解にどのようにインスピレーションを与え,情報を提供できるかということに見ることができます.たとえば,デジタルアートやビデオアートのような新しい形のアートを創作するために科学的手法を用いたり,複雑な科学的アイデアをより多くの人々へ伝えるためにアートを用いたりすることが挙げられます.さらに,審美的体験の神経基盤を探求する神経審美学と呼ばれる研究分野も拡大しており,この分野の洞察がアートと科学の両方にどのように役立つかを探求しています.
か,完璧な回答じゃないですか……人生ではじめて機械に仕事を奪われるかもと戦慄しました.近いうちに,ニュースレターもAIが書くようになるかもしれません.それまでは,トップガン・マーヴェリックの "Maybe so, sir, but not today"(そうかもしれません,でも今日ではありません)の精神で続けていきたいと思います.

というわけで,今週は考古学,人文学,統計学,情報科学の交差点に位置する学問「計量文献学」のお話です.
📬 STEAM NEWS はメールで毎週届くニュースレターです.国内外のSTEAM分野(科学・技術・工学・アート・数学)に関するニュースを面白く解説するほか,今週の書籍,TEDトークもお届けします.芸術系や人文系の学生さんや教育関係者の方,古代エジプト好きな方にとくにおススメです.ぜひ無料登録してみてください.
《目次》
-
源氏物語のオリジナルはどこ?
-
計量文献学登場
-
語ルフ
-
今週の書籍
-
今週のTEDxトーク
-
Q&A
-
一伍一什のはなし
源氏物語のオリジナルはどこ?
小説「源氏物語」は,平安時代中期の女性作家,紫式部によって書かれた長編恋愛小説です.僕も現代語訳を読みましたが,初出が西暦1008年というとんでもなく古い本ながら,すっかり感情移入して読みました.紫式部の本名はわかっておらず,日本文学史の謎とされています.ここではヴァイオレットちゃんということにしておきましょうか.

平安時代には印刷技術が普及していませんでしたから,源氏物語は手書きの写本として貴族の間で広まっていきました.人間がコピーを作るわけですから,当然エラーが生じます.大学入試センターは人間が気合を入れさえすればエラーを起こさないという「謎」信念で共通テストを運営しているわけですが……げふんげふん.ともかくですね,源氏物語はコピーを経るごとに少しずつ変化しているわけです.
そうなると気になりますよね.どれが源氏物語のオリジナルなのだろうと.
もちろん源氏物語が書き写された巻物を放射性炭素年代測定法にかけていけば,どれが一番古いかわかるかもしれません.しかし残念ながらオリジナルが散逸していること,さらには,文学のように高速にコピーが作られていくものに対してあまり役に立たないことから,放射性炭素年代測定法による研究事例はあるものの決定的ではありません.
「美しさとはコミュニケーション・メディアだ」と言う説があるように,源氏物語のような「美しい」物語は非常に高速に自ら「コピー」を作っていきます.こう考えると,10万年先の人類に何かを伝えようとしたら「美しさ」が鍵なのかもしれませんね.
脱線してごめんなさい.
現存する源氏物語にはいくつものバリエーションがあります.そのうちのどれがオリジナルで,どれが派生物なのでしょうか.また派生の関係はわかるでしょうか.この非常に難しい問いに答えようとするのが,計量文献学の挑戦です.
計量文献学登場
「計量文献学(stylometry)」とは,文献の特徴を数値化して,文献の分析や比較を行う研究分野です.
文献にはさまざまな特徴がありますよね.そこには著者の癖も現れます.日本語文献で言えば,漢字とかなの比率だとか,読点の使い方なんかが顕著な例です.僕のように句読点に「カンマ」「ピリオド」を使うのも,著者の癖の一例でしょう.こういった特徴は数値化していくことができるのです.
19世紀のイギリス人数学者オーガスタス・ド・モルガン(Augustus de Morgan)は,計量文献学のアイディアを思いついた初期の人物です.ド・モルガンは計算機科学者なら誰でも知っている「ド・モルガンの法則」という数学規則を定式化した人で,大変興味深い人物なのでいずれ紹介したいと思います.
ド・モルガンは,1文の長さが作家の特徴として現れると考えました.確かに1文の長い作家と短い作家といますよね.たとえば「火垂るの墓」作者の野坂昭如は極端に1文が長いです.なので,当然椎名誠や長岡鉄男の文章ではないと判断がつきます.
計量文献学では,単語の使い方や使う回数,単語の省略の仕方,文章の長さの「分散」なども特徴量として使います.分散というのは「ばらつき」のことで,平均を取ると打ち消し合うような性質を調べるためにしばしば用いられる指標です.
近代的な計量文献学では,単語が作る数学的な宇宙空間まで考えます.これはもう,無理くりな例えなのですが,我々の地図には南北と東西の軸がありますよね.ここに標高を入れたら,合計で3本の軸があることになります.これが3次元空間です.単語が作る宇宙空間というのは,単語の数だけ軸があると考えるのです.そうなんです,apple軸とかbanana軸とかcherry軸とかがあって,任意の文章はその空間の中の1点だと考えるのです.(もっと近代的な考え方では,ひとつの単語は複数の軸に分散して対応させます.)
現代英語には17万語あると言われているので,任意の英文は17万次元空間の1点ということになりますが,英語でよく使われるのは2,000から3,000語ぐらいなので,次元もその程度になります.こうなると,文章をデジタル化して宇宙空間の1点に置き換えると,文章同士の「近さ」がわかってきます.
写本は,この単語が作る宇宙空間を少しずつ移動していく営みと言えます.完璧なコピーだったらその場に留まるのですが,人間が起こすエラーによって,少しずつずれていくわけですね.このようにして,源氏物語が宇宙をどのように旅したかを調べていくと,オリジナルが推定できるのです.現在のところ,源氏物語の写本は2から3系統まで絞り込まれているそうです.
おもしろいですね.
語ルフ
計量文献学では,単語が作る宇宙空間を超えて,さらに高度な解析も行われます.単語と単語の組み合わせに筆者の癖が出たり,さらには文字の並びの癖も見つけたりします.たとえば中国古代の地理書「山海経(せんがいきょう)」の編著者を,文字並びのゆらぎを用いて推定する研究もあります.
文字を使ったおもしろい言葉遊びをご紹介します.本誌【第113号】でご紹介したルイス・キャロルが世に広めた「語ルフ」という遊びです.(「語ルフ」という呼び方は遠藤諭によるものですが,キャロルの「ダブレット(doublets)」よりもわかりやすいので採用しました.)
語ルフでは,最初にふたつの単語が与えられます.片方が「スタート」単語で,もう片方が「ゴール」単語です.スタート単語とゴール単語は同じ文字数です.プレイヤーはスタート単語から1文字ずつ変えていって,ゴール単語を目指します.このとき,途中の単語も一般的なものでなければなりません.
スタート単語がHEAD(あたま)で,ゴール単語がTAIL(しっぽ)の場合を考えてみます.

HEAD(あたま)→HEAL(癒やす)→TEAL(青緑)→TELL(伝える)→TALL(背が高い)→TAIL(しっぽ)
ゴルフのように,少しずつ刻んでゴールに届きましたね.計算機科学ではこの刻みを「ハミング距離が1の移動」というふうに呼びますが「文字がつくる宇宙空間を1歩ずつ移動する」と読み替えても良いのです.
計量文献学の取り組みについて,お伝えできていれば嬉しいです.
今週の書籍

「源氏物語」の作者は2人いた.「静かなドン」は盗作だった.シェイクスピアはベーコンだった.―歴史上の真贋にまつわる疑問に答え,また現代のメディアに乗った新手の贋作の化けの皮をはがす真贋鑑定法―計量文献学の全体像を紹介する.
日本の計量文献学の第一人者で,個人的にも大変お世話になっている村上征勝先生の本です.今でこそ「最強の学問」と呼ばれている統計学ですが,20世紀から地道に研究されてきたことに,僕は頭が下がる思いです.個人的な思いもあって,村上先生の本をご紹介させていただきました.
今週のTEDxトーク

あなたは統計データを推測するのは得意ですか?そう思う人は考え直した方がいいでしょう.数学の得意,不得意に関わらず,私たちが数字を理解し操作する能力は極めて限られている,そう話すのはデータ視覚化の専門家アラン・スミスです.彼は,楽しい話を通して,私たちが知っていることと,そう思っているだけなことのギャップを探ります.
びっくりするようなデータと,ブリティッシュ・ジョークを交えつつ,アランが統計学を学ぶべき理由を伝えてくれています.
Q&A
匿名質問サイト「マシュマロ」および質問サイト「Quora」で質問を受け付けています.普段はツイッターでお返事を書いていますが「ニュースレター読んでます」と入れていただければ,こちらのニュースレターでより長めの回答を書かせていただきます.
今週はこちらの質問から.
欧米ではネギは一般的な食材ではないですか?
欧米ではないのですが……エジプトでは生のネギを食べます.

根元からぽりぽりとかじるんです.
このレターの最後に匿名質問サイトへのリンクを貼っています.質問をお待ちしております.
一伍一什のはなし
長崎は春節(旧正月)を迎える準備に入っています.今年は3年ぶりに「ランタンフェスティバル」が開催されます.こうしてお祭りが戻ってくるのはいいことですね.
今週はYouTubeライブで「世界遺産の旅〜オランダ編」もお送りしました.YouTubeライブ前に,90分の講義を同じく自宅スタジオで収録していたのですが,なんとディスクが満杯になってしまって「無かったこと」にされちゃったんですよね.映画「トゥルーライズ」の小ネタみたいで,ちょっと凹みながらのライブでした.皆さんも映像収録時はメモリやディスクの残り容量にお気をつけください.
昨年末から「コーヒーの差し入れ」サイトを立ち上げさせて頂いているのですが,すでに8杯も差し入れを頂いております.本当にありがとうございます.執筆と音声版収録の励みになっています.
🍓
今週も最後までお読みいただきありがとうございます.メールでお読み頂いた皆様は,よろしければボタンを押して行ってくださいませ.(ボタンは匿名化されています.集計したデータはこのニュースレターの内容改善以外には用いません.)
このニュースレターは下のボタンからSNSで共有できます.もし気に入っていただけたら,共有ボタンも押していってくださいませ.
【休刊日のお知らせ】1月27日金曜日はお休み致します.
【謝辞】本ニュースレターは「STEAMボート」乗組員(STEAM NEWS有料購読者様)のご支援でお届けしております.乗組員の皆様に感謝申し上げます.
ニュースレター「STEAM NEWS」
金谷一朗(いち)
TEDxDejimaStudioファウンダー・パイナップルコンピューター代表・長崎大学情報データ科学部教授
📚バックナンバーはこちらから👉 https://steam.theletter.jp/
🎙️ポッドキャストはこちらから👉 https://steam.fm/
💭匿名質問・コメントはこちらから👉 https://marshmallow-qa.com/kanaya
🐘つぶやきはこちらから👉 https://mstdn.jp/@kanaya
☕️コーヒーの差し入れ(400円のご支援)はこちらから👉 https://ko-fi.com/steamnews
❤️🔥《STEAMな言葉》👉 https://steam.micro.blog/
ご意見,ご感想はこのメールに直接ご返信頂けます.
「STEAM NEWS」をメールで読みませんか?
コンテンツを見逃さず、購読者限定記事も受け取れます。