サザエさんじゃんけんに勝つ方法【第33号】

じゃんけんとビッグデータ解析の関係について
金谷一朗(いち) 2021.07.16
誰でも

🎙️このレターには音声版があります (🍎Apple | 🎷Spotify  | 📺YouTube | 🌏Web)

【140字まとめ】今週のテーマは「じゃんけん」です.平安時代のじゃんけんには蛇がいた?志村けんは天才?サザエさんじゃんけんに勝つ方法は?などなど,じゃんけんにまつわる話題と,近年はビッグデータ解析と呼ばれることも多い統計学をご紹介します.

いちです,おはようございます.

今週は「じゃんけん」の話題をお届けします.そう「グー・チョキ・パー」のじゃんけんです.

じゃんけん

じゃんけん,関西では「いんじゃん」ですが,これは学術的には「三すくみ拳(けん)」と呼ばれる遊びの一種です.三すくみとは「石(グー)は鋏(チョキ)に勝つ,鋏(チョキ)は紙(パー)に勝つ,紙(パー)は石(グー)に勝つ」という風に,絶対的な勝者がいない状態を表します.

三すくみになる組み合わせであれば「三すくみ拳」は成り立つので,必ずしも「グー・チョキ・パー」である必要はありません.じゃんけんは漢字で「石拳」と書きますが,これは石,鋏,紙を使うからですね.この石,鋏,紙の組み合わせは明治時代に入ってから普及したようです.三すくみ拳自体は平安時代から遊ばれていたようで,カエル(蛙),ナメクジ(蛞蝓),ヘビ(蛇)の三つを使った「虫拳」が一般的だったようです.カエルは親指,ナメクジは小指,ヘビは人差し指で,カエルはナメクジに勝ち,ナメクジはヘビに勝ち,ヘビはカエルに勝ちます.

また16世紀ごろには,長崎に住む中国人の間から「数拳(かずけん)」という別種の遊びが日本人へ伝えられます.密かに指を何本か立てておいて,二人で同時に見せ合うのはじゃんけんと同じなのですが,見せ合うと同時に合計本数の予想を言い合うのです.江戸時代ではこの数拳のほうが主流になっており,長崎拳または崎陽拳(きようけん)とも呼ばれていました.崎陽は長崎の中国風ネーミングで,京都を洛陽と呼ぶようなイメージです.

現代のじゃんけんの形はこの長崎拳で使われた「0」「2」「5」がそれぞれ「グー」「チョキ」「パー」に転用されたものと見られています.

なお三すくみ拳や数拳は東アジアの遊びで,ヨーロッパでは見られませんでした.僕は子供の頃,アメリカにじゃんけんが無いことを知ってひどく興味を覚えたことがあります.じゃんけん無しで,どうやって無作為抽出をやるのかと.

じゃんけんのことを現代の英語圏では Rock paper scissors と言います.日本の「石紙鋏」を直訳したんですね.東アジアに比べればまだまだ普及していないようですが,2018年にはイングランドの女子サッカーリーグである「FA女子スーパーリーグ」において,主審がコインを忘れたため,コイントスの代わりに両キャプテンによるじゃんけんが用いられました.なおこの主審は3週間の出場停止を喰らいました.

なお,知の巨人として基本的には尊敬申し上げている松岡正剛先生なのですが,このじゃんけんに関しても残念ながら的を外した説明をされています.

松岡正剛先生の「千夜千冊」には本当に頭が下がる思いなのですが,僕が興味を持つ分野ではことごとく「早とちり」記事を書かれています.

ということは,僕などはなおさら同じ間違いをやらかしている可能性があるということですね.間違いを見つけましたら,どうぞ気兼ねなくご指摘ください.マシュマロでもツイッターでもメールでも結構です.

最初はグー

さて,話を戻しましょう.

じゃんけんの「グー・チョキ・パー」はきれいな三すくみになっていますから,どの手を出しても勝ちやすさは同じです.じゃんけんには引き分けがあるので,どの手を出しても勝率は1/3になります.

とは言え,人間は身体のある生き物です.緊張すると手をぎゅっと握ってしまう傾向があります.そのためじゃんけんをプレイする前には,ある程度緊張を解し,またじゃんけんのタイミングを揃える必要があります.

じゃんけんの前の「最初はグー」は,どうしても「グー」を出しがちになる傾向を緩め,また本番のタイミングを揃えるための儀式とも言えると思うのです,きっと.

「最初はグー」を考案したのはコメディアンの志村けんさんだそうです.

2002年,世界各地のじゃんけん系ゲームのルールを統一するために The World Rock Paper Scissors Society (WRPS) が結成されました.日本語訳すると「世界グー・チョキ・パー協会」ですね.2017年からはTwitterアカウントも運用しているようです.

WRPSによると,じゃんけんのタイミングを合わせるためにヨーロッパでは3回,アメリカでは2回,まず手を縦に振ってから,本番の手を出すようにとのことです.回数は半ば冗談なのでしょう.

(フジテレビ・エイケン)
(フジテレビ・エイケン)

ところでじゃんけんと言えば,本号のタイトルにもさせていただいた「サザエさんじゃんけん」が有名ですよね.1969年から続くTVアニメ「サザエさん」ですが,1991年からは次回予告がサザエさんによるじゃんけんになりました.もう30年もじゃんけんが続いているのですね.

このサザエさんじゃんけんですが,高い確率で勝つ方法があります.

そのために,僕たちは統計学を学ぶ必要があります.

統計学が最強の学問である

1903年,H.G.ウェルズは将来,統計学的思考が読み書きと同じように良き社会人として必須の能力になる日が来ると予言した
統計学が最強の学問である

書籍「統計学が最強の学問である」はこのような言葉から始まります.1903年,H.G.ウェルズは将来,統計学的思考が読み書きと同じように良き社会人として必須の能力になる日が来ると予言しました.1903年ですから,今からおよそ120年前ということになります.世界最初のコンピュータであるツーゼZ3が1941年の誕生ですから,コンピュータや電卓のなかった時代のことです.H.G.ウェルズはサイエンスフィクションの父とも呼ばれる作家,思想家で,タイムマシンや透明人間を題材にした作品を披露していますし,核兵器や今のウィキペディアを着想していたとも言われています.

コレラ王の宮廷(パンチ,1852年)
コレラ王の宮廷(パンチ,1852年)

別な具体例をご紹介します.人類は19世紀のロンドンで,史上初めて統計学の力を使って万単位の人命を奪う原因に戦いを挑みました.原因不明の疫病を防止するための学問を疫学と呼びますが,この世界で最初の疫学研究は19世紀のロンドンで,コレラという疫病に対して行われました.この疫学の中で,統計学は大きな役割を果たしました.この当時コレラはイギリス全土で大流行し,合計数十万人もの死亡者を出したと言われています.特にロンドンのソーホー地区では下水道が発達しておらず,地域が汚水にまみれていたため,ロンドン政府が汚水をテムズ川に投棄したのですが,これがかえってコレラの大流行を招いてしまいました.先程ご紹介したイラストはコレラ王の法廷と呼ばれるもので,当時の週刊誌パンチに掲載されたものです.

ジョン・スノウによる元の地図.1854年ロンドンのコレラの症例を長方形で示している.
ジョン・スノウによる元の地図.1854年ロンドンのコレラの症例を長方形で示している.

現在,疫学の父と呼ばれているジョン・スノウという外科医は,コレラでなくなった人の家を訪れ,話を聞いたり付近の様子をよく観察しました.そして,同じような状況下でコレラにかかった人とかかっていない人の違いを比べました.このようにして仮設を組み立て,大規模にデータを集め,コレラの発症,非発症と関連していると考えられる違いについて,どの程度確からしいかを検証しました.スノウは,家屋1万軒あたりのコレラ死亡者数が,利用している水道会社によって大きく違うことを発見しました.水道会社Aを利用している家では,水道会社Bを利用している家よりも8.5倍も死亡者が多かったのです.スノウは,とりあえず水道会社Aの水を使うことをやめることを提案しました.ドイツの細菌学者ロベルト・コッホがコレラ菌を発見する30年ほど前のことです.スノウの主張は当時,科学的ではない,あるいは確実な証拠がないと学会からは退けられました.一方で,スノウの助言に従ってコレラに汚染された水の使用を止めた街ではコレラの感染が止まりました.図はスノウが作成したコレラの死者の調査図です.

疫学という,データと統計解析に基づき最善の判断を下そうという考え方は,スノウの発見から100年ほどかけて,医学の領域においては欠くことのできないものになりました.現代の医療で最も重要な考え方として Evidence-Based Medicine 日本語にすると科学的根拠に基づく医療というものがありますが,この科学的根拠のうち最も重視されるもののひとつが,妥当な方法によって得られた統計データとその分析結果なのです.

これは原因と結果を結びつけようとする,古典的な科学とは異なる態度です.エビデンスは因果関係の議論をすっ飛ばして,最善の答えを提示します.したがって,エビデンスに反論しようとすれば,理屈やもちろん経験ではなく,統計学的にデータや手法の限界を指摘するか,自説を裏付けるような新たなエビデンスが必要になります.疫学における議論は「正しい」「正しくない」という評価ではなく「重い」「軽い」あるいは「強い」「弱い」という議論になります.

マネーボール

エビデンスに基づく政策には他に,アメリカにおける教育改革が知られています.その最たるものは What Works Clearinghouse プロジェクト,略してWWCプロジェクトです.WWCプロジェクトでは,どのような教育方法が科学的に推奨されるのかを明らかにし,公開しました.それによると,例えば,生徒の成績に基づいて教師を競争させてボーナスの査定に反映させるアイディアは,むしろ悪影響であることがわかりました.また,映画マネーボールをご覧になった方は,統計学をうまく使えば貧乏球団でも大リーグにおいてプレーオフで優勝争いに絡めるということを聞いたことがあるでしょう.

Photo by&nbsp;<a href="https://unsplash.com/@billstephan?utm_source=unsplash&amp;utm_medium=referral&amp;utm_content=creditCopyText">Bill Stephan</a>&nbsp;on&nbsp;<a href="https://unsplash.com/s/photos/baseball?utm_source=unsplash&amp;utm_medium=referral&amp;utm_content=creditCopyText">Unsplash</a>
Photo by Bill Stephan on Unsplash

マネーボールで有名になった,野球における統計解析をまとめた教科書としては「メジャーリーグの数理科学」が有名で,その理論はセイバーメトリクスとして知られています.セイバーメトリクスは従来の野球の伝統的価値観をしばしば覆すものであったため,メジャーリーグに受け入れられるのには時間がかかりました.例えばチーム最強打者は,メジャーリーグでは3番,日本のプロ野球では4番に置くことが多いのですが,近年は2番打者にチーム最強打者を置くチームが増えてきました.これはセイバーメトリクスの影響です.

もう一つの事例は経済学に見ることが出来ます.1929年にニューヨーク証券取引所で株価の大暴落がおこりました.世界恐慌の始まりです.写真は1931年の取り付け騒ぎです.アメリカでは失業率が25パーセントに迫りました.当時の政府はニューディール政策と呼ばれる一連の政策を計画しました.ニューディール政策のゴールは不況を脱することであり,失業率を低下させることでした.そこでまず,正確な失業者数を把握することが必要になりました.当時は,失業者数は300万人から1500万人という雑な推計しかなかったのです.当時のアメリカの人口は1億2000万人から1億3000万人程度だったと考えられますが,今からおよそ100年前にその全数を調査することは到底不可能でした.このような課題に対して当時唱えられたアプローチは,失業者全員に登録カードの郵送を義務付けるというものと,全人口から無作為に0.5パーセント程度を選んだサンプリング調査を行うという新しいものでした.実際には両方の方法が取られ,後者のサンプリング調査のほうが正確だったことがわかっています.

サンプリング調査には懐疑的な人が未だにいます.そこで,理想的なサンプリング調査が理想的な全数調査よりもどの程度不正確なのかを議論しておきましょう.全人口1億2000万人の0.5パーセント,すなわち60万人が失業している状況を考えてみます.全人口の0.5パーセントすなわち60万人をサンプリング調査すると,全員が失業者であったという可能性はほとんどありません.どのぐらいありえないかというと,1を64兆で10万回以上割った程度の確率です.言い換えると,200回に1回しか当たりの出ないくじで60万回連続して当たり続けるのと同じ確率です.これは極端な例でしたが,10万人程度のサンプリング調査で真の値から1パーセントもずれないことが保証できます.これはよく「スープの味を見るのにスープ全部を飲まなくても良い」と例えられます.

ビッグデータ解析

現在は,ほとんどすべての学問において統計学を使わざるを得ない時代です.ではなぜ今,統計学が花開いたのでしょうか.先程見たように,統計学の芽生えは100年も前のことですし,主要な統計解析手法は1960年代にほぼ出揃ったものです.これだけ統計学がパワフルなものであるならば,なぜもっと前から使われていなかったのでしょうか.それはコンピュータとデジタルネットワーク技術が21世紀になってようやく,低コストで大量に手に入るようになったからです.20世紀までの統計学は,紙とペン,それに一部の人にしか使えなかった大型コンピュータによるものでした.しかし現在では,データ量の多さや計算の複雑さは問題にならなくなりました.これが統計学が21世紀になってから花開いた理由です.なお,せっかく花開いたのだから新しい名前をつけようという動きもあり,統計解析は時々ビッグデータ解析とも呼ばれます.

ABテストの例 (GoodUI.org)
ABテストの例 (GoodUI.org)

身近な例をもうひとつ挙げましょう.これはグーグルの検索画面です.リンク先が青文字で書かれています.実はこの青文字の微妙な色合いは,ABテストと呼ばれる統計的な手法によって決定されています.グーグルはお互いわずかに異なる青Aと青Bを用意し,訪問者にランダムに表示していました.訪問者がより強く好んだほうを,グーグルの標準の青文字に選んだのです.この実験は数年に一度は実施され,そのたびに色合いがわずかに調整されるようです.

このように,統計学とは,経験的に得られたバラツキのあるデータから,応用数学の手法を用いて数値上の性質や規則性あるいは不規則性を見いだす学問です.統計的手法は,実験計画,データの要約や解釈を行う上での根拠を提供するため,幅広い分野で応用されています.

サザエさんじゃんけんに勝つ方法

さて,最後にサザエさんじゃんけんに戻りましょう.なぜ統計学を駆使するとサザエさんじゃんけんに勝つことが出来るのか,そろそろ想像がついたでしょうか.実はサザエさんじゃんけんには統計的な偏りがあります.宝くじや大学入試のマークシートは統計的な偏りが生じないように設計されています.またサイバーセキュリティの基礎となる暗号技術でも統計的な偏りのない乱数を作ることが鍵になっています.

「サザエさんじゃんけん研究所公式ウェブサイト」が公開している「サザエさんじゃんけん白書2020年2月版」によると,サザエさんじゃんけんの手は,アニメ制作会社の担当者が「思いつき」で決めているそうです.そのため3回連続した同じ手はほぼ出ないといった「人間くささ」が現れています.例えば2008年10月から2009年12月の間では,ある週に「グー」が出て,次の週に「チョキ」が出た場合,3週目に「パー」が出る可能性は67パーセントに達していました.つまりサザエさんが「グー」「チョキ」と出した翌週ならば,こちらは「チョキ」を出すと67パーセントの確率で勝てたということですね.

このような法則を駆使し,サザエさんじゃんけん研究所は1996年のサザエさんじゃんけん開始から通算54パーセントの勝率を誇っています.もしサザエさんが完全にランダムな手を出していれば,勝率は1/3すなわち33パーセントににっていたことでしょう.

おすすめ映画

IMDb
IMDb
アメリカのプロ野球,メジャーリーグの貧乏球団を独自の理論で常勝球団に育て上げた実在の男の半生を,ブラッド・ピットが演じる感動的なヒューマンドラマ.球団のゼネラルマネージャーが独自の理論である「マネーボール理論」を推し進め,貧乏球団を常勝集団に生まれ変わらせていく過程を描く.監督を,『カポーティ』のベネット・ミラーが務め,『ソーシャル・ネットワーク』のアーロン・ソーキンが脚本を担当.ブラッドとフィリップ・シーモア・ホフマンやロビン・ライトなど実力派キャストによる演技合戦に期待.
シネマトゥデイ

経営危機に瀕した弱小球団オークランド・アスレチックスのゼネラルマネージャー「ビリー・ビーン」は,統計学を駆使して再建していきます.金満球団ニューヨーク・ヤンキースの1/3程度の予算で毎年のようにプレーオフに出場するチームを作っていく話は,いかにもアメリカ映画向きな内容ですが,ほぼ実話なんです.

原作となった「マネー・ボール〜奇跡のチームをつくった男」という書籍はメジャーリーグのチーム運営に統計学を導入するという革命を起こしました.

野球ファンには滅茶苦茶面白い内容だと思います.

おすすめTEDトーク

素晴しく皮肉の効いた分析により,セバスチャン・ワーニックがTEDTalkを統計分析というツールにかけ,ユーザ評価に基づいた「最適なTEDTalk」を作るための基準を編み出しています.この講演をどのように評価されますか? 「びっくり」? 「説得力なし」? それとも、ただただ「可笑しい」?
TED

統計は因果関係を証明するものではありません.例えばアイスクリームの売上と水難事故の件数の間には強い相関関係がありますが,アイスクリームが水難事故を起こしているわけではありませんし,水難事故がアイスクリームの売上を伸ばしているわけでもありません.おそらくは両者の背後に「夏」という原因があるのでしょう.

統計学は非常に強力なツールですが,使い方をわかった上で活用しないと,間違った因果関係に飛びついてしまうことがあります.

この間違った因果関係を逆手に取った冗談が,このTEDトークです.TEDがお好きな方は,是非一度ご覧になってください.

Q&A

匿名質問サイト「マシュマロ」および実名質問サイト「Quora」で質問を受け付けています.普段はツイッターでお返事を書いていますが「ニュースレター読んでます」と入れていただければ,こちらのニュースレターでより長めの回答を書かせていただきます.

今週のQ&Aはこちら

円周率を3と教えるのは何が問題なのでしょうか?
Quora

円周率を3と教えるのは問題です.それは単に不正確であるだけでなく,不便でもあるからです.

直径が1の巻き寿司を作るときに,海苔の長さが3では足りません.日常生活においても,工業製品の製造においても,円筒状のものにテープを巻きつける場面は多数出てくる一方で,筒の中になにかシート状のものを丸めて挿入するという場面は多くありません.ですから,円周率の近似を考える場合,真の値よりも大きくあるべきなのです.

円周率をもし1桁で近似するのであれば,円周率は4と教えることが望ましいです.

僕のこの意見は,定期的にネットで炎上します…

こちらの匿名質問サイトで質問を受け付けています.質問をお待ちしております.

振り返り

このニュースレターでは「振り返り」動画を公開しています.今週は「結婚の数学」についてお話をしました.

動画の音声だけを切り出してポッドキャストにもしています.

是非お楽しみください.

あとがき

僕の勤務する長崎大学では全学部の1年生向けに「統計学概論」という講義を用意しています.今回お送りした内容は,僕が担当した「統計学概論」第1回の内容を膨らませたものでした.講義前は「大学の講義にサザエさんじゃんけんはどうなの?」と思ったのですが,前期の講義終了後のアンケートではサザエさんじゃんけんに大変な高評価が集まりました.

こんな国民的アニメを作られた方々,1991年からサザエさんじゃんけんを続けられている担当の方,そして毎週休まず活動を続けられているサザエさんじゃんけん研究所の皆様に感謝します.

そして,サザエさんの原作者である長谷川町子先生にも.

僕は小さい頃,原作版のサザエさんが好きでよく読んでいました.僕が生まれた家は長谷川町子先生のお住まいと近かったこともあって,かつての「田舎」東京の雰囲気を感じられたからでしょうね.歩いても歩いても畑と林だったんですよ.亡くなった祖母から聞いた話によると,当時は一軒家に住むことは「時代遅れ」で「格好悪い」という雰囲気があったそうです.

価値観というのは180度変わるものですね.

今週は嬉しいツイートもいただきました.

結城浩
@hyuki
@kanaya さんのニュースレター(メルマガ)は無料ですが毎回盛りだくさんの話題で楽しいです。あまり難しい話にならないので、専門知識がなくても、いわゆる理系っぽい話題に関心がある多くの人が楽しめると思います。

STEAM NEWS by Ichi
steam.theletter.jp
STEAM NEWS by Ichi ピラミッドの研究をしているコンピュータ科学者の「いち」です. 国内外のSTEAM分野(科学・技術・工学・アート・数学)に steam.theletter.jp
2021/07/11 06:44
4Retweet 10Likes

本当にありがとうございます.泣いて喜びます.

今週も最後までお読みいただきありがとうございます.メールでお読み頂いた皆様は,よろしければボタンを押して行ってくださいませ.(ボタンは匿名化されています.集計したデータはこのニュースレターの内容改善以外には用いません.)

ここに配置されたボタンは、ニュースレター上でのみ押すことができます。

では,また来週,お目にかかりましょう.

***

休刊日のお知らせ:8月13日金曜日は休刊を予定しています.

***

ニュースレター「STEAM NEWS by Ichi」

金谷一朗(いち)

TEDxSaikaiファウンダー・パイナップルコンピュータ代表・長崎大学情報データ科学部教授

バックナンバーはこちらから👉 https://steam.theletter.jp

匿名質問はこちらから👉 https://marshmallow-qa.com/kanaya

「STEAM NEWS」をメールで読みませんか?

無料で「STEAM NEWS」をメールでお届けします。
コンテンツを見逃さず、購読者限定記事も受け取れます。
夢と現実:スティーブ・ジョブズの失敗作たち【第131号】
読者限定
★ 爆発のノート【第130号別冊】
サポートメンバー
おむすび1個は手榴弾4個分?TNT換算という考え方【第130号】
誰でも
★ 世界一短い論文のノート【第129号別冊】
サポートメンバー
世界一短い論文【第129号】
誰でも
★ アイザック・ニュートンのノート【第128号別冊】
サポートメンバー
人類史上最高の科学者アイザック・ニュートン【第128号】
誰でも
★ アンド(and)とオア(or)のノート【第127号別冊】
サポートメンバー