散布図だけを見て相関関数を当てるゲーム

思考力・判断力・表現力を鍛える(多分) / 2023-01-14T00:00:00.000Z

散布図を一目見ただけで相関があるかどうかを見ることは、一般的に統計図表を扱う上で程度の差こそあれ必要とされる能力であると思います。そのため大凡の相関係数を散布図を見ただけで予測することが出来れば、散布図に示されている2指標がどれほど関係性があるのかをお気持ち程度客観的に見ることが出来ると考えられます。

今回はそのような能力を育てるのに最適なサイト「Guess the Correlation」を簡単に紹介したいと思います。

結論

  1. 散布図から相関係数を予測する(最善の説明)
  2. 割とみんな当てている

相関係数を予測!

ジオゲッサーというゲームがある通り、「Guess」には「~を予測する」といった意味があります。また「Correlation」には「相関係数」という意味があります。というわけで「Guess the Correlation」からは「相関係数を予測する」という意味を読み取ることが出来ます。

この前提の下に「Guess the Correlation」にアクセスしてみましょう。そうするとシンプルなメニュー画面が出てきます。英語サイトですが、Aboutページを除いてそこまで難しい英語が用いられてはいないので、取り敢えず「New Game」を押してみましょう。初めてアクセスする場合はユーザー名の登録画面が出てきます。

ユーザー名の登録

最大20文字までのアルファベットもしくはアンダーバーを用いたユーザー名を設定しておきましょう。この設定が済むと唐突にゲーム画面に飛ばされます。この画面においては「相関係数を予測する」というサイト名の通り、画面にデカデカと表示されている散布図の相関係数を予測し、どんどん入力していきましょう。いい感じの値ですとライフとコインがもらえ、普通の値だとコインだけが少しもらえます。

ポイントの加点

このゲームにおいてはライフ制が採用されており、あまりに外れた値を入力するとライフを失い、かなり近い値を入力するとライフが増えます。目的としてはライフを維持しながらコインをどんどん増やしていくというものになります。コインはゲームの進行に直接関係なもので、純粋にスコアのために存在する概念となります。

ゲームオーバー

3つのライフを失ってしまうとゲームオーバーとなってしまいます。そうなるとコインを失ってしまい再スタートするしかなくなるので気を付けてください。逆に言えば適切な値を選択し続ける限り終わることはありません。ホテル・コリレイションへようこそ。快適な相関係数当てトレーニングを楽しんでいってください。

予測した相関係数と実際の相関係数の関係

ちなみにこのゲームに関するデータは、開始する際のアラートに出てくる通りある程度収集されています。作者の方が2019年9月22日時点でのデータを公開されていたので、散布図をR言語で生成してみました。下に散布図を示しますので、ユーザーの予測した相関係数と実際の相関係数の関係性がどれほどかについて考えてみてください。

横軸がユーザーの予測した相関係数、縦軸が実際の相関係数です。一応テキストを描画したつもりなんですが、消えてしまっていますね。といってももう一度生成したくないのでそのまま掲載します。生成したくない理由は前回の記事をご覧ください。

2019年9月22日時点での散布図

この散布図からは「ユーザーは相関関数を0.1や0.05刻みで入力しがち」であることや「実際の相関係数が低くなればなるほど、ユーザーの予測の幅が大きくなってしまう」ことなどが明らかとなっています。ここではユーザー予測のその実際という2つの要素しか用いていませんが、オリジナルデータではアクセス元の国やプレイヤーごとにユニークと見られるIDが付いていたりして、カラム数はそこまで多くないものの解析しがいのあるデータであると思います。

さてそろそろ正解が気になってきた頃だと思うので、機械的に求めた相関係数を出しておきましょう。正解は0.8310961です。それなりに相関はありますね。

関連リンク

最後に

共通テスト当日付として最適な記事を目指しました。結果として何の役にも立たない記事になったかと思います。

Writer

Osumi Akari