2024年9月11日
武藤 泰明 (早稲田大学 スポーツ科学学術院 教授/笹川スポーツ財団 理事/スポーツ政策研究所 所長)
- 調査・研究
© 2020 SASAKAWA SPORTS FOUNDATION
2024年9月11日
武藤 泰明 (早稲田大学 スポーツ科学学術院 教授/笹川スポーツ財団 理事/スポーツ政策研究所 所長)
本項で紹介するのは、リーグ戦のスタジアムやアリーナでよく実施されている観戦者(入場者)調査が、実は不適切であるという事実である。
簡単な事例から始めよう。
・サッカー4チームでリーグ戦を行います。ホーム&アウェーなので、ホームゲームは3試合です。
・チームAのホームゲーム最終戦の観客は3,000人。内訳は「3試合とも来た人」「2試合来た人」「1試合だけ来た人」が、それぞれ1,000人でした。
・他の2試合のホームゲームでも、この人数と割合は変わらないものとします。
[問題1]チームAのホームゲームに来た人の「延べ人数」と「ネットの人数」は何人でしょう?
[問題2]最終戦で観客を対象にアンケート調査を実施しました。集計結果にはどのような問題が「潜んで」いるでしょう?
まず、問題1の答えは表1のとおりである。各試合ごとにアンケート調査を実施すると、「3試合とも来た人」「2試合来た人」「1試合だけ来た人」は、上のとおりそれぞれ1,000人なので、構成比は3分の1ずつ、つまり33%である。これを「一試合調査」の結果と呼ぶことにする。
1試合目 | 2試合目 | 3試合目 |
延べ 入場者数 |
割合 |
ネット 入場者数 |
割合 | |
---|---|---|---|---|---|---|---|
総入場者 | 3,000 | 3,000 | 3,000 | 9,000 | 100% | 5,500 | 100% |
3試合見た人 | 1,000 | 1,000 | 1,000 | 3,000 | 33% | 1,000 | 18% |
2試合見た人 | 1,000 | 1,000 | 1,000 | 3,000 | 33% | 1,500 | 27% |
1試合見た人 | 1,000 | 1,000 | 1,000 | 3,000 | 33% | 3,000 | 55% |
つぎに、3試合すべてでアンケート調査を実施した場合を考える。ただし条件があって、アンケートには1回しか答えられない。つまり、たとえば3試合とも見に来ている人は、2試合目と3試合目のアンケートには回答しない。この場合のサンプル構成は、表の「ネット入場者数」およびその右の「構成」のとおり、人数は3試合に来た人が1,000人、2試合を見に来た人が1,500人、1試合だけという人が3,000人である。構成比はそれぞれ18%、27%、55%になる。こちらは「全試合調査」の結果と呼ぶことにしよう。
一見して分かるとおり、「一試合」と「全試合」では、サンプル構成が異なる。「全試合」では、3試合すべてに来場するファンの構成比は18%だが、「一試合」だと33%、つまり意見が過大に反映される。逆に1試合だけ見に来る人は「一試合」だと33%だが「全試合」では55%なので、こちらの意見は「一試合調査」では反映されにくい。
実際に行われているリーグ戦は、もっとチーム数が多い。表2は、プロサッカーのJ1の20クラブの場合である。この表では、ホームゲーム19試合それぞれで、
・1試合しか見に来ない人 1,000人
・2試合の人 1,000人
:
・19試合見に来る人 1,000人
という仮定を置いている。そうすると、各試合の総入場者は19,000人で、19試合の合計では361,000人になる。そしてネットの入場者数は67,407人、意外に少ない。そしてその中で、1試合だけ見に来る人は19,000人で、入場者の28.2%に上る。また累積構成比をみれば分かるように、見に来るのが3試合以下という人が、全体の半数を超えている。
a | b | c | d | e | f | g |
---|---|---|---|---|---|---|
総観戦 回数 |
1試合の 観戦者 (仮定) |
19試合の 総(延べ)観戦者数 |
総観戦者の 構成比(%) |
19試合の ネット 観戦者数 |
構成比 (%) |
累積構成比(%) |
1 | 1,000 | 19,000 | 5.3 | 19,000 | 28.2 | 28.2 |
2 | 1,000 | 19,000 | 5.3 | 9,500 | 14.1 | 42.3 |
3 | 1,000 | 19,000 | 5.3 | 6,333 | 9.4 | 51.7 |
4 | 1,000 | 19,000 | 5.3 | 4,750 | 7.0 | 58.7 |
5 | 1,000 | 19,000 | 5.3 | 3,800 | 5.6 | 64.4 |
6 | 1,000 | 19,000 | 5.3 | 3,167 | 4.7 | 69.1 |
7 | 1,000 | 19,000 | 5.3 | 2,714 | 4.0 | 73.1 |
8 | 1,000 | 19,000 | 5.3 | 2,375 | 3.5 | 76.6 |
9 | 1,000 | 19,000 | 5.3 | 2,111 | 3.1 | 79.7 |
10 | 1,000 | 19,000 | 5.3 | 1,900 | 2.8 | 82.6 |
11 | 1,000 | 19,000 | 5.3 | 1,727 | 2.6 | 85.1 |
12 | 1,000 | 19,000 | 5.3 | 1,583 | 2.3 | 87.5 |
13 | 1,000 | 19,000 | 5.3 | 1,462 | 2.2 | 89.6 |
14 | 1,000 | 19,000 | 5.3 | 1,357 | 2.0 | 91.7 |
15 | 1,000 | 19,000 | 5.3 | 1,267 | 1.9 | 93.5 |
16 | 1,000 | 19,000 | 5.3 | 1,188 | 1.8 | 95.3 |
17 | 1,000 | 19,000 | 5.3 | 1,118 | 1.7 | 97.0 |
18 | 1,000 | 19,000 | 5.3 | 1,056 | 1.6 | 98.5 |
19 | 1,000 | 19,000 | 5.3 | 1,000 | 1.5 | 100.0 |
19,000 | 361,000 | 67,407 | 100.0 |
見方を変えていうなら、1試合だけでアンケート調査をすると、「毎試合来る人」は「1試合しか来ない人」の19倍の確率でアンケートに答えている。結果としてこのアンケート調査は、ヘビーユーザーの行動や意見を反映したものになるということなのである。私はこのようなサンプルの歪みに「標本バイアス」という名前をつけた。
統計的な用語を使うなら「一試合」型と「全試合」型とでは、調査の母集団が異なる。一試合で行う調査の母集団は「その試合を見に来た人」である。これに対して全試合で調査を行う場合の母集団は「そのシーズンに、試合を見に来た人」である。では試合の主催者は、どちらのデータが欲しいのか。あるいは、質問する内容と母集団との間に、整合性はあるのだろうか。
たとえば
と考える人の割合は、観戦頻度によって違うはずである。ヘビーユーザーについては、すでにグッズをほぼ「買い尽くして」いるとすると、あまり売店に寄らない。これに対して始めてくる人は、記念に何か買って帰りたい。お弁当については、ヘビーユーザーならすぐに売り切れると分かっているのでスタジアムに来る前に買っているから不満がない等々である。あるいはヘビーユーザーはシャトルバスの混雑が分かっているので早めに来るだろうし、自家用車でくる場合もやはり早めに来てスタジアムに近い駐車スペースを確保する。つまり、「一試合」型の調査で売店やお弁当、シャトルバス、駐車場について不満が少ないとしても安心できないのである。同様に、「また試合を見に来たい」という人が多いとしても、そう回答したのはヘビーユーザーで、その人たちが回答者として過大に集計されているかもしれないという点に留意が必要である。
重要な結論は「リーグ戦のスタジアムでの観客調査は、標本バイアスがあるのでエビデンスにならないかもしれない」というものである。実務家と政策担当者はエビデンスを求め、学者はエビデンスを疑う。そしてときどき、エビデンスだと思われている常識の誤りに気付く。