Search
国際情報
International information

「スポーツ・フォー・オール」の理念を共有する国際機関や日本国外の組織との連携、国際会議での研究成果の発表などを行います。また、諸外国のスポーツ政策の比較、研究、情報収集に積極的に取り組んでいます。

知る学ぶ
Knowledge

日本のスポーツ政策についての論考、部活動やこどもの運動実施率などのスポーツ界の諸問題に関するコラム、スポーツ史に残る貴重な証言など、様々な読み物コンテンツを作成し、スポーツの果たすべき役割を考察しています。

SSF「スポーツライフ・データ2022」の自由回答を対象としたヴィジュアル分析:ワードクラウドの適用

2024年1月25日

1. はじめに

 本稿はSPORT POLICY INCUBATOR(33) (横山, 2023)において報告した成果について、そこでは紹介できなかった、ワードクラウドを適用したヴィジュアル分析による結果の追加ダイジェスト報告という位置付けである。

 分析対象となる全国調査SSF「スポーツライフ・データ」には『スポーツに対する思い』や『スポーツの普及や発展』に対する自由回答欄が、以前から継続的に設けられてきた。わが国のスポーツの政策や方針を検討するにあたり非常に貴重なテキストデータと考えられるにもかかわらず、当該データが外部公開されていなかったこともあり、残念ながら、これまで分析されることはほとんどなかった。

 先のSPORT POLICY INCUBATOR(33) においては、当該テキストデータを対象としてテキストマイニングの形態素解析を援用し、抽出された単語の出現頻度に関する分析をおこなった。具体的な分析結果および考察については、横山(2024)を参照していただきたい。本稿では、ワードクラウドによるヴィジュアル表現に焦点を当てて報告していく。

2. ワードクラウドによるヴィジュアル分析

 テキストマイニングにより抽出された単語の出現頻度分析結果を視覚化するため、ワードクラウドによるヴィジュアル分析を実施した。ワードクラウドとは、単語の出現頻度にあわせて文字の大きさを変えて視覚化したグラフである。例えば、出現頻度の多い単語はより大きなフォントで表現され、頻度の少ない単語はより小さなフォントで表示される(AI Academy Media, 2023)。

1)男女全体からみたワードクラウド

 分析対象となる有効なテキストデータ(男女1,180)について、設問文にある「スポーツ」および「思い」という単語を除く出現頻度が30以上の単語に対してワードクラウドを適用した結果を図1に示す。

 図1を概観すると、「身体」「健康」および「運動」という単語グループの出現頻度が相対的に最も多いと一目で読み取れる。ワードクラウドは、このように一見するだけで、相対的に重要度の高い単語を瞬時に認識することが可能となるという特長を有する。

さらに、出現頻度に応じて単語を色およびフォントの大きさを変えたり、単語の位置を中心から周辺空間へと配置することによって、単語と頻度数字からなる集計表や棒グラフよりもインパクトのある印象を与えることができよう。ただし、ワードクラウド空間における単語間の距離は、内容や文脈を考慮した関係性の近さを表してはいないことを留意しておかなければならない。

図1 ワードクラウド:「スポーツへの思いや意見」に関する自由回答(回答者数 男女 1,180;「スポーツ」「思い」を除く出現頻度30以上)

図1 ワードクラウド:「スポーツへの思いや意見」に関する自由回答(回答者数 男女 1,180;「スポーツ」「思い」を除く出現頻度30以上)

2)男性からみたワードクラウド

 分析対象となる有効なテキストデータ(男性 543)について、「スポーツ」および「思い」という単語を除く出現頻度が15以上の単語に対してワードクラウドを適用した結果を図2に示す。

 図2を概観すると、「欲しい」「健康」および「身体」という単語グループの相対的出現頻度が最大であることを瞬時に読み取れる。次に、「人」「運動」および「時間」と続いて出現頻度が減少している。ワードクラウド空間の中心にある大きなフォントから周辺に広がっていくにしたがってフォントが小さくなっていくことで、単語の出現頻度が最大値から徐々に減少していくことを表している。

図2 ワードクラウド:「スポーツへの思いや意見」に関する自由回答(回答者数 男性 543;「スポーツ」「思い」を除く回答頻度15以上)

図2 ワードクラウド:「スポーツへの思いや意見」に関する自由回答(回答者数 男性 543;「スポーツ」「思い」を除く回答頻度15以上)

3)女性からみたワードクラウド

 分析対象となる有効なテキストデータ(女性 637)について、「スポーツ」および「思い」という単語を除く出現頻度が15以上の単語に対してワードクラウドを適用した結果を図3に示す。

 図3を概観すると、「身体」および「運動」「健康」という単語グループが相対的に突出して出現頻度が高いと一瞬で読み取れよう。次に、「自分」「良い」「人」という単語が続く。

図3 ワードクラウド:「スポーツへの思いや意見」に関する自由回答(回答者数 女性 637; 「スポーツ」「思い」を除く回答頻度15以上)

図3 ワードクラウド:「スポーツへの思いや意見」に関する自由回答(回答者数 女性 637; 「スポーツ」「思い」を除く回答頻度15以上)

3.概括

 本稿では、SSF「スポーツライフ・データ」にある『スポーツに対する思い』や『スポーツの普及や発展』に対する自由回答欄のテキストデータを対象として、テキストマイニングの形態素解析を援用し、抽出された単語の出現頻度についてワードクラウドによりヴィジュアル分析をおこなった。結果および考察について、以下に要約する。

1)男女全体については、「身体」「健康」および「運動」の出現頻度が最も多かった。

2)男性については、「欲しい」「健康」および「身体」の出現頻度が最も多かった。

3)女性については、「身体」および「運動」「健康」の出現頻度が最も多かった。

4)「身体」「健康」「運動」という単語は、スポーツを大きく展開していくために重要な意味を持つキーワードであると考えられよう。

5)ワードクラウドは、テキスト分析において、単語間の相対的重要性を瞬時に識別し得る有益でインパクトのあるヴィジュアル表現方法となり得る。ただし、ワードクラウド上にある単語の空間配置は、単語間の関係性の距離を表していないことに留意しなければならない。

 今後は、抽出された単語間の関係性について分析する追加的研究が必要であることは言うまでもない。さらに、過去のSSF「スポーツライフ・データ」における同自由回答のテキストデータについて遡りテキストマイニングを適用することで、スポーツに関するキーワードの経年的変化やトレンドについて明らかにしていくことは、これからの日本のスポーツ政策を考えていく上で重要な基礎資料の一つとなると考えられよう。

<参考文献>

AI Academy Media(2023)【テキストマイニング】WordCloud(ワードクラウド)とは.
https://aiacademy.jp/media/?p=3659#:~:text=%E3%83%AF%E3%83%BC%E3%83%89%E3%82%AF%E3%83%A9%E3%82%A6%E3%83%89%EF%BC%88wordcloud%EF%BC%89%E3%81%A8%E3%81%AF,%E3%81%AF%E3%80%81%E5%B0%8F%E3%81%95%E3%81%8F%E8%A1%A8%E7%A4%BA%E3%81%95%E8C%E3%81%BE%E3%81%99%E3%80%82

笹川スポーツ財団(2023)スポーツライフ・データ 2022 ─スポーツライフに関する調査報告書. 笹川スポーツ財団.

横山文人(2023)「スポーツライフ・データ 2022」からみたスポーツ政策に係るキーワード:自由回答を対象としたテキストマイニング. SPORT POLICY INCUBATOR(33): 笹川スポーツ財団.
https://www.ssf.or.jp/knowledge/spi/33.html

横山文人(2024; in press) わが国の成人のスポーツライフに関するテキストマイニングとヴィジュアル分析 ~SSF「スポーツライフ・データ2022」における自由回答を対象として~. ホスピタリティ・マネジメント 13(1). 亜細亜大学

  • 横山 文人 横山 文人   Yokoyama Fumito, Ph.D. 亜細亜大学 経営学部 ホスピタリティ・マネジメント学科 准教授/笹川スポーツ財団 理事/笹川スポーツ財団 上席特別研究員 1991年 米国ミシガン州立大学大学院 公園・レクリエーション資源学科博士課程修了(Ph.D.)後、(株)三菱総合研究所(研究員)を経て現職。 専門分野は経営学領域に所属し、サービス・ホスピタリティ・スポーツを対象にマーケティングおよびデータ科学をツールとしてアプローチする。長年にわたりSSFのスポーツライフ調査委員ならびに研究助成事業の選考部会長を務め、国民のスポーツライフに関する実態調査においても高い専門性を有する。
    Consulting editor of “Journal of Hospitality Marketing & Management” 、BMIA(ビジネスモデルイノベーション協会)認定コンサルタント。
データの使用申請

最新の調査をはじめ、過去のスポーツライフ・データのローデータ(クロス集計結果を含む)を提供しています。

活用例

  1. 政策立案:所属自治体と全国の比較や調査設計に活用(年齢や性別、地域ごとの特徴を把握)
  2. 研究:研究の導入部分の資料や仮説を立てる際に活用(現状の把握、問題提起、仮説、序論)
  3. ビジネス:商品企画や営業の場面で活用(市場調査、データの裏付け、潜在的なニーズの発見)
テーマ

スポーツライフ・データ

キーワード
年度

2023年度

担当研究者