2024年1月25日
- 調査・研究
© 2020 SASAKAWA SPORTS FOUNDATION
© 2020 SASAKAWA SPORTS FOUNDATION
スポーツ政策研究所を組織し、Mission&Visionの達成に向けさまざまな研究調査活動を行います。客観的な分析・研究に基づく実現性のある政策提言につなげています。
自治体・スポーツ組織・企業・教育機関等と連携し、スポーツ推進計画の策定やスポーツ振興、地域課題の解決につながる取り組みを共同で実践しています。
「スポーツ・フォー・オール」の理念を共有する国際機関や日本国外の組織との連携、国際会議での研究成果の発表などを行います。また、諸外国のスポーツ政策の比較、研究、情報収集に積極的に取り組んでいます。
日本のスポーツ政策についての論考、部活動やこどもの運動実施率などのスポーツ界の諸問題に関するコラム、スポーツ史に残る貴重な証言など、様々な読み物コンテンツを作成し、スポーツの果たすべき役割を考察しています。
2024年1月25日
本稿はSPORT POLICY INCUBATOR(33) (横山, 2023)において報告した成果について、そこでは紹介できなかった、ワードクラウドを適用したヴィジュアル分析による結果の追加ダイジェスト報告という位置付けである。
分析対象となる全国調査SSF「スポーツライフ・データ」には『スポーツに対する思い』や『スポーツの普及や発展』に対する自由回答欄が、以前から継続的に設けられてきた。わが国のスポーツの政策や方針を検討するにあたり非常に貴重なテキストデータと考えられるにもかかわらず、当該データが外部公開されていなかったこともあり、残念ながら、これまで分析されることはほとんどなかった。
先のSPORT POLICY INCUBATOR(33) においては、当該テキストデータを対象としてテキストマイニングの形態素解析を援用し、抽出された単語の出現頻度に関する分析をおこなった。具体的な分析結果および考察については、横山(2024)を参照していただきたい。本稿では、ワードクラウドによるヴィジュアル表現に焦点を当てて報告していく。
テキストマイニングにより抽出された単語の出現頻度分析結果を視覚化するため、ワードクラウドによるヴィジュアル分析を実施した。ワードクラウドとは、単語の出現頻度にあわせて文字の大きさを変えて視覚化したグラフである。例えば、出現頻度の多い単語はより大きなフォントで表現され、頻度の少ない単語はより小さなフォントで表示される(AI Academy Media, 2023)。
分析対象となる有効なテキストデータ(男女1,180)について、設問文にある「スポーツ」および「思い」という単語を除く出現頻度が30以上の単語に対してワードクラウドを適用した結果を図1に示す。
図1を概観すると、「身体」「健康」および「運動」という単語グループの出現頻度が相対的に最も多いと一目で読み取れる。ワードクラウドは、このように一見するだけで、相対的に重要度の高い単語を瞬時に認識することが可能となるという特長を有する。
さらに、出現頻度に応じて単語を色およびフォントの大きさを変えたり、単語の位置を中心から周辺空間へと配置することによって、単語と頻度(数字)からなる集計表や棒グラフよりもインパクトのある印象を与えることができよう。ただし、ワードクラウド空間における単語間の距離は、内容や文脈を考慮した関係性の近さを表してはいないことを留意しておかなければならない。
図1 ワードクラウド:「スポーツへの思いや意見」に関する自由回答(回答者数 男女 1,180;「スポーツ」「思い」を除く出現頻度30以上)
分析対象となる有効なテキストデータ(男性 543)について、「スポーツ」および「思い」という単語を除く出現頻度が15以上の単語に対してワードクラウドを適用した結果を図2に示す。
図2を概観すると、「欲しい」「健康」および「身体」という単語グループの相対的出現頻度が最大であることを瞬時に読み取れる。次に、「人」「運動」および「時間」と続いて出現頻度が減少している。ワードクラウド空間の中心にある大きなフォントから周辺に広がっていくにしたがってフォントが小さくなっていくことで、単語の出現頻度が最大値から徐々に減少していくことを表している。
図2 ワードクラウド:「スポーツへの思いや意見」に関する自由回答(回答者数 男性 543;「スポーツ」「思い」を除く回答頻度15以上)
分析対象となる有効なテキストデータ(女性 637)について、「スポーツ」および「思い」という単語を除く出現頻度が15以上の単語に対してワードクラウドを適用した結果を図3に示す。
図3を概観すると、「身体」および「運動」「健康」という単語グループが相対的に突出して出現頻度が高いと一瞬で読み取れよう。次に、「自分」「良い」「人」という単語が続く。
図3 ワードクラウド:「スポーツへの思いや意見」に関する自由回答(回答者数 女性 637; 「スポーツ」「思い」を除く回答頻度15以上)
本稿では、SSF「スポーツライフ・データ」にある『スポーツに対する思い』や『スポーツの普及や発展』に対する自由回答欄のテキストデータを対象として、テキストマイニングの形態素解析を援用し、抽出された単語の出現頻度についてワードクラウドによりヴィジュアル分析をおこなった。結果および考察について、以下に要約する。
1)男女全体については、「身体」「健康」および「運動」の出現頻度が最も多かった。
2)男性については、「欲しい」「健康」および「身体」の出現頻度が最も多かった。
3)女性については、「身体」および「運動」「健康」の出現頻度が最も多かった。
4)「身体」「健康」「運動」という単語は、スポーツを大きく展開していくために重要な意味を持つキーワードであると考えられよう。
5)ワードクラウドは、テキスト分析において、単語間の相対的重要性を瞬時に識別し得る有益でインパクトのあるヴィジュアル表現方法となり得る。ただし、ワードクラウド上にある単語の空間配置は、単語間の関係性の距離を表していないことに留意しなければならない。
今後は、抽出された単語間の関係性について分析する追加的研究が必要であることは言うまでもない。さらに、過去のSSF「スポーツライフ・データ」における同自由回答のテキストデータについて遡りテキストマイニングを適用することで、スポーツに関するキーワードの経年的変化やトレンドについて明らかにしていくことは、これからの日本のスポーツ政策を考えていく上で重要な基礎資料の一つとなると考えられよう。
<参考文献>
AI Academy Media(2023)【テキストマイニング】WordCloud(ワードクラウド)とは.
https://aiacademy.jp/media/?p=3659#:~:text=%E3%83%AF%E3%83%BC%E3%83%89%E3%82%AF%E3%83%A9%E3%82%A6%E3%83%89%EF%BC%88wordcloud%EF%BC%89%E3%81%A8%E3%81%AF,%E3%81%AF%E3%80%81%E5%B0%8F%E3%81%95%E3%81%8F%E8%A1%A8%E7%A4%BA%E3%81%95%E8C%E3%81%BE%E3%81%99%E3%80%82
笹川スポーツ財団(2023)スポーツライフ・データ 2022 ─スポーツライフに関する調査報告書. 笹川スポーツ財団.
横山文人(2023)「スポーツライフ・データ 2022」からみたスポーツ政策に係るキーワード:自由回答を対象としたテキストマイニング. SPORT POLICY INCUBATOR(33): 笹川スポーツ財団.
https://www.ssf.or.jp/knowledge/spi/33.html
横山文人(2024; in press) わが国の成人のスポーツライフに関するテキストマイニングとヴィジュアル分析 ~SSF「スポーツライフ・データ2022」における自由回答を対象として~. ホスピタリティ・マネジメント 13(1). 亜細亜大学
最新の調査をはじめ、過去のスポーツライフ・データのローデータ(クロス集計結果を含む)を提供しています。
活用例
スポーツライフ・データ
2023年度