統計学の基本としてクロス集計表についてまとめました
今回は統計学の基本となるクロス集計表についてまとめました。以下はある架空の小規模な中学校 A において行われた部活動所属調査を例にした解説です。
ある中学校 A では3つの部活動がありそれぞれの部活動に所属する男女の数を集計しました。すると、次のような結果を得ました。

2つの異なるカテゴリーに基づいてデータを同時に分類し、それぞれの組み合わせごとの度数をまとめたものをクロス集計表といいます。クロス集計表は英語で「Cross Tabulation Table」と呼ばれます。
通常クロス集計表ではカテゴリー変数 X の項目を列に、変数 Y の項目を行に配置します。このとき以下のように言葉が定義されています。
・表側:表の左側にある変数 X。
・表頭:表の上部にある変数 Y。
・セル:行と列が交わってできた枠。
・周辺度数:列の右端と行の一番下に表示された全合計以外の数値。それぞれの行と列の合計値。
・相対度数:各セルの度数を周辺度数または全度数で割ったもの。通常パーセント(%)で表します。
補足すると、相対度数の表示の仕方は3つあり「横比の相対度数」「縦比の相対度数」「全度数に対応する相対度数」です。その例を示します。



横比または縦比の相対度数が用いられることが多く、全度数に対応する相対度数はほとんど用いられません。
このように、クロス集計表を用いることで視覚的に2つの事象の関係性を見ることができます。統計の基本として押さえておきたいですね。
【参考文献】
Hori, K. (2022). An introduction to statistics in linguistics (7): How to analyze crosstabulation tables (Part 1). Mathematical Linguistics, 33(7), 546–556.