問題一覧
1
統計量について、次のなかから正しい説明を選んでください。 1.統計量とは、得られた標本データから計算される変量のことである。 2.統計量とは、得られた標本データから計算できる統計値の種類数のことである。 3.統計量とは、得られた標本データの合計のことである。 4.統計量とは、得られた標本データすべてを指しており、標本データの値を意昧する。
1
2
次の量的データのうち、比率尺度であるものを選んでください。 1.摂氏で測られた気温 2.食塩水中の塩分濃度 3.カレンダーの日付 4知能指数
2
3
標本データとして、次の5 個のデータが与えられたとします。 1.0 2.0 3.0 4.0 5.0 これらのデータの不偏分散にもっとも近い値を次のなかから選んでください。 1.2.00 2.2.50 3.3.00 4.3.50
2.50
4
次の文はデータについての説明です。 EXCELで行うデータ分析では、分析対象を(①)に、変数を(②)にそれぞれ採用するのが一般的である。
行方向, 列方向
5
次のデータは、それぞれ「量的データ」「質的データ」のどちらかを示しなさい。 ・ある商品の日々の売上個数を記録したデータ
量的データ
6
次のデータは、それぞれ「量的データ」「質的データ」のどちらかを示しなさい。 ・アンケートで回答者の性別を記録したデータ
質的データ
7
次のデータは、それぞれ「量的データ」「質的データ」のどちらかを示しなさい。 ・ある日の売上金額(売上高)が平均以上か否かを記したデータ
質的データ
8
次のデータは、それぞれ「量的データ」「質的データ」のどちらかを示しなさい。 ある日の売上金額(売上高)が平均以上か否かを記したデータ
質的データ
9
次のデータは、それぞれ「量的データ」「質的データ」のどちらかを示しなさい。 性格が「男性っぽい」か否かを判断して10点満点で答えたデータ
量的データ
10
次のデータは、なんと呼ばれるデータですか。適切なものを選びなさい。 ・ある日の営業終了時点で記録した複数店舗の売上高のデータ (1) クロスセクションデータ (2) 時系列データ (3) パネルデータ
クロスセクションデータ
11
次のデータは、なんと呼ばれるデータですか。適切なものを選びなさい。 ・ある店舗の1か月について、日々の営業終了時点での売上高を記録したデータ
時系列データ
12
次のデータは、なんと呼ばれるデータですか。適切なものを選びなさい。 ・複数店舗について、ある月の日々の売上高を記録したデータ
パネルデータ
13
母集団データと標本データについて、次の中から誤っている記述を選びなさい。
母集団データで計算した統計量は誤差を含む。
14
次に示す変数の要約に適した分析手法を2つ答えなさい。 ・来店者の性別データ
度数表, 出現比率
15
重回帰分析を行うときの質的変数の扱い方法に関する説明として、正しいものをす べて選びなさい。
原因系変数が質的変数の場合、0か1かのダミー変数に変換すると回帰分析に用い ることができる。, ダミー変数を用いた回帰分析の結果、得られた係数(傾き)は、その選択肢があては まる (1になる)ときのyの増減分である。
16
時系列データの回帰分析にダミー変数を採用する際の説明として、正しいものをす べて選びなさい。
月次データですべての月のデータがある場合、月数-1の11個のダミー変数を用い ることになる。, 変数選択を行っても、必ずしもすべてのダミー変数が結果系の変数に影響するとは限 らない。, 有意ではない(有意水準を超えたp値になった) ダミー変数を取り除いた場合には、 基準とした選択肢に含めることになる。
17
重回帰分析に関する説明として、正しいものを選びなさい
重回帰分析は、y=Bo + BX + B2X2+B+・・・というように原因系変数からの 影響をそれぞれ係数として推定できる。
18
重回帰分析に関する説明として、正しいものをすべて選びなさい。
重決定R2(決定係数)は、採用した× (原因系変数)で説明できるy (結果系変数) の動き(変動)の割合を示している。, 重決定2(決定係数)は、採用した× (原因系変数)による説明力と考えられる。, 補正R2は、原因系変数の数が増えた分を割り引いたR2である。
19
重回帰分析の出力に関する説明として、正しいものを2つ選びなさい。
採用したそれぞれの原因系変数ごとに、係数(傾き)と有意確率 (p値)が出力され る。, p値をもとに分析に採用すべき原因系変数か否かを判断し、変数を選ぶ作業を「変数 選択」という。
20
p値に基づく判断と変数選択の説明として、正しいものを2つ選びなさい。
p値が有意水準より小さい変数は、結果系に影響していると判断できる。, p値が有意水準より大きい変数が複数あり、変数選択を試みるときは、1つずつモデ ルから削除したり、追加したりする必要がある。
21
原因系が量的変数で、結果系が質的変数の分析についての説明として、正しいもの を2つ選びなさい。
結果系変数が2択の質的変数であれば、それぞれの選択肢を0か1かの値に変換す れば、回帰分析で分析できる。, 計算によって得られた予測値について0.5以上なら1、0.5未満なら0に置き換え ると予測することができる。
22
原因系が量的変数で、結果系が質的変数の分析の説明として、正しいものを2つ選 びなさい。
結果系の変数が2択の質的変数であれば、それぞれの選択肢を0か1かなどの数値 に変換して行う回帰分析に、「ロジスティック回帰分析」という手法がある。, ロジスティック回帰分析は、予測値は必ず0から1の間を取る。
23
原因系が魔的変数同士の関係性を分析する手法として「相関」分析があります。「相 説明について、正しいものを選びなさい。
CORREL関数や分析ツールで求める相関は、ピアソンの格率相関を指す。
24
ピアソンの積率相関(以下、相関と略す)の説明について、正しいものを2つ選び なさい。
相関にもの値を計算することができる。, p値が設定した有意水準よりも小さい場合、直線関係があると判断できる。
25
原因系が量的変数で、結果系が量的変数の関係性を分析する手法の説明として、正 しいものを2つ選びなさい。
回帰分析は、二変数の間に因果の関係を想定している。, 回帰分析の結果、y=axx+b(a:傾き、b:切片)という一次式を推定できる。
26
回帰分析の説明として、正しいものをすべて選びなさい。
回帰分析の係数には、傾きと切片がある。, 傾きは、×が一単位動いた際のyの変化量である。, R2 (R2乗)は、xで説明できるyの動き(変動)の割合を示している。
27
回帰分析の説明として、正しいものを2つ選びなさい。
分析ツールによる回帰分析の結果に出力される「残差」は予測値と実測値の差である。, 「残差」が大きい行(対象)は、その×では説明できない部分が多いということにな る。
28
原因系(質的変数)から結果系(量的変数)への影響を仮説とする際に、グループ ことに平均を比較する検定が用いられる。次の中から、平均を比較する検定を2つ 選びなさい。
t検定, 一元配置分散分析
29
原因系(質的変数)から結果系 (量的変数)への影響を仮説とする際に、グループ ごとに分散(ばらつき)を比較する検定が用いられる。次の中から、分散(ばらつ き)を比較する検定を選びなさい。
F検定
30
2グループの平均を比較する手法として、「対応のない検定」がある。そのうち、 「t検定:等分散を仮定した2標本による検定」 と 「t検定: 分散が等しくないと 仮定した2標本による検定」の使い分けに関する説明として、正しいものを2つ選 びなさい。
事前にF検定をおこない、分散が等しいと仮定すべきか否かを確認する。, Excel の分析ツールのF検定で出力される有意確率は「片側」である。
31
Excelの分析ツール「対応のない検定」で出力されたデータの読み方について、 正しいものをすべて選びなさい。
P (T<=t)の値は、有意確率を表している。, 5%有意水準とした場合、有意確率が0.03ならば、2グループの平均に差があると 考えられる。 , 対応のないt検定は平均の差の検定なので、平均値自体の差についても確認すること が重要である。
32
3グループ以上の平均を比較する場合の説明として、正しいものを選びなさい。
一元配置分散分析を用いると3グループ以上の平均の比較が一度の検定で行える。
33
一対のデータによる平均の比較(対応のあるt検定)の説明について、正しいもの を2つ選びなさい。
同じ対象についての2つのデータを対と考えて、両者に差があるかを検定する手法 である。, グループごとのデータ件数は同じでなければならない。
34
クロス集計表をもとにした仮説検定手法として、適切なものを選びなさい。
x²(カイ二乗) 検定
35
仮説検定と有意確率の関係のうち、正しいものを2つ選びなさい。
「原因系から結果系に影響がある」という仮説が、このデータからたまたま生じてい ると考えられる確率が「有意確率」である。, 有意確率は、0から1の範囲の値を取る。
36
カイニ乗検定における有意確率の説明のうち、正しいものを選びなさい。
仮説が成り立つと考えられるかを有意確率から判断するための基準が有意水準である。
37
次に示す Excel でカイ二乗検定を行う手順の正誤を答えなさい。
観測値の集計表を用意する。このとき、度数を示した表になっていることに注意 する。, 原因系の選択肢で分けていない合計の構成度数を使用して、結果系の選択肢の構 成比率を計算する。, 手順2で得られた構成比率を、原因系の選択肢の度数にそれぞれ掛けて、期待 度数のクロス集計表を作る。, 「CHISQ.TEST」関数と、観測度数の集計表、期待度数の集計表を使用して有 意確率を求める。
38
カイニ乗検定を使用するときの注意点として、正しいものを選びなさい。
観測度数の集計表の各セルには、少なくとも5以上の度数があることが望ましい。
39
残差分析の説明として、正しいものをすべて選びなさい。
残差分析は、クロス集計表の各セルの値について、それぞれ有意な差があるといえる かを検証できる分析手法である。, 残差分析では残差の符号(十一)で、そのセルが期待度数よりも大きい(もしくは 小さい)と判断できる。, 残差分析では有意確率が有意水準よりも小さければ、そのセルは有意に大きい(もし くは小さい)と判断できる。
40
二変数の関係を表した仮説について、それぞれどのタイプになるか正しいものを選びなさい。
原因系が質的データで、結果系も質的データ
41
二変数の関係を表した仮説について、それぞれどのタイプになるか正しいものを選 びなさい。 ・営業担当者1人当たりの売上高平均は、担当エリアごとに異なる。
原因系が質的データで、結果系が量的データ
42
二変数の関係を表した仮説について、それぞれどのタイプになるか正しいものを選 びなさい。 ・営業担当者1人あたりの売上高は、勤続年数が長いほど平均値が高い。
原因系が量的データで、結果系も量的データ
43
二変数の関係を表した仮説について、それぞれどのタイプになるか正しいものを選 びなさい。 ・広告を出した日と出さなかった日では、来店者の男女比が異なる。
原因系が質的データで、結果系も質的データ
44
「原因系が質的データで、結果系も質的データ」という二変数の関係を表した仮説を 分析する方法として、適切なものを2つ選びなさい。
原因系の選択肢ごとに、結果系の選択肢の出現数をまとめたクロス集計表を 用いる。, クロス集計表を比率にする場合、原因系の選択肢ごとに合計が100%になるように 計算する。
45
「原因系が質的データで、結果系が量的データ」という二変数の関係を表した仮説を 分析する方法として、適切なものを選びなさい。
原因系の選択肢ごとに、平均値や標準偏差を比較することで、このタイプの関係性を 分析することができる。
46
「原因系が量的データで、結果系も量的データ」という二変数の関係を表した仮説を 分析する方法として、適切なものを2つ選びなさい。
散布図を描くことで、このタイプの関係性を分析することができる。, 直線関係があるか否かの判断には「相関」 係数という指標を用いることができる。
47
データのばらつきを示す「分散」の説明として、正しいものを選びなさい。
分散は、値が大きいほど平均周りのデータのばらつきが大きいことを示す。
48
データのばらつきを示す「標準偏差」の説明として、正しいものを2つ選びなさい。
標準偏差は、分散の平方根を計算した値である。, 標準偏差は、平均値と同じ単位を付けて読むことができる。
49
データのばらつきを示す「分散・標準偏差」の説明として、正しいものをすべて選 びなさい。
母集団データで計算する分散・標準偏差は、分母が「データの個数」である。, 標本データで計算する分散・標準偏差(不偏分散、不傷標準偏差)は、分母が 「データの個数-1」である。 , 母集団データで標準偏差を計算する関数は 「STDEV.P」である。, 標本データで標準偏差(不偏標準偏差)を計算する関数は、「STDEV.S」である。
50
標準偏差と標準誤差に関する説明として、正しいものを3つ選びなさい。
標準偏差は、データのばらつきを示す指標である。, 標準偏差は、母集団データと標本データのそれぞれで計算できる。 , 標準誤差は、推定した平均値の精度を判断する指標である。
51
異なるグループのばらつきを比較する際の説明として、正しいものを2つ選びなさ い。
グループごとに平均値が大きく異なる場合に標準偏差を用いるならば、変動係数を計 舞し比較に用いれば、平均値の違いを加味した比較ができる。, 変動係数は、「標準偏差÷平均」で求めることができる。
52
単位が異なる変数を比較する場合の説明として、正しいものを2つ選びなさい。
個々の値から平均を引き、標準偏差で割ることで、データを標準化できる。, 標準化するとは、個々のズレが標準偏差の何個分かを計算すること、つまりばらつき を比率にして単位を消すことで、異なる単位の値のばらつきを比較できる。
53
偏差値=標準化の値×(①)+(②)
①10②50
54
量的データとは
加減乗除できる、かつ意味がある。平均値に意味があるもの
55
質的データとは?
文字列や数値に置き換えしたもの
56
母集団とは?
真に知りたい全データ
57
標本データとは?
一部抜き取ったデータ
58
推測統計とは?
母集団の解析
59
記述統計とは?
標本データの解析
60
標準誤差とは?
母集団を考えた時の平均値の推定精度。データ個数やバラツキに影響を受ける
61
標準偏差とは?
平均値からのばらつき。平均値からの距離の程度
62
度数表とは?
各選択肢の出現頻度を確認する。行列でクロス集計表ともいう。ピボットテ ーブルによる集計が便利
63
グラフとは?
結果を一目でわかるようにする。棒グラフや円グラフなど
64
度数分布表とは?
連続した値を区切って質的データに変換し、区間ごとの出現頻度でまとめた表
65
基本統計量とは?
量的データの把握方法。数値で全体像を把握する, データの中心を表す統計量
66
平均値とは?
値をすべて合計し、データの個数で割ったもの
67
中央値とは?
データを大きい順 (もしくは小さい順) から並べた時にちょうど真ん中に来る値
68
最頻値とは?
もっとも出現頻度が多い値
69
歪度とは?
分布が左右対称かを表す統計量。0で左右対称。<0で左寄り
70
尖度とは?
分布のとがり具合を表す統計量。0で正規分布。>0で尖っている
71
分散とは?
平均値との差を2乗して平均をとったもの
72
標準偏差とは?
平均値との差(偏差)の程度を表したもの。分散のをとったもの。±10 内に68%のものが存在する
73
変動係数とは?
標準偏差は平均値の大きさによって大きく異なる。標準偏差を平均値で割 ることで平均値の異なるもの同士でも比較できるようになる→変動係数=標準偏差/平均
74
標準偏差とは?
母集団(対象データを全体として見る) の標準偏差のこと。STDEV.P (データ範囲)で出す
75
不変標準偏差とは?
標本から母集団の標準偏差を見積もったもの。STDEV.S (データ範 囲)で出す。データの個数-1で割っている(データの個数から1引く方が誤差が大きくな ることから)
76
標準誤差とは?
一部のデータで計算した母集団の平均値の精度。標本から出した平均値が 母集団の真の平均値からどれくらいの幅にあるかを示す