EXCEL分析スペシャリスト
EXCEL分析スペシャリストの過去問
問題一覧
1
1
2
2
3
2.50
4
行方向, 列方向
5
量的データ
6
質的データ
7
質的データ
8
質的データ
9
量的データ
10
クロスセクションデータ
11
時系列データ
12
パネルデータ
13
母集団データで計算した統計量は誤差を含む。
14
度数表, 出現比率
15
原因系変数が質的変数の場合、0か1かのダミー変数に変換すると回帰分析に用い ることができる。, ダミー変数を用いた回帰分析の結果、得られた係数(傾き)は、その選択肢があては まる (1になる)ときのyの増減分である。
16
月次データですべての月のデータがある場合、月数-1の11個のダミー変数を用い ることになる。, 変数選択を行っても、必ずしもすべてのダミー変数が結果系の変数に影響するとは限 らない。, 有意ではない(有意水準を超えたp値になった) ダミー変数を取り除いた場合には、 基準とした選択肢に含めることになる。
17
重回帰分析は、y=Bo + BX + B2X2+B+・・・というように原因系変数からの 影響をそれぞれ係数として推定できる。
18
重決定R2(決定係数)は、採用した× (原因系変数)で説明できるy (結果系変数) の動き(変動)の割合を示している。, 重決定2(決定係数)は、採用した× (原因系変数)による説明力と考えられる。, 補正R2は、原因系変数の数が増えた分を割り引いたR2である。
19
採用したそれぞれの原因系変数ごとに、係数(傾き)と有意確率 (p値)が出力され る。, p値をもとに分析に採用すべき原因系変数か否かを判断し、変数を選ぶ作業を「変数 選択」という。
20
p値が有意水準より小さい変数は、結果系に影響していると判断できる。, p値が有意水準より大きい変数が複数あり、変数選択を試みるときは、1つずつモデ ルから削除したり、追加したりする必要がある。
21
結果系変数が2択の質的変数であれば、それぞれの選択肢を0か1かの値に変換す れば、回帰分析で分析できる。, 計算によって得られた予測値について0.5以上なら1、0.5未満なら0に置き換え ると予測することができる。
22
結果系の変数が2択の質的変数であれば、それぞれの選択肢を0か1かなどの数値 に変換して行う回帰分析に、「ロジスティック回帰分析」という手法がある。, ロジスティック回帰分析は、予測値は必ず0から1の間を取る。
23
CORREL関数や分析ツールで求める相関は、ピアソンの格率相関を指す。
24
相関にもの値を計算することができる。, p値が設定した有意水準よりも小さい場合、直線関係があると判断できる。
25
回帰分析は、二変数の間に因果の関係を想定している。, 回帰分析の結果、y=axx+b(a:傾き、b:切片)という一次式を推定できる。
26
回帰分析の係数には、傾きと切片がある。, 傾きは、×が一単位動いた際のyの変化量である。, R2 (R2乗)は、xで説明できるyの動き(変動)の割合を示している。
27
分析ツールによる回帰分析の結果に出力される「残差」は予測値と実測値の差である。, 「残差」が大きい行(対象)は、その×では説明できない部分が多いということにな る。
28
t検定, 一元配置分散分析
29
F検定
30
事前にF検定をおこない、分散が等しいと仮定すべきか否かを確認する。, Excel の分析ツールのF検定で出力される有意確率は「片側」である。
31
P (T<=t)の値は、有意確率を表している。, 5%有意水準とした場合、有意確率が0.03ならば、2グループの平均に差があると 考えられる。, 対応のないt検定は平均の差の検定なので、平均値自体の差についても確認すること が重要である。
32
一元配置分散分析を用いると3グループ以上の平均の比較が一度の検定で行える。
33
同じ対象についての2つのデータを対と考えて、両者に差があるかを検定する手法 である。, グループごとのデータ件数は同じでなければならない。
34
x²(カイ二乗) 検定
35
「原因系から結果系に影響がある」という仮説が、このデータからたまたま生じてい ると考えられる確率が「有意確率」である。, 有意確率は、0から1の範囲の値を取る。
36
仮説が成り立つと考えられるかを有意確率から判断するための基準が有意水準である。
37
観測値の集計表を用意する。このとき、度数を示した表になっていることに注意 する。, 原因系の選択肢で分けていない合計の構成度数を使用して、結果系の選択肢の構 成比率を計算する。, 手順2で得られた構成比率を、原因系の選択肢の度数にそれぞれ掛けて、期待 度数のクロス集計表を作る。, 「CHISQ.TEST」関数と、観測度数の集計表、期待度数の集計表を使用して有 意確率を求める。
38
観測度数の集計表の各セルには、少なくとも5以上の度数があることが望ましい。
39
残差分析は、クロス集計表の各セルの値について、それぞれ有意な差があるといえる かを検証できる分析手法である。, 残差分析では残差の符号(十一)で、そのセルが期待度数よりも大きい(もしくは 小さい)と判断できる。, 残差分析では有意確率が有意水準よりも小さければ、そのセルは有意に大きい(もし くは小さい)と判断できる。
40
原因系が質的データで、結果系も質的データ
41
原因系が質的データで、結果系が量的データ
42
原因系が量的データで、結果系も量的データ
43
原因系が質的データで、結果系も質的データ
44
原因系の選択肢ごとに、結果系の選択肢の出現数をまとめたクロス集計表を 用いる。, クロス集計表を比率にする場合、原因系の選択肢ごとに合計が100%になるように 計算する。
45
原因系の選択肢ごとに、平均値や標準偏差を比較することで、このタイプの関係性を 分析することができる。
46
散布図を描くことで、このタイプの関係性を分析することができる。, 直線関係があるか否かの判断には「相関」 係数という指標を用いることができる。
47
分散は、値が大きいほど平均周りのデータのばらつきが大きいことを示す。
48
標準偏差は、分散の平方根を計算した値である。, 標準偏差は、平均値と同じ単位を付けて読むことができる。
49
母集団データで計算する分散・標準偏差は、分母が「データの個数」である。, 標本データで計算する分散・標準偏差(不偏分散、不傷標準偏差)は、分母が 「データの個数-1」である。, 母集団データで標準偏差を計算する関数は 「STDEV.P」である。, 標本データで標準偏差(不偏標準偏差)を計算する関数は、「STDEV.S」である。
50
標準偏差は、データのばらつきを示す指標である。, 標準偏差は、母集団データと標本データのそれぞれで計算できる。, 標準誤差は、推定した平均値の精度を判断する指標である。
51
グループごとに平均値が大きく異なる場合に標準偏差を用いるならば、変動係数を計 舞し比較に用いれば、平均値の違いを加味した比較ができる。, 変動係数は、「標準偏差÷平均」で求めることができる。
52
個々の値から平均を引き、標準偏差で割ることで、データを標準化できる。, 標準化するとは、個々のズレが標準偏差の何個分かを計算すること、つまりばらつき を比率にして単位を消すことで、異なる単位の値のばらつきを比較できる。
53
①10②50
54
加減乗除できる、かつ意味がある。平均値に意味があるもの
55
文字列や数値に置き換えしたもの
56
真に知りたい全データ
57
一部抜き取ったデータ
58
母集団の解析
59
標本データの解析
60
母集団を考えた時の平均値の推定精度。データ個数やバラツキに影響を受ける
61
平均値からのばらつき。平均値からの距離の程度
62
各選択肢の出現頻度を確認する。行列でクロス集計表ともいう。ピボットテ ーブルによる集計が便利
63
結果を一目でわかるようにする。棒グラフや円グラフなど
64
連続した値を区切って質的データに変換し、区間ごとの出現頻度でまとめた表
65
量的データの把握方法。数値で全体像を把握する, データの中心を表す統計量
66
値をすべて合計し、データの個数で割ったもの
67
データを大きい順 (もしくは小さい順) から並べた時にちょうど真ん中に来る値
68
もっとも出現頻度が多い値
69
分布が左右対称かを表す統計量。0で左右対称。<0で左寄り
70
分布のとがり具合を表す統計量。0で正規分布。>0で尖っている
71
平均値との差を2乗して平均をとったもの
72
平均値との差(偏差)の程度を表したもの。分散のをとったもの。±10 内に68%のものが存在する
73
標準偏差は平均値の大きさによって大きく異なる。標準偏差を平均値で割 ることで平均値の異なるもの同士でも比較できるようになる→変動係数=標準偏差/平均
74
母集団(対象データを全体として見る) の標準偏差のこと。STDEV.P (データ範囲)で出す
75
標本から母集団の標準偏差を見積もったもの。STDEV.S (データ範 囲)で出す。データの個数-1で割っている(データの個数から1引く方が誤差が大きくな ることから)
76
一部のデータで計算した母集団の平均値の精度。標本から出した平均値が 母集団の真の平均値からどれくらいの幅にあるかを示す
問題一覧
1
1
2
2
3
2.50
4
行方向, 列方向
5
量的データ
6
質的データ
7
質的データ
8
質的データ
9
量的データ
10
クロスセクションデータ
11
時系列データ
12
パネルデータ
13
母集団データで計算した統計量は誤差を含む。
14
度数表, 出現比率
15
原因系変数が質的変数の場合、0か1かのダミー変数に変換すると回帰分析に用い ることができる。, ダミー変数を用いた回帰分析の結果、得られた係数(傾き)は、その選択肢があては まる (1になる)ときのyの増減分である。
16
月次データですべての月のデータがある場合、月数-1の11個のダミー変数を用い ることになる。, 変数選択を行っても、必ずしもすべてのダミー変数が結果系の変数に影響するとは限 らない。, 有意ではない(有意水準を超えたp値になった) ダミー変数を取り除いた場合には、 基準とした選択肢に含めることになる。
17
重回帰分析は、y=Bo + BX + B2X2+B+・・・というように原因系変数からの 影響をそれぞれ係数として推定できる。
18
重決定R2(決定係数)は、採用した× (原因系変数)で説明できるy (結果系変数) の動き(変動)の割合を示している。, 重決定2(決定係数)は、採用した× (原因系変数)による説明力と考えられる。, 補正R2は、原因系変数の数が増えた分を割り引いたR2である。
19
採用したそれぞれの原因系変数ごとに、係数(傾き)と有意確率 (p値)が出力され る。, p値をもとに分析に採用すべき原因系変数か否かを判断し、変数を選ぶ作業を「変数 選択」という。
20
p値が有意水準より小さい変数は、結果系に影響していると判断できる。, p値が有意水準より大きい変数が複数あり、変数選択を試みるときは、1つずつモデ ルから削除したり、追加したりする必要がある。
21
結果系変数が2択の質的変数であれば、それぞれの選択肢を0か1かの値に変換す れば、回帰分析で分析できる。, 計算によって得られた予測値について0.5以上なら1、0.5未満なら0に置き換え ると予測することができる。
22
結果系の変数が2択の質的変数であれば、それぞれの選択肢を0か1かなどの数値 に変換して行う回帰分析に、「ロジスティック回帰分析」という手法がある。, ロジスティック回帰分析は、予測値は必ず0から1の間を取る。
23
CORREL関数や分析ツールで求める相関は、ピアソンの格率相関を指す。
24
相関にもの値を計算することができる。, p値が設定した有意水準よりも小さい場合、直線関係があると判断できる。
25
回帰分析は、二変数の間に因果の関係を想定している。, 回帰分析の結果、y=axx+b(a:傾き、b:切片)という一次式を推定できる。
26
回帰分析の係数には、傾きと切片がある。, 傾きは、×が一単位動いた際のyの変化量である。, R2 (R2乗)は、xで説明できるyの動き(変動)の割合を示している。
27
分析ツールによる回帰分析の結果に出力される「残差」は予測値と実測値の差である。, 「残差」が大きい行(対象)は、その×では説明できない部分が多いということにな る。
28
t検定, 一元配置分散分析
29
F検定
30
事前にF検定をおこない、分散が等しいと仮定すべきか否かを確認する。, Excel の分析ツールのF検定で出力される有意確率は「片側」である。
31
P (T<=t)の値は、有意確率を表している。, 5%有意水準とした場合、有意確率が0.03ならば、2グループの平均に差があると 考えられる。, 対応のないt検定は平均の差の検定なので、平均値自体の差についても確認すること が重要である。
32
一元配置分散分析を用いると3グループ以上の平均の比較が一度の検定で行える。
33
同じ対象についての2つのデータを対と考えて、両者に差があるかを検定する手法 である。, グループごとのデータ件数は同じでなければならない。
34
x²(カイ二乗) 検定
35
「原因系から結果系に影響がある」という仮説が、このデータからたまたま生じてい ると考えられる確率が「有意確率」である。, 有意確率は、0から1の範囲の値を取る。
36
仮説が成り立つと考えられるかを有意確率から判断するための基準が有意水準である。
37
観測値の集計表を用意する。このとき、度数を示した表になっていることに注意 する。, 原因系の選択肢で分けていない合計の構成度数を使用して、結果系の選択肢の構 成比率を計算する。, 手順2で得られた構成比率を、原因系の選択肢の度数にそれぞれ掛けて、期待 度数のクロス集計表を作る。, 「CHISQ.TEST」関数と、観測度数の集計表、期待度数の集計表を使用して有 意確率を求める。
38
観測度数の集計表の各セルには、少なくとも5以上の度数があることが望ましい。
39
残差分析は、クロス集計表の各セルの値について、それぞれ有意な差があるといえる かを検証できる分析手法である。, 残差分析では残差の符号(十一)で、そのセルが期待度数よりも大きい(もしくは 小さい)と判断できる。, 残差分析では有意確率が有意水準よりも小さければ、そのセルは有意に大きい(もし くは小さい)と判断できる。
40
原因系が質的データで、結果系も質的データ
41
原因系が質的データで、結果系が量的データ
42
原因系が量的データで、結果系も量的データ
43
原因系が質的データで、結果系も質的データ
44
原因系の選択肢ごとに、結果系の選択肢の出現数をまとめたクロス集計表を 用いる。, クロス集計表を比率にする場合、原因系の選択肢ごとに合計が100%になるように 計算する。
45
原因系の選択肢ごとに、平均値や標準偏差を比較することで、このタイプの関係性を 分析することができる。
46
散布図を描くことで、このタイプの関係性を分析することができる。, 直線関係があるか否かの判断には「相関」 係数という指標を用いることができる。
47
分散は、値が大きいほど平均周りのデータのばらつきが大きいことを示す。
48
標準偏差は、分散の平方根を計算した値である。, 標準偏差は、平均値と同じ単位を付けて読むことができる。
49
母集団データで計算する分散・標準偏差は、分母が「データの個数」である。, 標本データで計算する分散・標準偏差(不偏分散、不傷標準偏差)は、分母が 「データの個数-1」である。, 母集団データで標準偏差を計算する関数は 「STDEV.P」である。, 標本データで標準偏差(不偏標準偏差)を計算する関数は、「STDEV.S」である。
50
標準偏差は、データのばらつきを示す指標である。, 標準偏差は、母集団データと標本データのそれぞれで計算できる。, 標準誤差は、推定した平均値の精度を判断する指標である。
51
グループごとに平均値が大きく異なる場合に標準偏差を用いるならば、変動係数を計 舞し比較に用いれば、平均値の違いを加味した比較ができる。, 変動係数は、「標準偏差÷平均」で求めることができる。
52
個々の値から平均を引き、標準偏差で割ることで、データを標準化できる。, 標準化するとは、個々のズレが標準偏差の何個分かを計算すること、つまりばらつき を比率にして単位を消すことで、異なる単位の値のばらつきを比較できる。
53
①10②50
54
加減乗除できる、かつ意味がある。平均値に意味があるもの
55
文字列や数値に置き換えしたもの
56
真に知りたい全データ
57
一部抜き取ったデータ
58
母集団の解析
59
標本データの解析
60
母集団を考えた時の平均値の推定精度。データ個数やバラツキに影響を受ける
61
平均値からのばらつき。平均値からの距離の程度
62
各選択肢の出現頻度を確認する。行列でクロス集計表ともいう。ピボットテ ーブルによる集計が便利
63
結果を一目でわかるようにする。棒グラフや円グラフなど
64
連続した値を区切って質的データに変換し、区間ごとの出現頻度でまとめた表
65
量的データの把握方法。数値で全体像を把握する, データの中心を表す統計量
66
値をすべて合計し、データの個数で割ったもの
67
データを大きい順 (もしくは小さい順) から並べた時にちょうど真ん中に来る値
68
もっとも出現頻度が多い値
69
分布が左右対称かを表す統計量。0で左右対称。<0で左寄り
70
分布のとがり具合を表す統計量。0で正規分布。>0で尖っている
71
平均値との差を2乗して平均をとったもの
72
平均値との差(偏差)の程度を表したもの。分散のをとったもの。±10 内に68%のものが存在する
73
標準偏差は平均値の大きさによって大きく異なる。標準偏差を平均値で割 ることで平均値の異なるもの同士でも比較できるようになる→変動係数=標準偏差/平均
74
母集団(対象データを全体として見る) の標準偏差のこと。STDEV.P (データ範囲)で出す
75
標本から母集団の標準偏差を見積もったもの。STDEV.S (データ範 囲)で出す。データの個数-1で割っている(データの個数から1引く方が誤差が大きくな ることから)
76
一部のデータで計算した母集団の平均値の精度。標本から出した平均値が 母集団の真の平均値からどれくらいの幅にあるかを示す