問題一覧
1
統計学の分類 3つ
記述統計、推測統計、多変量解析
2
連続データ、離散データの例
連続→身長、体重、時間、血圧、経済成長率など、 離散→サイコロの目、年齢、テストの得点など
3
名義、順序、間隔、比例尺度の例
名義→男を1に、女を2に数値化など 順序→好きを1、普通を2、嫌いを3など 間隔→室温計が示す温度、時間など 比例→身長、体重、時間など
4
分散と標準偏差とは?
資料に含まれるデータが「どれくらい散らばっているか」を説明するもの
5
標本調査とは何か。一部→標本、全体→? また、選び方に誤差を生じない方法は何か?
対象から「一部を抽出」して調査すること、母集団、無作為(ランダム)抽出
6
正規分布とは何か? また、その全体の面積はいくつか?
平均値と最頻値と中央値が一致し、それを軸として左右対称となっている確率分布のこと。1
7
平均±標準偏差の範囲中に全体の①%が含まれる。 ±2→② ±3→③
68%.95%.99.7%
8
信頼区間とは何か。
標本から得られた「平均」と「ばらつき」に基づいて予測される母集団の「平均」を含むであろう範囲
9
対立仮説、帰無仮説とは何か。帰無仮説は何で判断するか。またその有意水準はいくつか。
自分が証明したいこと、検定において否定されるためにある仮説、P値、0.05
10
P値と有意水準の比較を説明せよ。
P値<0.05のとき帰無仮説は棄却→対立仮説が採択される。P値>0.05のときは帰無仮説は棄却できない。
11
独立性の検定(x2検定)とは何か。
データ数の偏りを調べる
12
クロス集計表とは何か。
2変量の関係をわかりやすくする表
13
帰無仮説と対立仮説の関連性は何か。
帰無仮説の独立=関連性はない。対立仮説が独立ではない=関連性はある。
14
t検定とは何か。
2つの平均の差の検定
15
相関係数とは何か、またその値はいくつか。
2つの変数の関係を調べる、-1〜1
16
共通の要因によって、相関があるように見えるものを何というか。
疑似相関
17
感度、特異度とは何か。またその考え方を説明せよ。
感度→病気の人を「病気があると検出(陽性)」する力。 特異度→病気がない人を「病気がないと検出(陰性)」する力。 真陽性→疾患あり、陽性 偽陽性→疾患なし、陽性 偽陰性→疾患あり、陰性 真陰性→疾患なし、陰性
18
非疾患群と疾患群の境界値を何というか。その設定には何があるか。またその決め方。
カットオフ値、ROC曲線、左上からの距離が最小になる点を選ぶ
19
感度、特異度が高い検査は何が分かるか。
感度が高い検査→偽陰性が少ない 特異度が高い検査→偽陽性が少ない
20
特異度高、感度高で考慮しなくてはならない点は何か。
特異度高→感度低、見逃し(偽陰性)増 感度高→特異度低、不要な検査を受ける人(偽陽性)増