ログイン

統計的因果推論_1
100問 • 6ヶ月前
  • ユーザ名非公開
  • 通報

    問題一覧

  • 1

    「相関関係は因果関係を意味しない」と言われる最も大きな理由として、適切なものはどれか。

    交絡因子と呼ばれる第3の変数が、両方の変数に影響を与えている可能性があるから。

  • 2

    因果推論を行う上で、最も信頼性が高いとされる研究デザインは何か。

    ランダム化比較試験

  • 3

    ランダム化比較試験が因果推論の「ゴールドスタンダード」と呼ばれる最大の理由は何か。

    ランダム化により、未知のものも含めて交絡因子の影響を均等化し、排除できるから。

  • 4

    ある生活習慣(処置)と特定の病気(結果)の関係を調べている。このとき、「年齢」がその生活習慣を持つ傾向と、病気の発生率の両方に関係している場合、「年齢」は統計分析上どのように呼ばれるか。

    交絡因子

  • 5

    ある薬(処置)が健康状態(結果)を改善するメカニズムを考える。「薬を飲む → 体内の特定の数値が改善する → 健康になる」という経路がある場合、「体内の特定の数値」は何に該当するか。

    中間変数

  • 6

    因果関係の分析において、中間変数を調整してしまうと、どのような問題が生じるか。

    推定したかった本来の因果効果の一部または全部を見えなくしてしまう。

  • 7

    「観察研究」の特徴として、最も適切なものはどれか。

    研究者が、対象者の行動や状態に介入することなくデータを収集・分析する。

  • 8

    新しい教育プログラム(処置)の効果を評価したい。この研究における「結果変数」として最も適切なものはどれか。

    生徒のテストの点数

  • 9

    次のうち、「交絡」の例として最も典型的なものはどれか。

    アイスクリームの売上が増えると水難事故が増えるように見えるが、実際は気温の上昇が両方の原因である。

  • 10

    この資料(統計的因果推論)が目指していることは何か。

    交絡などの問題を適切に処理することで、観察研究からでも因果関係に迫るための方法論を提示する。

  • 11

    処置A群と処置B群の有効率を比較する際に用いられる、2つのリスクの比率を示す指標は何か。

    リスク比

  • 12

    ある薬の投与群と非投与群(それぞれ異なる患者で構成)の血圧の平均値を比較し、その差が統計的に有意かどうかを調べるために、最も一般的に用いられる検定はどれか。

    対応のないt検定

  • 13

    処置の有無を0か1の数値(ダミー変数)で表し、結果変数を予測する単回帰分析を行った。このとき、処置変数の回帰係数は何と等しくなるか。

    処置群と対照群の平均値の差

  • 14

    重回帰分析を用いて処置の効果を推定する際の、主な利点は何か。

    交絡因子となりうる他の変数の影響を統計的に調整できること。

  • 15

    共分散分析の主な目的は何か。

    処置前の測定値など、結果と強く関連する共変量の影響を調整し、処置効果の推定精度を高めること。

  • 16

    結果変数が「成功/失敗」や「治癒/非治癒」のような2値データである場合に、処置の効果や他の共変量の影響を評価するために用いられる回帰モデルは何か。

    ロジスティック回帰分析

  • 17

    ロジスティック回帰分析において、説明変数の係数から直接得られる効果の指標は何か。

    オッズ比

  • 18

    同じ被験者に対して、処置を行う前の体重と処置を行った後の体重を比較したい。この場合に用いるべき統計検定として、より適切なものはどれか。

    対応のあるt検定

  • 19

    回帰分析において、交絡因子をモデルに含めることの主な目的は何か。

    交絡因子による見せかけの効果を取り除き、処置変数の真の効果を推定すること。

  • 20

    ある処置の効果を評価するために、処置群と対照群の平均値を単純に比較した。この比較が因果効果を正しく反映していると言えるのは、どのような状況か。

    処置群と対照群の間に、結果に影響するような背景因子の差が全くない(例: ランダム化されている)場合。

  • 21

    ある個人iについて、処置を受けた場合の潜在的結果をYi​(1)、受けなかった場合の潜在的結果を$Y_i(0)$と表す。この枠組みにおける「因果推論の根本問題」とは何か。

    Yi​(1) と Yi​(0) の両方を、同じ個人について同時に観測することは不可能であること。

  • 22

    個人レベルの因果効果を推定することが困難なため、統計的因果推論では何を主な推定対象とするか。

    集団全体における平均処置効果(ATE)

  • 23

    「ある人の結果は、他人が受けた処置に影響されない」という仮定を何と呼ぶか。

    SUTVA(安定的な単位処置効果の仮定)

  • 24

    観察データから因果効果を推定するための識別可能条件のうち、「処置の割り当てが、潜在的な結果とは無関係である」ことを示す仮定はどれか。

    独立性(交換可能性)

  • 25

    識別可能条件における「正値性」の仮定が意味することは何か。

    どのような背景(共変量)を持つ人であっても、処置を受ける確率と受けない確率の両方がゼロではない。

  • 26

    ランダム化比較試験(RCT)では、なぜ「独立性」の仮定が満たされると言えるのか。

    処置の割り当てがコイン投げのように完全にランダムであり、個人の潜在的な結果(例: 元々の治りやすさ)に左右されないから。

  • 27

    観察研究において、交絡因子の影響を調整するために導入される、より現実的な仮定はどれか。

    条件付き独立性

  • 28

    「条件付き独立性 (Y(1),Y(0))⊥Z∣X 」の仮定が意味することは何か。

    同じ共変量Xの値を持つ集団内に限定すれば、処置Zの割り当ては潜在的結果とは無関係になる。

  • 29

    ある薬の効果を調べる観察研究で、医者が重症の患者にのみその薬を処方する傾向があった。この状況で、単純に投与群と非投与群を比較した場合、どの仮定が最も強く破られていると考えられるか。

    独立性

  • 30

    ワクチンの感染予防効果を評価する際に、ある人の感染確率が、周囲の人の接種状況に影響される可能性がある。この状況は、どの仮定に抵触する問題か。

    SUTVA(特に処置の非干渉性)

  • 31

    傾向スコアの定義として、最も正確なものはどれか。

    ある共変量を持つ個人が、処置を受ける条件付き確率。

  • 32

    傾向スコアが因果推論において果たす最も重要な役割は何か。

    多数の共変量が持つ交絡情報を、1次元の変数に集約すること。

  • 33

    傾向スコアの「バランシング特性」が意味することは何か。

    傾向スコアの値が同じ人々に限れば、処置群と対照群で共変量の分布が等しくなる。

  • 34

    観察研究で因果効果を推定する際、なぜ多数の共変量Xを直接調整する代わりに、傾向スコアe(X)を調整するのか。

    傾向スコアがバランシング特性を持つため、1つの変数e(X)を調整するだけで、多数の共変量Xのバランスを同時に調整できるから。

  • 35

    実際のデータ分析において、未知である傾向スコアを推定するために最も一般的に用いられる統計モデルは何か。

    ロジスティック回帰分析

  • 36

    傾向スコアを推定するためにロジスティック回帰モデルを組む際、目的(従属)変数には何を設定するか。

    処置の有無(0か1)

  • 37

    傾向スコアモデルに含めるべき共変量(説明変数)は、どのような変数か。

    処置と結果の両方に関連する可能性がある変数(交絡因子候補)

  • 38

    推定した傾向スコアを用いて分析を行う前に、必ず行うべき「診断」とは何か。

    傾向スコアで調整した後に、処置群と対照群の間で共変量のバランスが取れているかを確認すること。

  • 39

    傾向スコアを用いた分析における「正値性」の仮定が破れている状況とは、どのようなものか。

    特定の共変量を持つ人々(例: 全ての高齢男性)が、全員処置を受けるか、全員処置を受けないかのどちらか一方に偏っている。

  • 40

    傾向スコア分析の理論的な根拠となっている仮定は何か。

    SUTVAと、共変量で条件付ければ処置割付は無視可能であるという「条件付き独立性」。

  • 41

    傾向スコアマッチングの基本的な考え方として、最も適切なものはどれか。

    処置群の各個人に対し、傾向スコアが近い(=背景が似ている)個人を対照群から見つけてペアにする。

  • 42

    マッチングを行う最大の目的は何か。

    処置群と対照群の共変量の分布を揃え、交絡によるバイアスを減らすこと。

  • 43

    処置群のある個人に対し、傾向スコアの差が一定の許容範囲(キャリパー)内にある対照群の個人の中から、最もスコアが近い相手を選ぶマッチング方法を何と呼ぶか。

    キャリパーマッチング

  • 44

    マッチングにおいて、一度対照群から選ばれた個人を、別の処置群の個人のペアとして再び選ぶことを許す方法を何というか。

    復元抽出

  • 45

    傾向スコアマッチングを行った後に、必ず実施しなければならないことは何か。

    マッチング後のペアで、処置群と対照群の共変量のバランスが改善されたかを確認すること。

  • 46

    マッチング後のバランス評価に用いられる「標準化差」とは、どのような指標か。

    処置群と対照群の共変量の平均値の差を、その共変量の標準偏差で割ったもの。

  • 47

    1人の処置群の個人に対して、複数の対照群の個人をマッチングさせる「1対kマッチング」の利点は何か。

    利用できるサンプル数が増え、推定の精度が向上する可能性がある。

  • 48

    傾向スコアマッチングで良いペアが見つからない場合、まず試すべきことは何か。

    傾向スコアを推定するロジスティック回帰モデルを見直し、修正する。

  • 49

    マッチング手法の欠点として考えられることは何か。

    マッチングしなかったサンプルは分析から除外されるため、元の集団全体に対する効果とは言えなくなる可能性がある。

  • 50

    傾向スコアマッチングがうまく機能するための前提条件は何か。

    全ての交絡因子が測定されており、傾向スコアモデルに正しく投入されていること。

  • 51

    層化解析の基本的な考え方として、最も適切なものはどれか。

    交絡因子の水準(または傾向スコア)でデータをいくつかのグループ(層)に分け、層ごとに分析してから結果を統合する。

  • 52

    交絡因子が多数ある場合に、従来の層化解析が困難になる理由として、最も適切なものは何か。

    交絡因子の組み合わせで層を作ると、層の数が膨大になり、各層の人数が極端に少なくなってしまうから。

  • 53

    多数の交絡因子がある場合に、この問題を解決するために何を用いて層化を行うのが効果的か。

    傾向スコア

  • 54

    傾向スコアで層化した場合、各層の中ではどのような状態になっていることが期待されるか。

    処置群と対照群で、共変量の分布が(おおむね)等しい。

  • 55

    Cochranの研究によると、傾向スコアを用いてデータを5つの層に分けた場合、交絡によるバイアスはどの程度除去できるとされているか。

    約90%

  • 56

    層化解析がマッチング法と比べて持つ利点の一つは何か。

    マッチしなかったサンプルを捨てることなく、全てのデータを利用できる。

  • 57

    傾向スコアで層化を行う際の、層の数を決める上でのトレードオフは何か。

    層の数が少ないと層内の交絡が残る可能性があり、多いと各層のサンプルサイズが小さくなりすぎて推定が不安定になる。

  • 58

    各層で計算された処置効果を統合して、集団全体の処置効果を推定する際に用いられる考え方は何か。

    標準化法

  • 59

    傾向スコアを用いて5つの層に分けた。1番目の層は傾向スコアが最も低い人々の集まりである。この層の人々の特徴として、どのようなことが言えるか。

    処置を受ける確率が最も低い人々。

  • 60

    傾向スコア層化解析で、ある層の中で処置群が1人、対照群が50人いた。この層から処置効果を推定する際の問題点は何か。

    処置群の人数が極端に少ないため、この層での効果の推定が非常に不安定になる。

  • 61

    逆確率重み付け法(IPW)の基本的な考え方は何か。

    傾向スコアの逆数を重みとして各個人に与え、背景が均等な擬似集団を作り出して分析する。

  • 62

    IPW法において、傾向スコアが e(X) である処置群(Z=1)の個人に与えられる基本的な重みは何か。

    1/e(X)

  • 63

    IPW法において、傾向スコアが e(X) である対照群(Z=0)の個人に与えられる基本的な重みは何か。

    1/(1−e(X))

  • 64

    IPW法がマッチング法や層化法と比べて持つ主な利点は何か。

    全てのサンプルを分析に利用するため、情報の損失がない。

  • 65

    IPW法において、ある個人の傾向スコアが非常に0に近い値(例: 0.01)であった。この人が対照群にいた場合、その人に与えられる重みはどうなるか。

    ほぼ1になる。

  • 66

    IPW法を用いる際の潜在的な問題点は何か。

    傾向スコアが0または1に近い個人がいると、重みが極端に大きくなり推定結果が不安定になる。

  • 67

    「二重にロバストな推定量」が「二重に」ロバストであると言われる所以は何か。

    「傾向スコアモデル」と「結果モデル」という2つのモデルのうち、どちらか一方が正しければ、バイアスのない推定値が得られるから。

  • 68

    IPW法で、処置を受けやすい人(傾向スコアが高い人)が対照群にいた場合、その人に与えられる重みはどうなるか。

    その人の希少性を反映して、大きな重みが与えられる。

  • 69

    傾向スコアの推定に用いるモデルを「①傾向スコアモデル」、結果変数を予測するモデルを「②結果モデル」とする。「二重にロバストな推定量」で正しい推定値を得るための条件は何か。

    ①と②のどちらか一方、または両方が正しければよい。

  • 70

    ある研究で、IPW法による推定値が非常に大きな値を示し、標準誤差も巨大になった。最も考えられる原因は何か。

    一部の個人の傾向スコアが0または1に非常に近く、重みが爆発的に大きくなった。

  • 71

    操作変数法が特に有用となるのは、どのような状況か。

    測定できない未知の交絡因子が存在すると疑われる状況。

  • 72

    ある変数が操作変数(IV)であるための条件として、誤っているものはどれか。

    操作変数は、未知の交絡因子と強く相関していなければならない。

  • 73

    ランダム化比較試験(RCT)において、参加者が割り当てられた治療法に従わないことを何と呼ぶか。

    ノンコンプライアンス

  • 74

    RCTにおける「ITT(Intention-to-Treat)解析」とは、どのような分析方法か。

    最初にランダムに割り付けられた群に基づいて比較する。

  • 75

    ノンコンプライアンスが存在するRCTで、実際に受けた処置に基づいて比較する「As-Treated解析」の問題点は何か。

    ランダム化の利点が失われ、自己選択によるバイアス(交絡)が生じる。

  • 76

    ノンコンプライアンスが存在する状況で、操作変数法を用いて推定される因果効果は何と呼ばれるか。

    CACE (Complier Average Causal Effect)

  • 77

    CACEにおける「Complier(遵守者)」とは、どのような人々を指すか。

    処置に割り当てられれば処置を受け、対照に割り当てられれば受けない、というように割り当て通りに行動する人々。

  • 78

    ある禁煙プログラムのRCTを考える。プログラム参加群に割り当てられても参加せず、非参加群に割り当てられた場合も(当然)参加しない人は、どのタイプに分類されるか。

    Never-Taker

  • 79

    操作変数法を用いて推定されるCACEは、誰に対する効果か。

    割り当て通りに行動する「遵守者」という部分集団

  • 80

    ノンコンプライアンスのあるRCTにおいて、「処置の割り当て」そのものは、何の役割を果たすか。

    操作変数

  • 81

    ケース・コントロール研究の研究デザインの特徴として、最も適切なものはどれか。

    結果(疾病)の有無で集団を分け、過去の原因(曝露)の有無を調査する(後ろ向き)。

  • 82

    ケース・コントロール研究が特に有用なのは、どのような疾病の研究か。

    発生率が極めて低い、希少な疾病。

  • 83

    ケース・コントロール研究で、曝露と疾病の関連の強さを示す指標として、直接計算できるものは何か。

    オッズ比

  • 84

    ケース・コントロール研究で計算されたオッズ比が、因果的な関連を評価する上で意味を持つのはなぜか。

    後ろ向きに計算したオッズ比が、前向き研究で得られるオッズ比と数学的に一致するから。

  • 85

    オッズ比がリスク比の良い近似値とみなせるのは、どのような条件下か。

    研究対象となっている疾病の発生率が非常に低い場合。

  • 86

    ケース・コントロール研究において、ケース(症例)群とはどのような人々の集団か。

    研究対象の疾病を持っている人々の集団。

  • 87

    ケース・コントロール研究で、年齢や性別などの交絡因子の影響を調整するために、ケース1人に対して同じ年齢・性別のコントロールを選ぶ手法を何というか。

    マッチング

  • 88

    マッチングを行ったケース・コントロール研究のデータを分析する際に、用いるべき適切な統計手法は何か。

    条件付きロジスティック回帰分析

  • 89

    マッチングのあるケース・コントロール研究で、ペアの情報を無視して通常の統計解析を行うと、どのようなことが起こるか。

    曝露と疾病の関連を過小評価する方向に、結果が歪む(バイアスが生じる)可能性がある。

  • 90

    ある曝露(喫煙)と疾病(肺がん)の関連を調べるケース・コントロール研究

    肺がんではない人々。

  • 91

    因果推論が「欠測データ問題」と密接に関連していると言われるのはなぜか。

    「もしも処置を受けなかったら」という潜在的結果は、処置を受けた人にとっては観測できない「欠測値」とみなせるから。

  • 92

    データが欠測している理由が、他の観測された変数にも、欠測している値そのものにも、全く依存しない状態を何と呼ぶか。

    MCAR (Missing Completely at Random)

  • 93

    「高齢であるほど、健康に関する特定の質問に答えなくなる」という傾向があるとする。この場合、健康に関する質問の欠測メカニズムとして最も近いものはどれか。ただし、「年齢」はデータとして観測されているものとする。

    MAR

  • 94

    「収入が低い人ほど、自身の収入額を回答しない」という傾向があるとする。この場合、収入の欠測メカニズムとして最も近いものはどれか。

    MNAR

  • 95

    欠測データがある場合に、そのデータが含まれる行(ケース)を全て分析から除外する方法を何と呼ぶか。

    完全ケース法(リストワイズ削除)

  • 96

    完全ケース法(リストワイズ削除)が、バイアスなく利用できるのは、どのような欠測メカニズムの時か。

    MCAR

  • 97

    欠測値を、あり得る複数の異なる値で埋めたデータセットを複数作成し、それぞれで分析した結果を統合する手法を何というか。

    多重代入法

  • 98

    多重代入法が、平均値代入のような単一代入法より優れている主な点は何か。

    欠測値を埋めることの不確実性(ばらつき)を、最終的な分析結果に正しく反映できること。

  • 99

    統計的因果推論で用いられる傾向スコアなどの手法は、どの欠測メカニ-ズムの仮定の下で理論的正当性が保証されることが多いか。

    MAR(交絡因子が全て測定されているという仮定は、MARと類似の構造を持つ)

  • 100

    欠測データに対処する上で、最も重要な最初のステップは何か。

    なぜデータが欠測したのか、そのメカニズムを考察すること。

  • 数値計算

    数値計算

    ユーザ名非公開 · 7問 · 6ヶ月前

    数値計算

    数値計算

    7問 • 6ヶ月前
    ユーザ名非公開

    数値計算の常識

    数値計算の常識

    ユーザ名非公開 · 20問 · 6ヶ月前

    数値計算の常識

    数値計算の常識

    20問 • 6ヶ月前
    ユーザ名非公開

    数値計算の誤差と精度

    数値計算の誤差と精度

    ユーザ名非公開 · 60問 · 6ヶ月前

    数値計算の誤差と精度

    数値計算の誤差と精度

    60問 • 6ヶ月前
    ユーザ名非公開

    数値解析の原理_1

    数値解析の原理_1

    ユーザ名非公開 · 100問 · 6ヶ月前

    数値解析の原理_1

    数値解析の原理_1

    100問 • 6ヶ月前
    ユーザ名非公開

    数値で学ぶ計算と解析

    数値で学ぶ計算と解析

    ユーザ名非公開 · 12問 · 6ヶ月前

    数値で学ぶ計算と解析

    数値で学ぶ計算と解析

    12問 • 6ヶ月前
    ユーザ名非公開

    統計的因果推論_2

    統計的因果推論_2

    ユーザ名非公開 · 10問 · 6ヶ月前

    統計的因果推論_2

    統計的因果推論_2

    10問 • 6ヶ月前
    ユーザ名非公開

    数値解析の原理_2

    数値解析の原理_2

    ユーザ名非公開 · 20問 · 6ヶ月前

    数値解析の原理_2

    数値解析の原理_2

    20問 • 6ヶ月前
    ユーザ名非公開

    実践 有限要素法シミュレーション

    実践 有限要素法シミュレーション

    ユーザ名非公開 · 70問 · 6ヶ月前

    実践 有限要素法シミュレーション

    実践 有限要素法シミュレーション

    70問 • 6ヶ月前
    ユーザ名非公開

    変分法と有限要素法

    変分法と有限要素法

    ユーザ名非公開 · 60問 · 6ヶ月前

    変分法と有限要素法

    変分法と有限要素法

    60問 • 6ヶ月前
    ユーザ名非公開

    数値解析 第2版

    数値解析 第2版

    ユーザ名非公開 · 60問 · 6ヶ月前

    数値解析 第2版

    数値解析 第2版

    60問 • 6ヶ月前
    ユーザ名非公開

    数値計算 [新訂第2版]

    数値計算 [新訂第2版]

    ユーザ名非公開 · 100問 · 6ヶ月前

    数値計算 [新訂第2版]

    数値計算 [新訂第2版]

    100問 • 6ヶ月前
    ユーザ名非公開

    有限要素法へのいざない_2

    有限要素法へのいざない_2

    ユーザ名非公開 · 30問 · 6ヶ月前

    有限要素法へのいざない_2

    有限要素法へのいざない_2

    30問 • 6ヶ月前
    ユーザ名非公開

    有限要素法へのいざない_1

    有限要素法へのいざない_1

    ユーザ名非公開 · 100問 · 6ヶ月前

    有限要素法へのいざない_1

    有限要素法へのいざない_1

    100問 • 6ヶ月前
    ユーザ名非公開

    有限要素法入門

    有限要素法入門

    ユーザ名非公開 · 70問 · 6ヶ月前

    有限要素法入門

    有限要素法入門

    70問 • 6ヶ月前
    ユーザ名非公開

    数値解析 数・学・探・検 17

    数値解析 数・学・探・検 17

    ユーザ名非公開 · 60問 · 6ヶ月前

    数値解析 数・学・探・検 17

    数値解析 数・学・探・検 17

    60問 • 6ヶ月前
    ユーザ名非公開

    差分法

    差分法

    ユーザ名非公開 · 70問 · 6ヶ月前

    差分法

    差分法

    70問 • 6ヶ月前
    ユーザ名非公開

    多様体上の最適化理論_1

    多様体上の最適化理論_1

    ユーザ名非公開 · 100問 · 6ヶ月前

    多様体上の最適化理論_1

    多様体上の最適化理論_1

    100問 • 6ヶ月前
    ユーザ名非公開

    多様体上の最適化理論_2

    多様体上の最適化理論_2

    ユーザ名非公開 · 20問 · 6ヶ月前

    多様体上の最適化理論_2

    多様体上の最適化理論_2

    20問 • 6ヶ月前
    ユーザ名非公開

    続 やさしい有限要素法の計算

    続 やさしい有限要素法の計算

    ユーザ名非公開 · 60問 · 6ヶ月前

    続 やさしい有限要素法の計算

    続 やさしい有限要素法の計算

    60問 • 6ヶ月前
    ユーザ名非公開

    問題一覧

  • 1

    「相関関係は因果関係を意味しない」と言われる最も大きな理由として、適切なものはどれか。

    交絡因子と呼ばれる第3の変数が、両方の変数に影響を与えている可能性があるから。

  • 2

    因果推論を行う上で、最も信頼性が高いとされる研究デザインは何か。

    ランダム化比較試験

  • 3

    ランダム化比較試験が因果推論の「ゴールドスタンダード」と呼ばれる最大の理由は何か。

    ランダム化により、未知のものも含めて交絡因子の影響を均等化し、排除できるから。

  • 4

    ある生活習慣(処置)と特定の病気(結果)の関係を調べている。このとき、「年齢」がその生活習慣を持つ傾向と、病気の発生率の両方に関係している場合、「年齢」は統計分析上どのように呼ばれるか。

    交絡因子

  • 5

    ある薬(処置)が健康状態(結果)を改善するメカニズムを考える。「薬を飲む → 体内の特定の数値が改善する → 健康になる」という経路がある場合、「体内の特定の数値」は何に該当するか。

    中間変数

  • 6

    因果関係の分析において、中間変数を調整してしまうと、どのような問題が生じるか。

    推定したかった本来の因果効果の一部または全部を見えなくしてしまう。

  • 7

    「観察研究」の特徴として、最も適切なものはどれか。

    研究者が、対象者の行動や状態に介入することなくデータを収集・分析する。

  • 8

    新しい教育プログラム(処置)の効果を評価したい。この研究における「結果変数」として最も適切なものはどれか。

    生徒のテストの点数

  • 9

    次のうち、「交絡」の例として最も典型的なものはどれか。

    アイスクリームの売上が増えると水難事故が増えるように見えるが、実際は気温の上昇が両方の原因である。

  • 10

    この資料(統計的因果推論)が目指していることは何か。

    交絡などの問題を適切に処理することで、観察研究からでも因果関係に迫るための方法論を提示する。

  • 11

    処置A群と処置B群の有効率を比較する際に用いられる、2つのリスクの比率を示す指標は何か。

    リスク比

  • 12

    ある薬の投与群と非投与群(それぞれ異なる患者で構成)の血圧の平均値を比較し、その差が統計的に有意かどうかを調べるために、最も一般的に用いられる検定はどれか。

    対応のないt検定

  • 13

    処置の有無を0か1の数値(ダミー変数)で表し、結果変数を予測する単回帰分析を行った。このとき、処置変数の回帰係数は何と等しくなるか。

    処置群と対照群の平均値の差

  • 14

    重回帰分析を用いて処置の効果を推定する際の、主な利点は何か。

    交絡因子となりうる他の変数の影響を統計的に調整できること。

  • 15

    共分散分析の主な目的は何か。

    処置前の測定値など、結果と強く関連する共変量の影響を調整し、処置効果の推定精度を高めること。

  • 16

    結果変数が「成功/失敗」や「治癒/非治癒」のような2値データである場合に、処置の効果や他の共変量の影響を評価するために用いられる回帰モデルは何か。

    ロジスティック回帰分析

  • 17

    ロジスティック回帰分析において、説明変数の係数から直接得られる効果の指標は何か。

    オッズ比

  • 18

    同じ被験者に対して、処置を行う前の体重と処置を行った後の体重を比較したい。この場合に用いるべき統計検定として、より適切なものはどれか。

    対応のあるt検定

  • 19

    回帰分析において、交絡因子をモデルに含めることの主な目的は何か。

    交絡因子による見せかけの効果を取り除き、処置変数の真の効果を推定すること。

  • 20

    ある処置の効果を評価するために、処置群と対照群の平均値を単純に比較した。この比較が因果効果を正しく反映していると言えるのは、どのような状況か。

    処置群と対照群の間に、結果に影響するような背景因子の差が全くない(例: ランダム化されている)場合。

  • 21

    ある個人iについて、処置を受けた場合の潜在的結果をYi​(1)、受けなかった場合の潜在的結果を$Y_i(0)$と表す。この枠組みにおける「因果推論の根本問題」とは何か。

    Yi​(1) と Yi​(0) の両方を、同じ個人について同時に観測することは不可能であること。

  • 22

    個人レベルの因果効果を推定することが困難なため、統計的因果推論では何を主な推定対象とするか。

    集団全体における平均処置効果(ATE)

  • 23

    「ある人の結果は、他人が受けた処置に影響されない」という仮定を何と呼ぶか。

    SUTVA(安定的な単位処置効果の仮定)

  • 24

    観察データから因果効果を推定するための識別可能条件のうち、「処置の割り当てが、潜在的な結果とは無関係である」ことを示す仮定はどれか。

    独立性(交換可能性)

  • 25

    識別可能条件における「正値性」の仮定が意味することは何か。

    どのような背景(共変量)を持つ人であっても、処置を受ける確率と受けない確率の両方がゼロではない。

  • 26

    ランダム化比較試験(RCT)では、なぜ「独立性」の仮定が満たされると言えるのか。

    処置の割り当てがコイン投げのように完全にランダムであり、個人の潜在的な結果(例: 元々の治りやすさ)に左右されないから。

  • 27

    観察研究において、交絡因子の影響を調整するために導入される、より現実的な仮定はどれか。

    条件付き独立性

  • 28

    「条件付き独立性 (Y(1),Y(0))⊥Z∣X 」の仮定が意味することは何か。

    同じ共変量Xの値を持つ集団内に限定すれば、処置Zの割り当ては潜在的結果とは無関係になる。

  • 29

    ある薬の効果を調べる観察研究で、医者が重症の患者にのみその薬を処方する傾向があった。この状況で、単純に投与群と非投与群を比較した場合、どの仮定が最も強く破られていると考えられるか。

    独立性

  • 30

    ワクチンの感染予防効果を評価する際に、ある人の感染確率が、周囲の人の接種状況に影響される可能性がある。この状況は、どの仮定に抵触する問題か。

    SUTVA(特に処置の非干渉性)

  • 31

    傾向スコアの定義として、最も正確なものはどれか。

    ある共変量を持つ個人が、処置を受ける条件付き確率。

  • 32

    傾向スコアが因果推論において果たす最も重要な役割は何か。

    多数の共変量が持つ交絡情報を、1次元の変数に集約すること。

  • 33

    傾向スコアの「バランシング特性」が意味することは何か。

    傾向スコアの値が同じ人々に限れば、処置群と対照群で共変量の分布が等しくなる。

  • 34

    観察研究で因果効果を推定する際、なぜ多数の共変量Xを直接調整する代わりに、傾向スコアe(X)を調整するのか。

    傾向スコアがバランシング特性を持つため、1つの変数e(X)を調整するだけで、多数の共変量Xのバランスを同時に調整できるから。

  • 35

    実際のデータ分析において、未知である傾向スコアを推定するために最も一般的に用いられる統計モデルは何か。

    ロジスティック回帰分析

  • 36

    傾向スコアを推定するためにロジスティック回帰モデルを組む際、目的(従属)変数には何を設定するか。

    処置の有無(0か1)

  • 37

    傾向スコアモデルに含めるべき共変量(説明変数)は、どのような変数か。

    処置と結果の両方に関連する可能性がある変数(交絡因子候補)

  • 38

    推定した傾向スコアを用いて分析を行う前に、必ず行うべき「診断」とは何か。

    傾向スコアで調整した後に、処置群と対照群の間で共変量のバランスが取れているかを確認すること。

  • 39

    傾向スコアを用いた分析における「正値性」の仮定が破れている状況とは、どのようなものか。

    特定の共変量を持つ人々(例: 全ての高齢男性)が、全員処置を受けるか、全員処置を受けないかのどちらか一方に偏っている。

  • 40

    傾向スコア分析の理論的な根拠となっている仮定は何か。

    SUTVAと、共変量で条件付ければ処置割付は無視可能であるという「条件付き独立性」。

  • 41

    傾向スコアマッチングの基本的な考え方として、最も適切なものはどれか。

    処置群の各個人に対し、傾向スコアが近い(=背景が似ている)個人を対照群から見つけてペアにする。

  • 42

    マッチングを行う最大の目的は何か。

    処置群と対照群の共変量の分布を揃え、交絡によるバイアスを減らすこと。

  • 43

    処置群のある個人に対し、傾向スコアの差が一定の許容範囲(キャリパー)内にある対照群の個人の中から、最もスコアが近い相手を選ぶマッチング方法を何と呼ぶか。

    キャリパーマッチング

  • 44

    マッチングにおいて、一度対照群から選ばれた個人を、別の処置群の個人のペアとして再び選ぶことを許す方法を何というか。

    復元抽出

  • 45

    傾向スコアマッチングを行った後に、必ず実施しなければならないことは何か。

    マッチング後のペアで、処置群と対照群の共変量のバランスが改善されたかを確認すること。

  • 46

    マッチング後のバランス評価に用いられる「標準化差」とは、どのような指標か。

    処置群と対照群の共変量の平均値の差を、その共変量の標準偏差で割ったもの。

  • 47

    1人の処置群の個人に対して、複数の対照群の個人をマッチングさせる「1対kマッチング」の利点は何か。

    利用できるサンプル数が増え、推定の精度が向上する可能性がある。

  • 48

    傾向スコアマッチングで良いペアが見つからない場合、まず試すべきことは何か。

    傾向スコアを推定するロジスティック回帰モデルを見直し、修正する。

  • 49

    マッチング手法の欠点として考えられることは何か。

    マッチングしなかったサンプルは分析から除外されるため、元の集団全体に対する効果とは言えなくなる可能性がある。

  • 50

    傾向スコアマッチングがうまく機能するための前提条件は何か。

    全ての交絡因子が測定されており、傾向スコアモデルに正しく投入されていること。

  • 51

    層化解析の基本的な考え方として、最も適切なものはどれか。

    交絡因子の水準(または傾向スコア)でデータをいくつかのグループ(層)に分け、層ごとに分析してから結果を統合する。

  • 52

    交絡因子が多数ある場合に、従来の層化解析が困難になる理由として、最も適切なものは何か。

    交絡因子の組み合わせで層を作ると、層の数が膨大になり、各層の人数が極端に少なくなってしまうから。

  • 53

    多数の交絡因子がある場合に、この問題を解決するために何を用いて層化を行うのが効果的か。

    傾向スコア

  • 54

    傾向スコアで層化した場合、各層の中ではどのような状態になっていることが期待されるか。

    処置群と対照群で、共変量の分布が(おおむね)等しい。

  • 55

    Cochranの研究によると、傾向スコアを用いてデータを5つの層に分けた場合、交絡によるバイアスはどの程度除去できるとされているか。

    約90%

  • 56

    層化解析がマッチング法と比べて持つ利点の一つは何か。

    マッチしなかったサンプルを捨てることなく、全てのデータを利用できる。

  • 57

    傾向スコアで層化を行う際の、層の数を決める上でのトレードオフは何か。

    層の数が少ないと層内の交絡が残る可能性があり、多いと各層のサンプルサイズが小さくなりすぎて推定が不安定になる。

  • 58

    各層で計算された処置効果を統合して、集団全体の処置効果を推定する際に用いられる考え方は何か。

    標準化法

  • 59

    傾向スコアを用いて5つの層に分けた。1番目の層は傾向スコアが最も低い人々の集まりである。この層の人々の特徴として、どのようなことが言えるか。

    処置を受ける確率が最も低い人々。

  • 60

    傾向スコア層化解析で、ある層の中で処置群が1人、対照群が50人いた。この層から処置効果を推定する際の問題点は何か。

    処置群の人数が極端に少ないため、この層での効果の推定が非常に不安定になる。

  • 61

    逆確率重み付け法(IPW)の基本的な考え方は何か。

    傾向スコアの逆数を重みとして各個人に与え、背景が均等な擬似集団を作り出して分析する。

  • 62

    IPW法において、傾向スコアが e(X) である処置群(Z=1)の個人に与えられる基本的な重みは何か。

    1/e(X)

  • 63

    IPW法において、傾向スコアが e(X) である対照群(Z=0)の個人に与えられる基本的な重みは何か。

    1/(1−e(X))

  • 64

    IPW法がマッチング法や層化法と比べて持つ主な利点は何か。

    全てのサンプルを分析に利用するため、情報の損失がない。

  • 65

    IPW法において、ある個人の傾向スコアが非常に0に近い値(例: 0.01)であった。この人が対照群にいた場合、その人に与えられる重みはどうなるか。

    ほぼ1になる。

  • 66

    IPW法を用いる際の潜在的な問題点は何か。

    傾向スコアが0または1に近い個人がいると、重みが極端に大きくなり推定結果が不安定になる。

  • 67

    「二重にロバストな推定量」が「二重に」ロバストであると言われる所以は何か。

    「傾向スコアモデル」と「結果モデル」という2つのモデルのうち、どちらか一方が正しければ、バイアスのない推定値が得られるから。

  • 68

    IPW法で、処置を受けやすい人(傾向スコアが高い人)が対照群にいた場合、その人に与えられる重みはどうなるか。

    その人の希少性を反映して、大きな重みが与えられる。

  • 69

    傾向スコアの推定に用いるモデルを「①傾向スコアモデル」、結果変数を予測するモデルを「②結果モデル」とする。「二重にロバストな推定量」で正しい推定値を得るための条件は何か。

    ①と②のどちらか一方、または両方が正しければよい。

  • 70

    ある研究で、IPW法による推定値が非常に大きな値を示し、標準誤差も巨大になった。最も考えられる原因は何か。

    一部の個人の傾向スコアが0または1に非常に近く、重みが爆発的に大きくなった。

  • 71

    操作変数法が特に有用となるのは、どのような状況か。

    測定できない未知の交絡因子が存在すると疑われる状況。

  • 72

    ある変数が操作変数(IV)であるための条件として、誤っているものはどれか。

    操作変数は、未知の交絡因子と強く相関していなければならない。

  • 73

    ランダム化比較試験(RCT)において、参加者が割り当てられた治療法に従わないことを何と呼ぶか。

    ノンコンプライアンス

  • 74

    RCTにおける「ITT(Intention-to-Treat)解析」とは、どのような分析方法か。

    最初にランダムに割り付けられた群に基づいて比較する。

  • 75

    ノンコンプライアンスが存在するRCTで、実際に受けた処置に基づいて比較する「As-Treated解析」の問題点は何か。

    ランダム化の利点が失われ、自己選択によるバイアス(交絡)が生じる。

  • 76

    ノンコンプライアンスが存在する状況で、操作変数法を用いて推定される因果効果は何と呼ばれるか。

    CACE (Complier Average Causal Effect)

  • 77

    CACEにおける「Complier(遵守者)」とは、どのような人々を指すか。

    処置に割り当てられれば処置を受け、対照に割り当てられれば受けない、というように割り当て通りに行動する人々。

  • 78

    ある禁煙プログラムのRCTを考える。プログラム参加群に割り当てられても参加せず、非参加群に割り当てられた場合も(当然)参加しない人は、どのタイプに分類されるか。

    Never-Taker

  • 79

    操作変数法を用いて推定されるCACEは、誰に対する効果か。

    割り当て通りに行動する「遵守者」という部分集団

  • 80

    ノンコンプライアンスのあるRCTにおいて、「処置の割り当て」そのものは、何の役割を果たすか。

    操作変数

  • 81

    ケース・コントロール研究の研究デザインの特徴として、最も適切なものはどれか。

    結果(疾病)の有無で集団を分け、過去の原因(曝露)の有無を調査する(後ろ向き)。

  • 82

    ケース・コントロール研究が特に有用なのは、どのような疾病の研究か。

    発生率が極めて低い、希少な疾病。

  • 83

    ケース・コントロール研究で、曝露と疾病の関連の強さを示す指標として、直接計算できるものは何か。

    オッズ比

  • 84

    ケース・コントロール研究で計算されたオッズ比が、因果的な関連を評価する上で意味を持つのはなぜか。

    後ろ向きに計算したオッズ比が、前向き研究で得られるオッズ比と数学的に一致するから。

  • 85

    オッズ比がリスク比の良い近似値とみなせるのは、どのような条件下か。

    研究対象となっている疾病の発生率が非常に低い場合。

  • 86

    ケース・コントロール研究において、ケース(症例)群とはどのような人々の集団か。

    研究対象の疾病を持っている人々の集団。

  • 87

    ケース・コントロール研究で、年齢や性別などの交絡因子の影響を調整するために、ケース1人に対して同じ年齢・性別のコントロールを選ぶ手法を何というか。

    マッチング

  • 88

    マッチングを行ったケース・コントロール研究のデータを分析する際に、用いるべき適切な統計手法は何か。

    条件付きロジスティック回帰分析

  • 89

    マッチングのあるケース・コントロール研究で、ペアの情報を無視して通常の統計解析を行うと、どのようなことが起こるか。

    曝露と疾病の関連を過小評価する方向に、結果が歪む(バイアスが生じる)可能性がある。

  • 90

    ある曝露(喫煙)と疾病(肺がん)の関連を調べるケース・コントロール研究

    肺がんではない人々。

  • 91

    因果推論が「欠測データ問題」と密接に関連していると言われるのはなぜか。

    「もしも処置を受けなかったら」という潜在的結果は、処置を受けた人にとっては観測できない「欠測値」とみなせるから。

  • 92

    データが欠測している理由が、他の観測された変数にも、欠測している値そのものにも、全く依存しない状態を何と呼ぶか。

    MCAR (Missing Completely at Random)

  • 93

    「高齢であるほど、健康に関する特定の質問に答えなくなる」という傾向があるとする。この場合、健康に関する質問の欠測メカニズムとして最も近いものはどれか。ただし、「年齢」はデータとして観測されているものとする。

    MAR

  • 94

    「収入が低い人ほど、自身の収入額を回答しない」という傾向があるとする。この場合、収入の欠測メカニズムとして最も近いものはどれか。

    MNAR

  • 95

    欠測データがある場合に、そのデータが含まれる行(ケース)を全て分析から除外する方法を何と呼ぶか。

    完全ケース法(リストワイズ削除)

  • 96

    完全ケース法(リストワイズ削除)が、バイアスなく利用できるのは、どのような欠測メカニズムの時か。

    MCAR

  • 97

    欠測値を、あり得る複数の異なる値で埋めたデータセットを複数作成し、それぞれで分析した結果を統合する手法を何というか。

    多重代入法

  • 98

    多重代入法が、平均値代入のような単一代入法より優れている主な点は何か。

    欠測値を埋めることの不確実性(ばらつき)を、最終的な分析結果に正しく反映できること。

  • 99

    統計的因果推論で用いられる傾向スコアなどの手法は、どの欠測メカニ-ズムの仮定の下で理論的正当性が保証されることが多いか。

    MAR(交絡因子が全て測定されているという仮定は、MARと類似の構造を持つ)

  • 100

    欠測データに対処する上で、最も重要な最初のステップは何か。

    なぜデータが欠測したのか、そのメカニズムを考察すること。