問題一覧
1
우리나라의 13~19세 청소년의 우울증 유병률을 알아보기 위하여 13~19세 청소년 200명을 모집하여 우울증 검사를 실시하였다. 이 연구에 대한 설명으로 옳지 않은 것은?
모집단은 우리나라의 13~19세 청소년 중 우울증 환자이다.
2
65세 이상 성인 당뇨 환자에게 새로 개발된 당뇨 치료제의 효과를 알아보기 위하여 임상시험을 계획하였다. 이 연구에서 모집단은 무엇인가?
65세 이상 성인 당뇨 환자 전체
3
다음은 어느 학급 학생들에 대한 데이터이다. 이 데이터에 대한 설명으로 옳지 않은 것은?
이 데이터에서 단위는 각 열에 대응되고, 변수는 각 행에 대응된다.
4
다음 연속형 데이터의 분포를 요약하는 통계량 중, 특이점의 영향을 크게 받지 않는 것은?
중앙값
5
다음 중 평균에 대한 설명으로 적절한 것은?
데이터의 무게중심이다.
6
데이터 분석의 시작 단계에서 요약통계량과 그래프 요약을 살펴보는 이유로 적절하지 않은 것은?
분석 결과를 도출하기 위하여
7
사건 A와 사건 B가 독립일 때 반드시 성립하는 등식은?
P(A n B) = P(A) x P(B)
8
어느 병동에 입원한 사람 중 고혈압 환자의 비율은 40%, 당뇨병 환자의 비율은 30%이다. 고혈압 환자 중 당뇨병 환자의 비율은 50%라고 한다. 그렇다면 당뇨병 환자 중 고혈압 환자의 비율은 얼마인가?
67%
9
사건 A를 특정 백신을 접종하는 사건, 사건 B를 감염병으로 인해 사망하는 사건이라고 하자. 이 백신의 접종률은 40%, 즉 P(A) = 0.4 이고, 감염병으로 인한 사망 확률은 1%, 즉 P(B) = 0.01 이라고 하자. 알고 봤더니 이 백신은 감염병으로 인한 사망을 예방하는 효과가 전혀 없었다고 하자. 즉, 사건 A와 사건 B는 서로 독립이다. 그러면 이 백신을 접종했을 때 감염병으로 인해 사망할 확률, 즉 P(BIA)는 얼마인가?
0.01
10
어느 도시에서 사건 A를 안전벨트를 착용하는 사건, 사건 B를 교통사고로 인해 사망하는 사건이라고 하자. 교통사고 사망자를 조사했더니 그중 절반이 안전벨트를 착용하고 있었다. 즉, P(AㅣB) = 0.5이다. 이 도시 시민 전체의 안전벨트 착용률은 90%라 한다. 즉, P(A) = 0.9이다. 다음 설명 중 옳은 것은?
P(A n B) = 0.5 X P(B) 이다.
11
어느 병원에서 기관 내 삽관을 시도할 때, 응급의학과에서 시도한 경우 성공률은 90%, 다른 임상과에서 시도한 경우 성공률은 60%라고 한다. 전체 기관 내 삽관 시도의 2/3는 응급의학과에서, 1/3은 다른 과에서 이루어진다. 이 병원에서 기관 내 삽관이 100번 시도될 경우, 성공 횟수의 기댓값은 얼마인가?
80
12
어느 병원에서 기관 내 삽관을 시도할 때, 응급의학과에서 시도한 경우 성공률은 90%, 다른 임상과에서 시도한 경우 성공률은 60%라고 한다. 전체 기관 내 삽관 시도의 2/3는 응급의학과에서, 1/3은 다른 과에서 이루어진다. 이 병원에서 기관 내 삽관이 100번 시도될 경우, 성공 횟수의 표준편차는 얼마인가?
4
13
확률변수 X는 평균이 200, 표준편차가 100인 정규분포를 따른다. P(A4 < X < 396)은 얼마인가? (힌트: Z0.025 = 1.06)
0.95
14
다음 중심극한정리에 대한 설명 중 적절하지 않은 것은?
표본 평균의 분산은 모분산과 같다.
15
다음 중 표본 평균의 특성이 아닌 것은?
표본 평균의 분포는 표본 크기가 커질수록 분산이 커진다.
16
우리나라 신생아 여아의 평균 출생 몸무게를 추정하기 위해 200명의 랜덤 표본을 뽑아서 구한 95% 신뢰구간이 [2.8kg, 3.6kg]이었다고 한다. 이 신뢰구간에 대한 설명으로 옳지 않은 것은?
우리나라 신생아 여아의 평균 출생 몸무게가 2.8kg보다 크고 3.6kg보다 작을 확률은 95%이다.
17
우리나라 19세 이상 성인의 비만 비율을 추정하기 위해 1,000명의 랜덤 표본을 뽑아서 조사한 결과 300명이 비만이었다. 다음 중 틀린 설명은?
표본 크기를 4,000명으로 늘리면, 95% 신뢰구간의 너비는 1/4로 줄어든다.
18
다음 중 귀무가설이 참이지만 귀무가설을 기각하게 되는 오류는?
제1종 오류
19
가설검정에 대한 다음 설명 중 적절하지 않은 것은?
제2종 오류 확률의 최대한계를 유의수준이라고 한다.
20
어느 병원의 당뇨병 환자 25명의 혈압을 측정하여 기록하였다. 이 25명의 당뇨병 환자 표본이 우리나라의 모든 당뇨병 환자 중에서 i.i.d.로 뽑은 표본이라고 가정하고, 우리나라 당뇨병 환자들의 수축기 혈압의 평균이 120이 넘는지 검정하려고 한다. 수축기 혈압의 분포는 정규분포를 따른다고 가정한다. 다음 중 적절한 가설검정 방법은?
일표본 t-검정
21
식도암 환자 55명을 조사한 결과 46명이 흡연자인 것으로 나타났다. 식도암 환자 중 흡연자의 비율이 80%와 다르다고 할 수 있는지 검정하기 위해 R 명령문을 실행한 결과가 다음과 같다. 이 가설검정 결과에 대한 설명으로 옳은 것은?
유의수준 0.05에서 귀무가설을 기각하지 못한다.
22
다음 중 연속형 변수의 중심위치를 비교하는 가설검정 방법이 아닌 것은?
정규성 검정
23
다음 중 윌콕슨 순위합 검정에 대한 설명으로 옳은 것은?
순서형 변수의 데이터에도 적용할 수 있다.
24
담낭절제술을 복강경으로 시행했을 때와 로봇으로 시행했을 때의 입원일수를 비교하기 위해, 복강경 수술을 한 환자 30명의 입원일수와 로봇 수술을 한 환자 30명의 입원일수를 수집하였다. 이 데이터에 이표본 이분산 t-검정을 적용한 결과 유의확률이 0.02가 나왔다. 이에 대한 설명으로 옳은 것은?
유의수준 0.05에서 귀무가설을 기각한다.
25
새로운 당뇨치료제 '위고비'가 체중 감량 효과가 있는지 알아보기 위하여 비만 환자 300명을 모집하여 임상시험을 실시하였다. 모집에 응한 참가자 300명의 체중을 측정한 직후, 랜덤하게 두 그룹으로 나누어 한 그룹은 3개월간 '위고비'를 투약하고 다른 그룹은 플라시보를 투약하였다. 투약이 끝난 직후 다시 체중을 측정하여 3개월간 체중 변화량을 환자별로 계산하였다. 체중 변화량의 평균이 '위고비' 그룹과 플라시보 그룹에서 다른지 알아보기 위해 어떤 가설검정을 실시해야 하는가?
이표본 t-검정
26
새로운 당뇨치료제 '위고비'가 체중 감량 효과가 있는지 알아보기 위하여 비만 환자 300명을 모집하여 임상시험을 실시하였다. 모집에 응한 참가자 300명의 체중을 측정한 직후, 3개월간 모든 참가자가 '위고비'를 투약하였다. 투약이 끝난 직후 다시 체중을 측정하여 3개월간 체중 변화량을 환자별로 계산하였다. 체중에 변화가 있는지 알아보기 위해서 어떤 가설검정을 실시해야 하는가?
대응표본 t-검정
27
다음 중 3개 이상 그룹의 모평균을 비교할 때 사용할 수 없는 분석 방법은?
윌콕슨 부호순위 검정
28
저체중, 정상체중, 비만 그룹에서 혈압의 평균이 서로 다르다고 할 수 있는지 알아보기 위하여 크루스칼-왈리스 검정을 실시한 결과 유의화귤이 0.021이 나왔다. 유의수준은 0.05를 사용한다. 다음 중 틀린 설명은?
ANOVA F-검정을 수행해도 같은 유의확률이 나온다.
29
규칙적인 운동과 당뇨병의 관계를 알아보기 위하여 모집단에서 랜덤으로 뽑은 300명의 데이터를 이용하여 아래와 같은 분할표를 얻었다. 당뇨병에 대한 규칙적인 운동의 상대위험도 (= 규칙적 운동할 때 당뇨병 위험/규칙적 운동 안할 때 당뇨병 위험)의 추정값은 얼마인가?
0.8
30
규칙적인 운동과 당뇨병의 관계를 알아보기 위하여 모집단에서 랜덤으로 뽑은 300명의 데이터를 이용하여 아래와 같은 분할표를 얻었다. 당뇨병에 대한 규칙적인 운동의 오즈비(= 규칙적 운동할 때 당뇨병 오즈/규칙적 운동 안 할 때 당뇨병 오즈)의 추정값은 얼마인가?
0.75
31
상대위험도와 오즈비에 대한 설명으로 옳지 않은 것은?
오즈비가 2이면, 위험요소에 노출될 경우 질병 위험이 위험요소에 노출되지 않을 경우 질병 위험의 2배라는 뜻이다.
32
아침식사 여부를 나타내는 변수 X와 비만 여부를 나타내는 변수 Y가 서로 독립인지 알아보기 위하여 카이제곱 검정을 수행한 결과 유의확률이 0.031이 나왔다. 유의수준은 0.05를 사용한다고 할 때, 이 검정결과의 해석으로 적절한 것은?
아침식사 여부와 비만 여부는 독립이 아니다.
33
코로나19를 진단하는 두 가지 검사법 '검사 A'와 '검사 B'의 결과가 거의 같게 나오는지 다르게 나오는지 판단하기 위해 100명의 지원자에게 두 가지 검사를 모두 시행하였다. 검사 A와 검사 B에서 모두 양성으로 나온 사람은 30명, 검사 A에서는 양성, 검사 B에서는 음성으로 나온 사람이 10명, 검사 A에서는 음성, 검사 B에서는 양성으로 나온 사람이 5명이었고 나머지 55명은 두 검사에서 모두 음성으로 나왔다. 저절한 가설검정 방법은?
맥니마 검정
34
비타민 C 섭취와 코로나19 감염의 관계를 알아보기 위하여, 비타민 C를 정기적으로 섭취한 20명에 코로나19 검사를 시행하였더니 그중 3명이 양성, 17명은 음성으로 판명되었다. 비타민 C를 섭취하지 않은 20명 역시 코로나19 검사를 시행한 결과 그중 4명이 양성, 16명은 음성이었다. 적절한 가설검정 방법은?
피셔의 정확 검정
35
다음 중 피어슨 상관계수가 0에 가까운 것은?
3
36
다음은 변수 X와 Y의 산점도이다. 이 두 변수의 관계에 대한 설명으로 타당한 것은?
어떤 단위의 변수 X의 관측값을 알면 Y값을 정확히 알 수 있다.
37
다음 중 스피어맨 상관계수의 성질로 적절하지 않은 것은?
0에서 1 사이의 값을 가진다.
38
선형회귀분석에 대한 설명으로 적절하지 않은 것은?
오차는 잔차와 같다.
39
선형회귀분석에서 제곱합과 결정계수에 대한 설명으로 올바른 것은?
총제곱합(SST)은 반응변수 값이 평균으로부터 얼마나 떨어져 있는가를 나타낸다.
40
나이(age)와 비만도(obesity)가 수축기 혈압(SBP)에 끼치는 영향을 알아보기 위하여 선형회귀분석을 실시하였다. 나이와 수축기 혈압은 연속형 변수이고 비만도는 정상은 1, 과체중은 2, 비만은 3 값을 가지는 범주형 변수이다. (단, 참조범주는 정상(1)이다). R에서 선형회귀분석을 실시한 명령문과 출력결과는 다음과 같다. 적합된 선형회귀직선을 올바르게 해석한 것은?
과체중인 사람은 정상인 사람에 비해 수축기 혈압이 평균적으로 13.8424만큼 높다.
41
나이(age)와 비만도(obesity)가 수축기 혈압(SBP)에 끼치는 영향을 알아보기 위하여 선형회귀분석을 실시하였다. 나이와 수축기 혈압은 연속형 변수이고 비만도는 정상은 1, 과체중은 2, 비만은 3 값을 가지는 범주형 변수이다. (단, 참조범주는 정상(1)이다). R에서 선형회귀분석을 실시한 명령문과 출력결과는 다음과 같다. 적합된 선형회귀모형의 적합도에 대한 설명으로 바르지 않은 것은?
이 모형은 상수항만 있는 모형보다 데이터를 더 잘 설명한다고 할 수 없다.
42
다이어트 보조제를 사용하기 전 몸무게(pre.weight)와 사용 후 몸무게(post.weight)의 관계를 알아보기 위하여, 사용 후 몸무게를 반응변수로, 사용 전 몸무게를 독립변수로 한 선형회귀모형을 적합시킨 결과가 다음과 같다. 적합된 회귀직선으로 올바른 것은?
post.weight = 11.50 + 0.80(pre.weight)
43
다이어트 보조제를 사용하기 전 몸무게(pre.weight)와 사용 후 몸무게(post.weight)의 관계를 알아보기 위하여, 사용 후 몸무게를 반응변수로, 사용 전 몸무게를 독립변수로 한 선형회귀모형을 적합시킨 결과가 다음과 같다. 회귀분석 결과에 대한 해석으로 옳은 것은?
다이어트 보조제 사용 전 몸무게가 높을수록 사용 후 몸무게도 높은 경향이 있다.
44
선형회귀분석에서 오차에 대한 가정으로 적절하지 않은 것은?
오차의 분산은 1이다.
45
잔차분석에 대한 설명으로 적절하지 않은 것은?
잔차분석에서 오차에 대한 가정이 어긋나는 것으로 판단될 경우, 그 모형은 데이터의 변동을 전혀 설명하지 못한다.
46
선형회귀분석에서 독립변수에 대한 설명으로 적절한 것은?
독립변수가 범주형 변수일 때는 가변수로 변환하여 모형에 들어간다.
47
다음 중 교란변수에 대한 설명으로 적절하지 않은 것은?
교란변수가 존재할 경우 분석에서 제외해야 한다.
48
혈압강하제 A를 1년간 복용하면 혈압이 낮아지는데, 효과가 성별에 따라 달라서 여성의 경우 평균 5만큼, 남성의 경우 평균 10만큼 낮아진다고 한다. 이러한 관계에 대한 설명으로 적절한 것은?
혈압강하제 복용 여부와 성별 간에 상호작용이 존재한다.
49
다음 중 다중공선성에 대한 설명으로 적절하지 않은 것은?
다중공선성이 있는 변수는 모형에서 제거해야 한다.
50
다음 중 변수 선택에 관한 설명으로 적절한 것은?
과적합의 문제를 피하기 위해서는 데이터 크기에 비해 너무 복잡한 모형을 적합시키지 않도록 주의해야 한다.
51
다음은 어느 감염병의 실제 감염 여부와 진단 검사 결과를 정리한 분류결과표이다. 이 데이터에서 유병률(전체 중 실제로 양성인 사람 비율)은 얼마인가?
0.33
52
다음은 어느 감염병의 실제 감염 여부와 진단 검사 결과를 정리한 분류결과표이다. 이 진단 검사의 민감도와 특이도의 추정값은 얼마인가?
민감도 = 0.9, 특이도 = 0.7
53
다음은 어느 감염병의 실제 감염 여부와 진단 검사 결과를 정리한 분류결과표이다. 이 진단 검사의 양성예측도와 음성예측도의 추정값은 얼마인가?
양성예측도 = 0.6, 음성예측도 = 0.93
54
다음은 어느 감염병의 실제 감염 여부와 진단 검사 결과를 정리한 분류결과표이다. 이 데이터에서 유병률(전체 중 실제로 양성인 사람 비율)은 얼마인가?
0.048
55
다음은 어느 감염병의 실제 감염 여부와 진단 검사 결과를 정리한 분류결과표이다. 이 진단 검사의 민감도와 특이도의 추정값은 얼마인가?
민감도 = 0.9, 특이도 = 0.7
56
다음은 어느 감염병의 실제 감염 여부와 진단 검사 결과를 정리한 분류결과표이다. 이 진단 검사의 양성예측도와 음성예측도의 추정값은 얼마인가?
양성예측도 = 0.13, 음성예측도 = 0.99
57
'어느 감염병의 실제 감염 여부와 진단 검사 결과를 저이한 분류결과표'에 대한 문항을 종합해 볼 때, 적절한 설명은?
민감도와 특이도가 같은 진단 검사라 하더라도, 유병률이 다른 데이터에 적용할 경우 양성예측도와 음성예측도는 크게 바뀔 수 있다.
58
다음 ROC 곡선과 AUC에 대한 설명 중 적절하지 않은 것은?
AUC는 -1에서 1 사이의 값을 가진다.
59
다음 중 로지스틱 회귀분석을 적용하기에 적절한 상황이 아닌 것은?
독립변수가 연속형 변수이고, 반응변수가 연속형 변수인 경우
60
다음 중 로지스틱 회귀분석 결과 산출되는 지표가 아닌 것은?
상대위험도
61
췌장암 환자에게 수술후 CA19-9 값의 이상 여부가 1년 내 재발에 미치는 영향을 파악하기 위해 로지스틱 회귀분석을 수행한 결과가 다음과 같을 때 이에 대한 해석으로 옳은 것은? (단, post.CA19.9.binary는 수술 후 CA19-9 값에 이상이 있으면 1, 없으면 0이다.)
췌장암 환자에게 수술 후 CA19-9 값이 이상이 없는 경우에 비하여 CA19-9 값이 이상이 있는 경우 1년 내 재발오즈가 4.4배 증가
62
다음 중 변수 선택에 관한 설명으로 적절한 것은?
핵심적인 독립변수들로 최소화하여 효율적인 모형을 진행하는 것이 적절하다.
63
다음 중 로지스틱 회귀모형의 적합도나 성능을 평가하는 방법으로 적절하지 않은 것은?
ANOVA F-검정
64
생존분석에 대한 설명으로 적절하지 않은 것은?
카플란-마이어 방법으로 평균 생존 기간을 계산할 수 있다.
65
카플란-마이어 곡선에 대한 설명으로 옳은 것은?
중도절단이 있는 데이터의 생존함수를 추정하여 나타낸 그래프이다.
66
암 진단 후 사망까지 걸리는 시간이 A그룹과 B그룹 간에 다른지 알아보기 위하여 로그 순위 검정을 수행한 결과 p값이 0.002가 나왔다. 유의수준은 0.05를 사용할 때, 이에 대한 해석으로 적절한 것은?
두 그룹의 생존함수는 유의하게 다르다.
67
치명률이 높은 어느 질병에 대한 치료제의 효과를 알아보기 위해 300명의 자원자를 모집하여 임상시험을 수행하였다. 자원자를 랜덤하게 치료군과 대조군으로 나누어 치료군에 속한 참가자에게는 치료제를 주고, 대조군에는 플라시보를 주었다. 연구 기간 동안 사망에 대한 데이터를 수집하여 콕스 비례 위험 모형을 적합시킨 결과 치료군/대조군을 나타내는 변수의 회귀계수로 -0.3이 추정되었다. (단, 대조군이 참조범주이다.) 이에 대한 설명 중 옳은 것은?
치료 여부의 위험비(= 치료군의 위험률 / 대조군의 위험률)는 e^-0.3이다.
68
다음 중 비례 위험 가정에 대한 설명으로 적절하지 않은 것은?
중도절단 여부와 사망확률은 연관이 없다는 뜻이다.