問題一覧
1
01. 다음 중 기업의 전략 도출을 위한 가치 기반 분석과 관련된 설명으로 옳지 않은 것은?
기존 성과를 유지하고 업계를 따라잡는 것이 전략적 가치 기반 분석의 가장 중요한 목표이다.
2
2. 빅데이터 분석 활용의 효과 예시로 가장 옳지 않은 것은?
서비스 산업의 확대와 제조업의 축소
3
3. 데이터베이스의 일반적인 특징으로 옳지 않은 것은?
데이터베이스는 응용프로그램의 종속성을 가진다.
4
4, 다음 중 기업 내부 데이터베이스 솔루션으로 알맞지 않은 것은?
lTS
5
5. 데이터의 특징에 대한 설명 중 옳지 않은 것은?
데이터의 최소단위는 바이트로 0과 1의 이진수 하나로 이루어져있다.
6
6. 이미지, 로그, 영상, 텍스트 등의 데이터 형태로 알맞은 것은?
Unstructured data
7
7. 다음 중 빅데이터 활용 기법에 관한 설명으로 옳지 않은 것은?
군집분석을 통해 고객의 개인신용평가에 활용한다.(신용예측에 활용한다.)
8
8. 빅데이터가 만들어 낸 본질적인 변화로 옳지 않은 것은? 가. 사전처리 -> 사후처리 나. 대면조사 -> 표본조사 다. 질보다 -> 양적으로 라. 상관관계 -> 인과관계
나,라
9
9. 가트너가 본 데이터 사이언티스트의 요구 역량으로 알맞지 않은 것은?
조직 관리
10
10. 다음 중 데이터 사이언티스트에게 요구되는 하드스클로 알맞은 것은?
데이터 분석 기술
11
11. 조직에 데이터 분석 문화를 자리잡게 하기 위한 행동으로 알맞지 않은 것은?
경영진을 대상으로 한시적 속성 교육을 강화해야 한다.
12
12. 아래에서 설명한 데이터 분석 조직 구조는? 전사 분석업무를 별도의 분석 전담 조직에서 담당 전략적 중요도에 따라 분석조직이 우선순위를 정해서 진행 가능 현업 업무부서의 분석업무와 이중화/이원화 가능성 높음
집중 구조
13
13. 빅데이터 분석방법론의 분석기획 단계 산출물인 프로젝트 범위 정의서 (SOW)에 들어가는 내용으로 옳은 것은?
비즈니스 이해
14
15. 빅데이터 분석 절차는 빅데이터 분석 방법론을 토대로 5단계 절차고 수행된다. 절차로 옳은 것은?
분석 기획 -> 데이터 준비 -> 데이터 분석 -> 시스템 구현 -> 평가 및 전개
15
16. 분석과제 발굴 방법 중 상향식 접근법에 대한 설명으로 옳지 않은 것은?
분석 대상이 명확할 때 솔루션을 찾는 방식이다.
16
17. 과제 중시저긴 접근방식으로 진행되는 특징으로 알맞지 않은 것은?
Accuracy&Deploy
17
18. 하향식 접근방식의 수행내용으로 옳지 않은 것은?
프로토타이핑
18
19. 빅데이터 분석 방법론의 분석기획 단계에서 수행하는 주요 task로 옳은 것은?
비즈니스의 이해 및 범위 설정
19
20. 데이터 분석기획 유형에 관한 설명으로 옳지 않은 것은?
최적화, 솔루션, 관찰, 발견의 4가지 분석 주제 유형으로 이루어져 잉ㅆ다.
20
21. 다음이 설명하는 표본추출방법으로 알맞은 것은? 모집단을 상이한 집단으로 나누고 각 집단에서 무작위로 표본을 추출하는 방법
층화추출법
21
22. 주성분 수의 선택방법에 대한 설명으로 가장 옳지 않은 것은?
전체변이 공헌도 방법은 고유값 평균 및 스크린 플랏 방법보다 항상 우수하다.
22
23. 의사결정나무 분리기준인 엔트로피 지수의 계산식?
엔트로피 지수 (영상 보기)
23
24. 확률에 대한 설명으로 가장 적합하지 않은 것은?
A와 B가 독립사건인 경우, 각 독립사건들의 확률의 합은 합집합의 확률과 동일하다.
24
25. 아래 데이터는 닭의 성장률에 대한 다양한 사료 보충제의 효과를 측정하고 비교하기 위한 사료유형별 닭의 무게 데이터이다. summary 함수 결과에 대한 해석 중 옳지 않는 것은?
weight의 평균값은 258.0이다.
25
26. 계층적 군집 방법으로 가장 알맞지 않은 것은?
편차 연결법
26
27. 분해시계열의 요인으로 알맞지 않은 것은?
환경 요인
27
28, 다음 수식으로 구할 수 있는 데이터 간 거리는?
민코프스키 거리(민코우스키 거리)
28
29. 다음 중 의사결정나무와 가장 관련 없는 용어는?
퍼셉트론
29
30. 두개의 확률변수 x,y 의 공분산에 대한 설명 중 옳지 않은 것은?
공분산의 크기는 상관계수와 동일하게 -1~1 사이의 범위를 갖는다
30
31. 아래의 f-Beta Score(지표)에 대한 설명으로 옳은 것은?
Beta값이 0.5일 경우 precision에 2배 가중치하여 평균한다.
31
32. 앙상블 기법에 대한 설명으로 알맞은 것은?
대표적인 앙상블 기법은 배깅, 부스팅이 있다.
32
33. 다음 중 통계적 가설 검정에 대한 설명으로 옳지 않은 것은?
사실인 귀무가설을 기각했을 때 발생하는 오류를 제2종 오류라 한다.
33
34. K-means 군집분석에 대한 설명으로 옳은 것은?
군집 절차 수행 시 군집 수 k는 초기에 설정되어야 한다.
34
35. 아래 오분류표에서 재현율(Recall)로 가장 알맞은 것은?
3/10
35
36. 확률질량함수의 확률변수 X의 기대값은?
13/6
36
37. 군집분석 시 데이터의 단위가 다를 경우 사용하는 기법으로 알맞은 것은?
Scaling
37
38. 다음 중 통계 용어에 대한 설명으로 옳지 않은 것은?
다른 변수의 영향을 받는 변수를 설명변수라고 한다.
38
39. 다음 중 시계열 모형에 대한 설명으로 옳은 것은?
ARIMA 모형에서 p=0 일 때, IMA(d,q)모형이라고 부르고, d번 차분하면 MA(q) 모형을 따른다.
39
40. 다음 중 데이터의 정규성을 확인하기 위한 방법으로 알맞지 않은 것은?
히스토그램
40
다음 중 선형회귀모형이 통계적으로 유의미한지 평가하는 통계량으로 옳은 것은?
F-Statistics
41
42. 데이터의 양이 가장 많이 발생하는 유형의 척도로 알맞은 것은?
비율 척도
42
43. 상관계수에 대한 설명으로 옳지 앟은 것은?
스피어만 상관계수는 모수적 관계에서 두 변수간의 단조적인 관계의 강도를 측정한다.
43
44. 시계열 데이터의 정상성에 대한 설명으로 옳지 않은 것은?
시계열 자료는 독립성을 충족해야 한다.
44
45. 다음 중 회귀분석에서 모형의 설명력을 확인하기 위해 사용되는 결정계수의 특성으로 옳지 않은 것은?
종속변수와 독립변수 사이의 표본 상관계수 값과 같다.
45
46. 선형회귀모형의 오차항에 대한 가정조건으로 옳은 것은?
독립성, 등분산성, 정규성
46
47. 아래 설명에 해당하는 용어로 알맞은 것은? 다층 신경망 모형에서 은닉층의 개수를 너무 많이 설정하면 역전파 과정에서 앞쪽 은닉층의 가중치가 조정되지 않아, 신경망에 대한 학습이 제대로 되지않는 현상
기울기 소실
47
48. 아래 보기의 회귀모델에 대한 설명 중 옳지 않은 것은?
time이 1 증가할 때, weight이 5.99만큼 증가한다
48
49. 카이제곱 통계량의 예측 표본과 실제 표본의 차이와 검정통계량에 따른 유의확률의 변화로 옳은 것은?
예측 표본과 실제 표본의 차이가 많을 때, 도수가 낮아지고 검정 통계량이 높아져 유의확률이 낮아진다.
49
50. 인공신경망 함수에 대한 설명으로 옳지 않은 것은?
쌍곡탄젠트 함수는 0~1 사이의 값을 출력하며 시그모이드 함수와 관련있다.