問題一覧
1
데이터 정보 지식의 변환 과정을 통해 최종적으로 지혜를 얻어내는 계층 구조
DIKW피라미드
2
가공 전의 순수한 수치-기초
데이터
3
패턴을 인식하고 의미부여하는 단계
정보
4
DIKW피라미드 중 패턴을 토대로 예측 결과물을 만들어 내는 과정
지식
5
이해를 바탕으로 도출되는 창의적인 아이디어
지혜
6
암묵지에서 형식지가 되는 과정
표출화
7
형식지에서 암묵지로 개인에게 연결 및 습득
내면화
8
하향식 과제 탐색 2단계는?
문제 정의
9
연산이 불가능한 데이터(이미지,텍스트)
비정형
10
기업의 외부 공급업체 또는 제휴업체와 통합된 정보시스템으로 고객의 데이터 구성을 하는 조직
scm
11
경영 지원 통합 관리로 불리며 여러 업무가 하나로 통합된 시스템으로 효율성을 높임
erp
12
기업이 고객별 구매 미력 데이터 베이스를 활용하여 마케팅 전략에 활용하는 방법
crm
13
기업 전략도출 가치 기반 분석으로 알맞은 것은?
고객 니즈 변화, 경제 사회 트렌드, 인구 통계학적 변화
14
데이터를 블록 단위로 생성하여 분산 저장하는 p2p 기반 기술
블록체인
15
문제,기호, 음성 등 상호간에 관계를 갖는 다수의 객체 및 컨텐츠 등을 저장소에 수집, 축적하여 다양한 용도로 활용하는 정보의 집합체
데이터베이스
16
데이터베이스의 일반적인 특성 4가지
통합, 저장, 공용, 운영(변화)
17
데이터를 다각적 분석을 통해 인사이트 도출, 데이터 시각화, 빅데이터에 대한 이론적 지식과 숙련된 분석 기술자
데이터사이언티스트
18
데이터 사이언티스트 중 이론적 지식, 데이터 분석 기술에 대한 숙력도는 무슨 스킬
하드스킬
19
데이터 사이언티스트 필요 역량 중 통찰력, 분석, 설득력, 다분야 간 협력은 무슨 스킬인가
소프트스킬
20
데이터 사이언티스트에게 필요한 요구 역량
데이터관리, 분석모델링, 비지니스 분석
21
데이터 분석 알고리즘으로 부당한 피해를 받는 사람을 방지하기 위한 업무 수행 작업은?
알고리즈미스트
22
최적화가 필요한 문제의 해결책을 자연선택, 돌연변이를 점진적 진화 방법 알고리즘은?
유전알고리즘
23
빅데이터의 위기요인 3가지
사생활 침해, 데이터 오용, 책임 원칙 훼손
24
데이터 포인트 간의 연결 및 관계를 이해하기 위해 시각화로 표현하는 일련의 프로세스
데이터모델링
25
빅데이터의 가치 패러다임의 순서 알맞은것은?
digitalization-connection-agency
26
빅데이터 위기요인 통제방안으로 사생활 침해의 해결방안은? @@에서 @@으로
동의 책임
27
분석대상은 아는데 분석방법도 아는 분석기획은?
최적화
28
분석대상은 모르는데 분석방법은 아는 분석 기획은?
통찰력
29
분석 기획 중 분석방법은 모르지만 분석대상은 아는 경우는?
해결책
30
분석 기획 중 분석방법은 모르고, 분석대상도 모르는 경우는?
발견
31
빅데이터 분석 방법 중 데이터 분석 기획 단계에서 설정해야하는 설정은? @@@@ @@ 및 @@ 설정
비지니스 이해 범위
32
빅데이터 분석 방법론 중 비지니스 이해 및 범위 설정을 하는 단계는?
분석기획단계
33
빅데이터 분석 방법론 중 분석기획단계에서 위험 대응 계획 대응 방안은?(4가지)
완화, 전이, 수용, 회피
34
복잡하고,다양한 환경에서 다양한 원천 데이터를 대상으로 분석을 수행하여 가치있는 문제를 도출하는 접근법
상향식접근법
35
데이터 분석 마스터 플랜 수립을 하기 위한 필요 3가지 요소는?
전략적중요도, 실행용이성, 비지니스 성과 및 ROI
36
기업의 경쟁력 확보를 위해 데이터 분석가치 발견, 구성원들은 비지니스 역량, IT역량, 분석역량 필요한 조직은?
분석조직
37
데이터 거버넌스 순서로 올바른 것은?
데이터 표준화-데이터 관리 체계-데이터 저장소 관리-표준화 활동
38
데이터 구성 요소로 알맞은 것은?
원칙, 조직, 프로세스
39
분석 거버넌스 구성요소로 알맞은것은?
프로세스, 시스템, 육성 체계, 데이터
40
상향식 접근법의 확산과 하향식 접근법의 수렴 단계를 반복적 수행하는 프로세스는?
디자인 씽킹
41
프로젝트 이해, 범위 , 기획, 위험 대응 방안으로 수립하는 단계는?
분석 기획 단계
42
시급성과 난이도가 모두 높을수록, 분석 과제 우선순위는 낮은 플랜은?
분석 마스터 플랜
43
분석 마스터 플랜 수립의 적용 범위 및 방식으로 알맞은 것은?
업무 내재화, 분석 데이터, 기술 적용 수준
44
분석 마스터 플랜 수립의 우선 순위로 알맞은 3가지는?
전략적 중요도, 비지니스 효과, 실행 용이성
45
수행되는 분석 과제는 과제 후보 풀이 아니 과제 결과 풀로써 관리하는 관리 프로세스는?
분석 과제 관리 프로세스
46
데이터 분석 조직 구조로 알맞은 3가지 구조는?
분산조직구조, 기능중심조직구조, 집중조직구조
47
분석 수준 진단 결과 중 준비도는 낮고 성숙도는 높은 방식은
정착형
48
분석 수준 진단 결과 중 준비도는 낮고 , 성숙도도 낮은 형식은?
준비형
49
분석 수준 진단 결과 중 높은 준비도와 높은 성숙도로 알맞은 방식은?
확산형
50
분석 수준 진단 결과 중 높은 준비도와 낮은 성숙도로 알맞은 형식은?
도입형
51
독립 변수와 종속 변수의 사이를 모형으로 나타내고, 두 변수 간의 관계를 도출하는 계수는?
회귀계수
52
선형 회귀 모형의 전제 조건은?
선형성, 독립성, 등분산성, 정규성, 비상관성
53
조건 반응으로 표현되어 결과를 이해하기 쉽고, 사전에 적절한 품목 세분화가 필요한 분석 방법은?
연관분석
54
뚜렷한 목적이 없는 경우에 데이터를 탐색하고, 계산량이 많고, 복잡도가 낮은 분석 방식은?
연관분석
55
A를 구매하지 않았을때, 품목 B를 구매할 확률 대비를 일컫는 방식은?
향상도
56
연관분석 지표 3가지로 알맞은 것은?
지지도, 신뢰도, 향상도
57
모집단 회귀식의 예측값과 실제 관측값 차이를 일컫는 말은?
오차
58
표본 집단 회귀식의 예측값과 실제 관측값 차이를 일컫는 말은?
잔차
59
시계열 정상성 판단할때, 평균과 분산은 @@에 의존하지 않고, 공분산은 @@에만 의존, @@에는 의존하지 않음
시점 시차 시점
60
시계열의 평균이 일정하지 않는 경우에는 차분을 통해서 전환이 가능한 시계열은?
정상시계열
61
데이터 마이닝 종류 중 지도학습은?
k-평균 군집, 의사결정나무, 앙상블, 로지스틱 회귀분석
62
텍스트 데이터로부터 의미 있는 정보를 추출하고 이해하기 위한 기술은?
텍스트 마이닝
63
사전에 군집의 개수를 미리 결정하지 않아도 되고, 데이터가 많을 수록 계산량이 기하급수적으로 증가하는 군집 방법은?
계층적군집방법
64
군집 간의 높은 이질성과 군집 내의 동질성이 모두 높을 수록 효과적인 분석 방법은?
군집분석
65
변수가 너무 많아 설명이 어려울 때, 서로 상관성이 높은 변수들의 선형 결합으로 변수 요약 및 축소 기법으로 분석하는 방법은?
주성분분석
66
자료를 학습하고, 특정 분리 규칙을 찾아내고, 소집단으로 분류 분석 하는 방법은?
의사결정나무
67
구축된 모델을 평가하여 과대적합 또는 과소적합을 미세 조정하느데 활용하는 데이터는?
검증데이터
68
모집단의 변동성과 퍼짐성을 확인 가능하고 정규분포를 따르지 않는 분포로 중심극한정리에 따라 추정 가능한 추정 방법은?
모분산 추정
69
두 집단의 평균을 비교할 경우, 두 집단의 분산이 같은 경우와 다른 경우의 가설 검정 수행 방법을 알아보는 분포는?
f-분포
70
데이터에 자매해 있는 패턴이나 구조를 파악하고 , 0에 가까울수록 적합한 척도법은?
다차원 척도법
71
고차원의 데이터를 저차원 데이터로 축소하느 방법이므로, 독립변수를 간 다중공선선 문제를 해결하는척도법은?
다차원척도법
72
평균 대신 중앙값 사용하고 주어진 목적이 없기 때문에 결과 해석이 어려운 군집은?
k-평균 군집
73
중복되지 않는 k개의 데이터셋으로 나눈 후 k-1개의 데이터를 학습 데이터로 사용하는 방식은?
k-폴드 교차검증
74
두 데이터 사이의 최단 경로를 측정하는 거리 측정 방법
유클리드 거리
75
각 데이터에 일련의 번호를 부여 후 일정한 간격 추출하는 추출법은?
계통추출법
76
모집단을 특정한 기준에 따라 동질적인 표본들을 하나의 그룹으로 하여 여러 개의 이질적인 집단으로 표본 추출하는 방식은?
층화추출
77
모델 탐색은 최대 유도 추정법을 이용하고, 독립변수에 대한 어떠한 가정도 필요하지 않는 회귀분석은?
로지스틱
78
선형결합으로 이루어진 모형으로써, 서로다른 가중치를 갖는 모형은?
AR
79
시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 시계열은?
분해시계열
80
분해 시계열에 속하지 않은 요인은
평균요인
81
등간척도, 비율척도 두 변수 간의 선형적인 관계의 강도를 측정하는 상관계수는?
피어슨 상관계수
82
서열척도인 두 변수의 선형관계을 파악하는 상관계수는?
스피어만 상관계수
83
해당 변동의 추정에 사용된 독립적인 정보의 수는?
자유도
84
고차원의 데이터를 이해하기 쉬운 저차원의 지도 형태로 형상화하기에 시각적 이해하기 쉬운방법은?
자기 조직화 지도
85
경쟁 학습으로 연결 강도를 반복적으로 재조정 학습하고 수행속도가 매우 빠르지만, 최적의 초기 학습률 및 가중치의 결정이 어려운 방식은?
자기 조직화 지도
86
가장 이상적인 회귀식 중 실제값과 예측값의 오차제곱합이 가장 최소가 되는 회귀식은?
최소제곱법
87
이상값에 민감하지 않고 연관성이 낮을수록 정확도가 향상되며, 원인분석에는 부적합한 방식은?
앙상블
88
앙상블의 한 방식으로 반복 추출 방법으로 같은 데이터가 한 표본에 여러번 추출하고, 어떤 데이터는 추출 되지 않을 수 있는 방식은?
배깅
89
앙상블의 한 방식으로 재표본 과정에서 동일한 확률을 부여하지 않고, 분류가 잘못된 데이터에 가중을 주어 표본을 추출하는 분석기법은?
부스팅
90
회귀분석에서 독립변수 간에 강한 상관관계가 나타남으로 생기는 문제는?
다중공선성
91
다중공선성의 해결방안으로는 @@@가 낮으면서 @@@@가 높은 변수를 제거
중요도상관계수
92
시계열 분석을 하기 위해서는 기본적으로 평균,분산 공분산 및 기타 모든 분포적 특성인 성질은?
정상성
93
측정값을 최소값에서 최대값까지 오름차순으로 정렬한 자료를 4등분 했을때, 각 등분 위치에서 해당하는 값은?
사분위수
94
사분위수 중 하나의 변수에 대해서 평균으로부터 표준편차의 3배를 벗어나는 값은?
esd
95
인공신경망에서 은닉층이 적으면 @@적합, 은닉층이 많으면 @@적합 발생
과소과대
96
사용자와 데이터베이스 중간에 위치하여 사용자의 요구사항에 따라 데이터베이스를 관리하는 소프트웨어는?
dbms
97
데이터베이스에 명령을 내리는 데이터베이스의 하부 언어
sql
98
데이터베이스와의 통신을 위한 언어는?
sql
99
데이터 거버넌스의 구성요소로 올바른 것은?
원칙, 조직, 프로세스
100
상향식 접근 방식의 절차로 알맞은 것은?
프로세스 분류-프로세스 흐름 분석- 분석 요건 식별-분석요건 정의