빅데이터분석기사2025

19問 • 5ヶ月前

김재목

通報

問題一覧

박스플롯을 통해서 알수 없는 것은?

분산

변수선택방법 중 단계적선택법에 대한 설명중 잘못된 것은?

나머지 변수들에 대해 후진 선택법을 적용하나 새롭게 유의하지 않은 변수들을 제거하지는 않는다.

파생변수에 대한 설명으로 틀린 것은?

데이터의 특성을 파악하는데 중점을 두어 특정상황에 유의미하도록 변수를 생성해야한다.

어떤 학습데이터 불균형에 대한 처리방법이다. 옳은 것을 고르시오. 소수클래스의 복사본을 만들어, 대표클래스의 수만큼 데이터를 만들어 주는 것이다. 똑같은 데이터를 그대로 복사하는 것이기 때문에 새로운 데이터는 기존 데이터와 같은 성질을 갖게 된다.

오버샘플링

자료의 값 대신 순위를 이용하여 경우의 상관계수로서, 데이터를 작은 것부터 차례로 순위를 매겨 서열 순서로 바꾼뒤 순위를 이용해 상관계수를 구한다. 두변수 간의 연관관계가 있는지 없는지를 밝혀 주며 자료에 이상점이 있거나 표본크기가 작을 때 유용하다.

스피어만 상관계수

데이터의 시각화에 대한 설명이다. 아래 설명에 해당되는 차트는 무엇인가? - 하나의 공간에 각각의 변수를 표현하는 몇개의 축을 그려서 축을 해당되는 변수값을 연결하는 그래프이다. - 각 변수마다 축시작점은 최소, 가장 먼점은 최대값을 나타낸다. - 연결되는 선의 모양이나 색을 다르게 하는 경우 여러 속성을 한번에 표현이 가능하다.

스타차트

차원축소에 관한 설명중 틀린것은?

차원의 저주란 데이터 분석 및 알고리즘을 통한 학습을 위한 차원이 증가하면서 학습데이터의 증가를 수반하여 계산성능이 저하되는 현상을 말한다.

다음은 층화 추출에서 각 층별로 표본을 배정하는데 있어서 한가지 방법을 설명한 것이다. 해당하는 표본 배정법은? 추정량의 분산을 최소화 시키거나 주어진 분산의 범위하에서 비용을 최소화 시키는 표본배정방법

최적 배분법

모집단이 정규분포를 따를 때 표본크기에 따른 표본 분포에 관한 내용으로 틀린 것은 ?

표본의 크기와 상관없이 정규분포를 따른다.

전체 독립변수 중에서 종속변수와 상관관계가 적은 변수를 점진적으로 분석모형에서 제외하는 방법은?

후진소거

다음 중 빅데이터의 특징 5V에 대한 설명으로 옳은 것은?

Velocity : 데이터가 실시간으로 변한다.

다음 중 빅데이터 분석방법론의 데이터 분석 단계에서 수행하는 작업으로 옳지 않은 것은 ?

평가용 데이터 준비

다음 보기에서 설명하고 있는 내용으로 적절한 것은? - 수집한 데이터를 저장 처리하고 분석 할 수 있도록 포괄적으로 지원한다.

빅데이터 플랫폼

다음 중 가역 데이터 와 불가역 데이터에 대한 설명으로 옳지 않은 것은?

불가역 데이터는 원본 데이터의 내용이 변경되는 경우 변경사항을 반영할 수 있다.

다음중 정량적 데이터와 정성적 데이터에 대한 설명으로 옳지 않은 것은?

정성적 데이터 중 변수 데이터는 연속형 데이터로 변환 가능하다.

다음 중 데이터 변환에 대한 예시로 옳지 않은것은?

1,2,3 학년 값을 batch로 변환하여 데이터 분할

다음 중 개인정보보호 관련 법률에 대한 설명으로 옳지 않은 것은?

익명정보를 생성할 때 당사자의 동의를 구해야 한다.

다음 중 보기에서 설명하고 있는 비식별화 기법과 세부기술로 옳은 것은? - 사용자에 대한 정보를 뒤섞어 정보의 손실 없이 특정 개인에 대한 추측을 할 수 없도록 한다.

총계처리 - 재배열

다음 중 식별화 기법에 대한 설명으로 옳지 않은것은?

데이터 마스킹 수준이 높으면 데이터를 식별, 예측하기 쉬워진다.

빅데이터분석기사

김재목 · 59問 · 1年前