問題一覧
1
분산
2
나머지 변수들에 대해 후진 선택법을 적용하나 새롭게 유의하지 않은 변수들을 제거하지는 않는다.
3
데이터의 특성을 파악하는데 중점을 두어 특정상황에 유의미하도록 변수를 생성해야한다.
4
오버샘플링
5
스피어만 상관계수
6
스타차트
7
차원의 저주란 데이터 분석 및 알고리즘을 통한 학습을 위한 차원이 증가하면서 학습데이터의 증가를 수반하여 계산성능이 저하되는 현상을 말한다.
8
최적 배분법
9
표본의 크기와 상관없이 정규분포를 따른다.
10
후진소거
11
Velocity : 데이터가 실시간으로 변한다.
12
평가용 데이터 준비
13
빅데이터 플랫폼
14
불가역 데이터는 원본 데이터의 내용이 변경되는 경우 변경사항을 반영할 수 있다.
15
정성적 데이터 중 변수 데이터는 연속형 데이터로 변환 가능하다.
16
1,2,3 학년 값을 batch로 변환하여 데이터 분할
17
익명정보를 생성할 때 당사자의 동의를 구해야 한다.
18
총계처리 - 재배열
19
데이터 마스킹 수준이 높으면 데이터를 식별, 예측하기 쉬워진다.
問題一覧
1
분산
2
나머지 변수들에 대해 후진 선택법을 적용하나 새롭게 유의하지 않은 변수들을 제거하지는 않는다.
3
데이터의 특성을 파악하는데 중점을 두어 특정상황에 유의미하도록 변수를 생성해야한다.
4
오버샘플링
5
스피어만 상관계수
6
스타차트
7
차원의 저주란 데이터 분석 및 알고리즘을 통한 학습을 위한 차원이 증가하면서 학습데이터의 증가를 수반하여 계산성능이 저하되는 현상을 말한다.
8
최적 배분법
9
표본의 크기와 상관없이 정규분포를 따른다.
10
후진소거
11
Velocity : 데이터가 실시간으로 변한다.
12
평가용 데이터 준비
13
빅데이터 플랫폼
14
불가역 데이터는 원본 데이터의 내용이 변경되는 경우 변경사항을 반영할 수 있다.
15
정성적 데이터 중 변수 데이터는 연속형 데이터로 변환 가능하다.
16
1,2,3 학년 값을 batch로 변환하여 데이터 분할
17
익명정보를 생성할 때 당사자의 동의를 구해야 한다.
18
총계처리 - 재배열
19
데이터 마스킹 수준이 높으면 데이터를 식별, 예측하기 쉬워진다.