問題一覧
1
회귀/분류 모두에 사용이 가능한 분석방법이다.
2
초매개변수인 C값을 증가시키면 과소적합이 발생할 가능성이 있다.
3
이상치에 영향을 크게 받지 않고, 일반적으로 성능이 좋다
4
전체 변수 중에 일부 변수를 선택하여 의사결정나무를 무작위로 생성한 후 최종결과 값을 산출해내는 모형을 배깅이라 한다.
5
잡음 또는 이상치에 영향을 받지 않는다.
6
2
7
k=3
8
1,2,3,4
9
덴드로그램, 단일(최단) 연결법, 완전(최장) 연결법, 평균연결법, 중심연결법, 군집 내 오차제곱합
10
평균연결법 - 군집 내 오차제곱합을 이용
11
N-Gram
12
선형성
13
딥러닝은 인공신경망으로 발전했다.
14
복제 횟수는 내부에서 결정되며 사용자가 임의로 변경할 수 없다.
15
ETL
16
오차 역전파를 사용한다.
17
분석기획 —> 데이터 준비 —> 데이터 분석 —> 시스템 구현 —> 평가및 전개
18
지도학습
19
t-근접성은 특정 정보의 분포와 전체 데이터 집합에서 정보의 분포가 t 이상의 차이를 보이도록 해야한다.
20
특이화
21
가설검정
22
최적화 optimization
23
입사 지원자에 대해 회사가 범죄경력을 조회하는 경우
24
비업무 규칙 적용 - 업무 규칙에 정의되어 있지 않는 값을 검증한다.
25
탐색적 데이터 분석(EDA)
26
요인분석
27
데이터를 기반으로 왜 발생했는가?
28
보고오류 - Reporting Error
29
DBMS로 부터 크롤링 한다.
30
인프라
31
개인정보 파기 사유
32
프로세스 분류—>프로세스 흐름분석—>분석요건식별—>분석요건정의
33
완전성
34
개인정보 차등 보호
35
평균
36
후진 소거법
37
불균형 문제를 처리하지 않으면 정확도(Accuracy)는 낮아지고 작은 클래스의 재현율(Recall)은 높아진다.
38
소수의 데이터를 복제하여 생성한다.
39
6/17
40
가, 나, 다
41
표본상관계수
42
평행 좌표계
43
표본의 개수가 많을 수록 표준오차는 커진다.
44
데이터 간 높은 상관관계가 존재하는 상황에서 상관관계를 제거할 경우 분석이 어려워진다.
45
중위수
46
층화추출법
47
임계값 cut-off value
48
이항분포
49
포아송 분포는 독립적인 두 카이제곱 분포가 있을 때, 두 확률 변수의 비이다.
50
표본의 크기와 상관없이 T분포는 정규분포를 따른다.
51
후진 소거법
52
가중치
53
선형성
54
다른 모형에 비해 속도가 빠르다
55
공분산행렬을 사용하여 고윳값이 1보다 큰 주성분의 개수를 이용한다.
56
로지스틱 회귀분석
57
부스팅 - GBM
58
정확성(varacity)
59
데이터의 볼륨이 클수록 데이터의 가치가 높아진다는 것을 의미한다
딥러닝
딥러닝
ユーザ名非公開 · 40問 · 7ヶ月前딥러닝
딥러닝
40問 • 7ヶ月前Ai 기말 문제
Ai 기말 문제
슈크림곰 · 46問 · 1年前Ai 기말 문제
Ai 기말 문제
46問 • 1年前ㅌㄱㅎ
ㅌㄱㅎ
E. HAZARD · 31問 · 1年前ㅌㄱㅎ
ㅌㄱㅎ
31問 • 1年前통계와수치 계산 없는 문제2
통계와수치 계산 없는 문제2
ユーザ名非公開 · 38問 · 1年前통계와수치 계산 없는 문제2
통계와수치 계산 없는 문제2
38問 • 1年前통계와수치1
통계와수치1
ユーザ名非公開 · 30問 · 1年前통계와수치1
통계와수치1
30問 • 1年前問題一覧
1
회귀/분류 모두에 사용이 가능한 분석방법이다.
2
초매개변수인 C값을 증가시키면 과소적합이 발생할 가능성이 있다.
3
이상치에 영향을 크게 받지 않고, 일반적으로 성능이 좋다
4
전체 변수 중에 일부 변수를 선택하여 의사결정나무를 무작위로 생성한 후 최종결과 값을 산출해내는 모형을 배깅이라 한다.
5
잡음 또는 이상치에 영향을 받지 않는다.
6
2
7
k=3
8
1,2,3,4
9
덴드로그램, 단일(최단) 연결법, 완전(최장) 연결법, 평균연결법, 중심연결법, 군집 내 오차제곱합
10
평균연결법 - 군집 내 오차제곱합을 이용
11
N-Gram
12
선형성
13
딥러닝은 인공신경망으로 발전했다.
14
복제 횟수는 내부에서 결정되며 사용자가 임의로 변경할 수 없다.
15
ETL
16
오차 역전파를 사용한다.
17
분석기획 —> 데이터 준비 —> 데이터 분석 —> 시스템 구현 —> 평가및 전개
18
지도학습
19
t-근접성은 특정 정보의 분포와 전체 데이터 집합에서 정보의 분포가 t 이상의 차이를 보이도록 해야한다.
20
특이화
21
가설검정
22
최적화 optimization
23
입사 지원자에 대해 회사가 범죄경력을 조회하는 경우
24
비업무 규칙 적용 - 업무 규칙에 정의되어 있지 않는 값을 검증한다.
25
탐색적 데이터 분석(EDA)
26
요인분석
27
데이터를 기반으로 왜 발생했는가?
28
보고오류 - Reporting Error
29
DBMS로 부터 크롤링 한다.
30
인프라
31
개인정보 파기 사유
32
프로세스 분류—>프로세스 흐름분석—>분석요건식별—>분석요건정의
33
완전성
34
개인정보 차등 보호
35
평균
36
후진 소거법
37
불균형 문제를 처리하지 않으면 정확도(Accuracy)는 낮아지고 작은 클래스의 재현율(Recall)은 높아진다.
38
소수의 데이터를 복제하여 생성한다.
39
6/17
40
가, 나, 다
41
표본상관계수
42
평행 좌표계
43
표본의 개수가 많을 수록 표준오차는 커진다.
44
데이터 간 높은 상관관계가 존재하는 상황에서 상관관계를 제거할 경우 분석이 어려워진다.
45
중위수
46
층화추출법
47
임계값 cut-off value
48
이항분포
49
포아송 분포는 독립적인 두 카이제곱 분포가 있을 때, 두 확률 변수의 비이다.
50
표본의 크기와 상관없이 T분포는 정규분포를 따른다.
51
후진 소거법
52
가중치
53
선형성
54
다른 모형에 비해 속도가 빠르다
55
공분산행렬을 사용하여 고윳값이 1보다 큰 주성분의 개수를 이용한다.
56
로지스틱 회귀분석
57
부스팅 - GBM
58
정확성(varacity)
59
데이터의 볼륨이 클수록 데이터의 가치가 높아진다는 것을 의미한다