3과목 빅데이터모델링

3과목 빅데이터모델링
31問 • 2年前
  • 김근영
  • 通報

    問題一覧

  • 1

    분석모형의 종류3

    에측 분석모형 현황 진단모형 최적화 분석모형

  • 2

    지도학습

    분류,회귀

  • 3

    분류

    의사결정트리(분류) 랜덤포레스트 인공신경망(지도) 서포트벡터머신 로지스틱회귀분석

  • 4

    회귀

    의사결정트리(회귀) 선형회귀분석 다중회계분석

  • 5

    비지도학습

    군집분석 연관성분석 인공신경망(비지도) 오토인코더

  • 6

    준지도학습이안?

    정답이있는데이터 없는데이터 동시학습

  • 7

    회귀선(회귀계수)

    독립변수가 주어질때의 종속변수의 기댓값으로 일반적으로 최소제곱법을 이용.

  • 8

    최소제곱법

    잔차의 제곱의 합이 최소가 되게하는 직선을 찾는법

  • 9

    선형회귀분석의 기본가정

    선형성 독립변수와 종속변수는 선형적이여야한다. 잔차 정규성 잔차의 기대값은 0이고 정규분포이다. 잔차독립성 잔차들은 서로 독립적이어야한다. 잔차등분산성 잔차들의 분산이 일정헤야한다. 다중공산성 다중회귀분석응 수행할경우 3개이상의 독립변수 간에 상관관계로 문제가없어야한다.

  • 10

    다중선형회귀분석

    1개의 종속변수와 2개이상의독립변수 y=ax1 bx2 cx3 +d

  • 11

    분류나무 분할기준

    카이제곱통계량의 p-value 지니계수 틀릴확률? 엔트로피지수 무질서정도에 대한 측도

  • 12

    회귀나무 분할기준

    F통계량의 p-value ->등분산성을 검정하여 p값이커지면 등분상성이있음 낮은이질성 즉 순수도가 높다. 분산의감소량 ->감소량이 최대값이 될수록 낮은 이질성

  • 13

    의사결정나무의 대표알고리즘 369p

    CART C4.5/C5.0 CHAID 랜덤포레스트

  • 14

    랜덤포레스트 370p

    부트스트래핑 배깅 부스팅

  • 15

    기울기의 최소값을 찾는 방법

    경사 하강법 경사 상승법 확률적 경사 하강법

  • 16

    가중치감소 (weight decay)

    라쏘 L1 규제(정규화) 절대값 릿지 L2 규제(정규화) 유클리드거리값

  • 17

    드롭아웃

    은닉충의 뉴런을 임의삭제 앙상블효과처럼

  • 18

    하이퍼파라미터 최적화수행방법4

    그리드서치 랜덤서치 베이지안최적화 자동화

  • 19

    기울기소실 해결방안

    relu lstm(long short-term memory) GRU 배치정규화

  • 20

    OH

    H + 2P -FH/S +1

  • 21

    OW

    W+2P-FW / S. +1

  • 22

    RNN

    은닉층이 순환구조로 동일한 가중치를 공유. 확률족 경사하강법 SGD 사용. 필기인식이나 음성인식등 시변적특징의 데이터에 적용할수있더.

  • 23

    LSTM / 3가지게이트

    RNN단점보완 일반 신경망대비 4배많은 파라미터보유. 입력 / 출력 / 망각 GRU와 비슷함.

  • 24

    오토인코더

    비지도. 다차원데이터를 저차원으로 바꾸고 다시 저->고 바꾸면서 데이터의 특장점을 찾아낸다. 인코더 디코더

  • 25

    연관성규칙? 지지도 신뢰도 향상도

    지지도 해당 물건을 구입할확률 신뢰도 구매했을때 다른물건을 구입할 조건부 확룰 향상도 1보다크면 양의상관 작으면 음

  • 26

    독립변수 종속변수에 따른 분석방법

    .

  • 27

    시계열데이터 정상성?

    시계열데이터가 평균과 분산이 일정한경우 일정하지않으먼? 평균 ->차분을 통해 분산 -> 변환을 통해

  • 28

    시계열자료 분석방법 단순

    이동평균법 지수평활법 분할법

  • 29

    시계열자료 분석방법 모형기반

    자기회귀모형AR 자기회귀이동평균모형ARMA 자기회귀이동누적평균모형ARIMA

  • 30

    앙상블 분석의 종류

    보팅 부스팅 배깅 스태킹

  • 31

    비모수통계 검정법4 434p

    부호검정 부호만 검정 윌콕슨 부호와 관측치까지 만위트니 두집단의 중앙값차이 크루스칼 왈리스 세개이상의 중앙값차이

  • 컴플

    컴플

    김근영 · 13問 · 3年前

    컴플

    컴플

    13問 • 3年前
    김근영

    전입시험1차

    전입시험1차

    김근영 · 58問 · 2年前

    전입시험1차

    전입시험1차

    58問 • 2年前
    김근영

    전입시험2차

    전입시험2차

    김근영 · 37問 · 2年前

    전입시험2차

    전입시험2차

    37問 • 2年前
    김근영

    은행편

    은행편

    김근영 · 22問 · 2年前

    은행편

    은행편

    22問 • 2年前
    김근영

    공통

    공통

    김근영 · 31問 · 2年前

    공통

    공통

    31問 • 2年前
    김근영

    1과목

    1과목

    김근영 · 32問 · 2年前

    1과목

    1과목

    32問 • 2年前
    김근영

    2과목 데이터전처리

    2과목 데이터전처리

    김근영 · 36問 · 2年前

    2과목 데이터전처리

    2과목 데이터전처리

    36問 • 2年前
    김근영

    4과목 빅데이터 결과해석

    4과목 빅데이터 결과해석

    김근영 · 22問 · 2年前

    4과목 빅데이터 결과해석

    4과목 빅데이터 결과해석

    22問 • 2年前
    김근영

    기타

    기타

    김근영 · 20問 · 2年前

    기타

    기타

    20問 • 2年前
    김근영

    수신1

    수신1

    김근영 · 54問 · 2年前

    수신1

    수신1

    54問 • 2年前
    김근영

    키워드

    키워드

    김근영 · 5問 · 2年前

    키워드

    키워드

    5問 • 2年前
    김근영

    수신2

    수신2

    김근영 · 45問 · 2年前

    수신2

    수신2

    45問 • 2年前
    김근영

    문풀

    문풀

    김근영 · 19問 · 2年前

    문풀

    문풀

    19問 • 2年前
    김근영

    꼬리표 여신

    꼬리표 여신

    김근영 · 10問 · 2年前

    꼬리표 여신

    꼬리표 여신

    10問 • 2年前
    김근영

    1과목

    1과목

    김근영 · 22問 · 2年前

    1과목

    1과목

    22問 • 2年前
    김근영

    2과목

    2과목

    김근영 · 13問 · 2年前

    2과목

    2과목

    13問 • 2年前
    김근영

    3과목

    3과목

    김근영 · 11問 · 2年前

    3과목

    3과목

    11問 • 2年前
    김근영

    으!.

    으!.

    김근영 · 21問 · 2年前

    으!.

    으!.

    21問 • 2年前
    김근영

    은행편2024

    은행편2024

    김근영 · 24問 · 2年前

    은행편2024

    은행편2024

    24問 • 2年前
    김근영

    토스

    토스

    김근영 · 9問 · 1年前

    토스

    토스

    9問 • 1年前
    김근영

    202406

    202406

    김근영 · 5問 · 1年前

    202406

    202406

    5問 • 1年前
    김근영

    1과목

    1과목

    김근영 · 24問 · 1年前

    1과목

    1과목

    24問 • 1年前
    김근영

    3과목

    3과목

    김근영 · 10問 · 1年前

    3과목

    3과목

    10問 • 1年前
    김근영

    2과목

    2과목

    김근영 · 5問 · 1年前

    2과목

    2과목

    5問 • 1年前
    김근영

    4과목

    4과목

    김근영 · 9問 · 1年前

    4과목

    4과목

    9問 • 1年前
    김근영

    1

    1

    김근영 · 16問 · 1年前

    1

    1

    16問 • 1年前
    김근영

    2

    2

    김근영 · 14問 · 1年前

    2

    2

    14問 • 1年前
    김근영

    3과목

    3과목

    김근영 · 28問 · 1年前

    3과목

    3과목

    28問 • 1年前
    김근영

    카페 약어

    카페 약어

    김근영 · 19問 · 1年前

    카페 약어

    카페 약어

    19問 • 1年前
    김근영

    1

    1

    김근영 · 17問 · 1年前

    1

    1

    17問 • 1年前
    김근영

    問題一覧

  • 1

    분석모형의 종류3

    에측 분석모형 현황 진단모형 최적화 분석모형

  • 2

    지도학습

    분류,회귀

  • 3

    분류

    의사결정트리(분류) 랜덤포레스트 인공신경망(지도) 서포트벡터머신 로지스틱회귀분석

  • 4

    회귀

    의사결정트리(회귀) 선형회귀분석 다중회계분석

  • 5

    비지도학습

    군집분석 연관성분석 인공신경망(비지도) 오토인코더

  • 6

    준지도학습이안?

    정답이있는데이터 없는데이터 동시학습

  • 7

    회귀선(회귀계수)

    독립변수가 주어질때의 종속변수의 기댓값으로 일반적으로 최소제곱법을 이용.

  • 8

    최소제곱법

    잔차의 제곱의 합이 최소가 되게하는 직선을 찾는법

  • 9

    선형회귀분석의 기본가정

    선형성 독립변수와 종속변수는 선형적이여야한다. 잔차 정규성 잔차의 기대값은 0이고 정규분포이다. 잔차독립성 잔차들은 서로 독립적이어야한다. 잔차등분산성 잔차들의 분산이 일정헤야한다. 다중공산성 다중회귀분석응 수행할경우 3개이상의 독립변수 간에 상관관계로 문제가없어야한다.

  • 10

    다중선형회귀분석

    1개의 종속변수와 2개이상의독립변수 y=ax1 bx2 cx3 +d

  • 11

    분류나무 분할기준

    카이제곱통계량의 p-value 지니계수 틀릴확률? 엔트로피지수 무질서정도에 대한 측도

  • 12

    회귀나무 분할기준

    F통계량의 p-value ->등분산성을 검정하여 p값이커지면 등분상성이있음 낮은이질성 즉 순수도가 높다. 분산의감소량 ->감소량이 최대값이 될수록 낮은 이질성

  • 13

    의사결정나무의 대표알고리즘 369p

    CART C4.5/C5.0 CHAID 랜덤포레스트

  • 14

    랜덤포레스트 370p

    부트스트래핑 배깅 부스팅

  • 15

    기울기의 최소값을 찾는 방법

    경사 하강법 경사 상승법 확률적 경사 하강법

  • 16

    가중치감소 (weight decay)

    라쏘 L1 규제(정규화) 절대값 릿지 L2 규제(정규화) 유클리드거리값

  • 17

    드롭아웃

    은닉충의 뉴런을 임의삭제 앙상블효과처럼

  • 18

    하이퍼파라미터 최적화수행방법4

    그리드서치 랜덤서치 베이지안최적화 자동화

  • 19

    기울기소실 해결방안

    relu lstm(long short-term memory) GRU 배치정규화

  • 20

    OH

    H + 2P -FH/S +1

  • 21

    OW

    W+2P-FW / S. +1

  • 22

    RNN

    은닉층이 순환구조로 동일한 가중치를 공유. 확률족 경사하강법 SGD 사용. 필기인식이나 음성인식등 시변적특징의 데이터에 적용할수있더.

  • 23

    LSTM / 3가지게이트

    RNN단점보완 일반 신경망대비 4배많은 파라미터보유. 입력 / 출력 / 망각 GRU와 비슷함.

  • 24

    오토인코더

    비지도. 다차원데이터를 저차원으로 바꾸고 다시 저->고 바꾸면서 데이터의 특장점을 찾아낸다. 인코더 디코더

  • 25

    연관성규칙? 지지도 신뢰도 향상도

    지지도 해당 물건을 구입할확률 신뢰도 구매했을때 다른물건을 구입할 조건부 확룰 향상도 1보다크면 양의상관 작으면 음

  • 26

    독립변수 종속변수에 따른 분석방법

    .

  • 27

    시계열데이터 정상성?

    시계열데이터가 평균과 분산이 일정한경우 일정하지않으먼? 평균 ->차분을 통해 분산 -> 변환을 통해

  • 28

    시계열자료 분석방법 단순

    이동평균법 지수평활법 분할법

  • 29

    시계열자료 분석방법 모형기반

    자기회귀모형AR 자기회귀이동평균모형ARMA 자기회귀이동누적평균모형ARIMA

  • 30

    앙상블 분석의 종류

    보팅 부스팅 배깅 스태킹

  • 31

    비모수통계 검정법4 434p

    부호검정 부호만 검정 윌콕슨 부호와 관측치까지 만위트니 두집단의 중앙값차이 크루스칼 왈리스 세개이상의 중앙값차이