머신러닝 공부를 위한 첫 번째 정리

2022. 12. 11. 17:07ML

1.머신러닝이란?
    A.데이터에서부터 학습하도록 컴퓨터를 프로그래밍 하는 기술
2.데이터 마이닝: 대용량의 데이터를 분석하면서 보이지 않던 패턴을 발견하는 일
3.머신러닝 시스템의 종류
    A.지도 학습
        i.훈련시키는 데이터에 대한 정답을 포함하는 학습
            1.분류(ex: 스팸 필터)
            2.회귀: Feature(예측 변수)을 이용하여 타깃 수치를 예측
    B.비지도 학습
        i.훈련시키는 데이터에 대한 정답을 포함하지 않는 학습
            1.군집
            2.시각화와 차원 축소
            3.연관 규칙 학습
            4.이상치 탐지
    C.준지도 학습
        i.일부만 레이블이 있는 경우에 학습
    D.강화 학습
        i.에이전트가 환경을 관찰
        ii.행동 실행
        iii.보상 받기
        iv.가장 큰 보상을 받기 위한 정책을 학습
    E.배치 학습(오프라인 학습)
        i.시스템을 훈련시키고 더 이상의 학습은 없음
    F.온라인 학습
        i.미니 배치라고 부르는 작은 묶음 단위로 주입하여 훈련>> 데이터가 도착하는 대로 즉시 학습 가능
    G.사례 기반 학습
        i.훈련 샘플을 기억하고 유사도를 측정하여 학습
    H.모델 기반 학습
        i.샘플들의 모델을 만들어 예측에 사용
4.머신러닝의 주요 과제
    A.많은 양의 데이터
    B.데이터 정제>> 품질이 낮은 데이터를 제거하고, 관련 없는 특성들을 처리
        i.과대적합 및 과소적합이 일어나지 않도록 훈련(하이퍼 파라미터와 규제를 잘 사용해서 모델 만들기
    C.모델 평가
        i.홀드아웃 검증: train_set과 test_set을 분리하여 평가
        ii.교차 검증: 작은 검증 세트를 여러 개 사용하여 평가

'ML' 카테고리의 다른 글

MLP와 RNN 알아보기  (0) 2023.01.09
XGBOOST Algorithm  (0) 2023.01.09
RandomForest Algorithm  (0) 2022.12.21
머신러닝 공부를 위한 두 번째 정리  (0) 2022.12.11