분류 전체보기(5)
-
MLP와 RNN 알아보기
저번 글에서는 Boosting에 대해서 알아봤는데요. 이번 시간에는 머신러닝에서 많이 사용되고 있는 알고리즘인 MLP와 RNN에 대해서 알아보도록 하겠습니다. 1.MLP(Multi Layer Perceptron) MLP에 대해 먼저 알아보기 앞서 Perceptron에 대해서 알아볼 필요성이 있습니다. Perceptron의 개념은 사실 매우 간단합니다. 각각의 변수마다 각각의 가중치를 곱해서 모두 더한후 함수를 이용해 나타내는 방식인데요 위 그림을 보면 쉽게 이해가 가실 겁니다. 편향을 표현하기 위한 1을 제외 하고 각각의 변수마다 가중치를 이용해서 y값을 1 또는 -1로 구분할 수 있게 하는 것이 바로 perceptron입니다. 또한 이렇게 계산을 하면서 가중치를 정답에 맞게 업데이트하고 출력이 정답과 ..
2023.01.09 -
XGBOOST Algorithm
저번 글에서부터 이제 앙상블(Emsemble) 기법들에 대해 알아보고 있는데요. 이번 시간에는 Bagging과는 또 다른 방법인 Boosting에 대해서 공부해봤습니다. 먼저 Boosting에 대해 알아봅시다. 1. Boosting Boosting은 약한 학습기를 여러 개 연결하여 강한 학습기를 만드는 앙상블 방법을 말하는데요 앞의 모델을 보완해나가면서 일련의 예측기를 학습시킵니다. 이 Boosting에도 여러 종류가 있는데 먼저 에이다 부스트(Adaptive Boosting)에 대해 알아봅시다 1)Adaptive Boosting(에이다 부스트) 이전 예측기를 보완하는 방법으로는 이전 모델이 과소적합했던 샘플에 가중치를 더 높이는 방법을 사용하고 있습니다. 가중치를 높이게 되면 그 다음 분류기에서 업데이..
2023.01.09 -
RandomForest Algorithm
Decision Tree 예측 공간을 몇 개의 영역으로 계층화(stratifying), 그룹화(segmenting) 특정질문(조건)에 따른 Data들을 분리 조건에 따라 계속 Data들을 분리하면서 분석하기 때문에 매우 간단하고 해석이 용이함 하지만 예측을 위해 다수의 트리를 의사 결정에 활용해야 하고 다른 지도학습의 기법들에 비해 정확도가 떨어지는 경향이 존재합니다. 그래서 대부분의 사람들이 정확도가 많이 떨어지는 점을 개선하기 위하여 앙상블 기법을 많이 사용합니다. 앙상블 기법(Ensemble) :여러 개의 모델을 학습시켜 모델들의 예측결과들을 이용해 하나의 모델보다 더 나은 값을 도출하는 학습 그 중에서도 RandomForest와 관련된 2가지 기법을 살펴보겠습니다. Bagging/Pasting R..
2022.12.21 -
머신러닝 공부를 위한 두 번째 정리
Hands_on 책을 보고 코드를 따라해보면서 공부
2022.12.11 -
머신러닝 공부를 위한 첫 번째 정리
1.머신러닝이란? A.데이터에서부터 학습하도록 컴퓨터를 프로그래밍 하는 기술 2.데이터 마이닝: 대용량의 데이터를 분석하면서 보이지 않던 패턴을 발견하는 일 3.머신러닝 시스템의 종류 A.지도 학습 i.훈련시키는 데이터에 대한 정답을 포함하는 학습 1.분류(ex: 스팸 필터) 2.회귀: Feature(예측 변수)을 이용하여 타깃 수치를 예측 B.비지도 학습 i.훈련시키는 데이터에 대한 정답을 포함하지 않는 학습 1.군집 2.시각화와 차원 축소 3.연관 규칙 학습 4.이상치 탐지 C.준지도 학습 i.일부만 레이블이 있는 경우에 학습 D.강화 학습 i.에이전트가 환경을 관찰 ii.행동 실행 iii.보상 받기 iv.가장 큰 보상을 받기 위한 정책을 학습 E.배치 학습(오프라인 학습) i.시스템을 훈련시키고 더..
2022.12.11