랜덤포리스트1 [ML] 랜덤포레스트(Random Forest) 개념 (배깅, 특성 중요도, 엑스트라트리) 랜덤포레스트, Random Forest : 무작위 숲 -> 여러 의사결정트리(Tree)로 생성된 앙상블 모델(숲) 의사결정트리는 훈련 데이터에 따라 생성되는 모델이 다르고, 과적합 문제가 있다. 이를 해결하기 위한 방안으로 여러 의사결정트리를 구성해 평균(회귀) 또는 최빈값(분류)을 통해 학습하는 앙상블 모델 배깅(bagging) = 중복을 허용한 샘플링 랜덤포레스트는 배깅에 의사결정트리를 넣은 모델 -> 랜덤포레스트 모델이 최적화 되어있어 더 편리하다. 랜덤포레스트는 의사결정트리와 배깅 분류 매개변수를 모두 갖고 있음. 랜덤포레스트는 훈련 데이터를 샘플링하고 모든 특성에 대해 정보이득을 계산해 가장 높은 특성을 split 노드로 선택해 가장 최선의 특성을 선정 -> 특성 중요도를 파악하기 쉽다. / 연.. 2022. 11. 29. 이전 1 다음