open:xgboost

XGBoost (eXtreme Gradient Boosting)

  • Model: 변수(x)로 정답(y)를 예측하는 함수
  • $\theta$: 세타(가중치, 파라미터)
    • 학습을 통해 정답을 잘 예측하도록 조정
  • Objective Function
  • L: Training Loss (Loss Function)
  • $\Omega$: Regularization
    • 모델의 복잡도를 조절 (과적합 방지)

용어와 핵심 개념을 정리하자

  • GBM (Gradient Boosting Machine) : Boosted Tree 여기 링크를 보며 감을 잡자
    Gradient Boosting : 약한 앙상블 예측 문제(ex) decision tree)를 만들고, stage wise하게 boosting을 적용한다.
  • XGBoost는 supervised learning 문제를 해결하는데 사용한다. XGBoost는 Tree를 사용한 앙상블 부스팅 방법이다. CART라 불리는 트리 앙상블 모델을 구축하고 사용한다. (그림도 보고 싶다면 이곳으로 : http://xgboost.readthedocs.io/en/latest/model.html)
  • CART : Classification and Regression Trees
    다양한 기준의 Tree를 구축하고, leaf 데이터의 점수를 통해 모델의 적합성을 체크한다. 이후 Tree Boosting을 이용하여 Tree를 이 문제에 맞도록 최적화한다.
  • open/xgboost.txt
  • 마지막으로 수정됨: 2020/07/15 08:02
  • 저자 127.0.0.1