XGBoost

data mining

학부 정리

공개

2025년 6월 14일

회귀

similarity score: \(\frac{(sum of residuals)^2}{∑_{i=1}^{n}(previous probability_i * (1 - previous probability_i)) + λ}\)
leaf value: \(\frac{sum of residuals}{∑_{i=1}^{n}(previous probability_i * (1 - previous probability_i)) + λ}\)
예측값 갱신: log(odds) = \(log \frac{p}{1 - p} + learning rate * leaf value\)
- new probability = \(\frac{e^{log(odds)}}{1 + e^{log(odds)}}\)
잔차는 점점 0에 수렴하고, probability는 실제 값(1, 0)에 수렴한다.
min_child_weight: leaf node의 최소 가중치 합(\(∑_{i=1}^{n} (previous probability * (1 - previous probility\))이 이 값보다 작으면 분할하지 않음