Ensemble Learning
Ensemble Learning, Decision Tree, Bootstrap, Bagging, Boosting
Last updated
Was this helpful?
Ensemble Learning, Decision Tree, Bootstrap, Bagging, Boosting
Last updated
Was this helpful?
์์๋ธ ํ์ต์ ๋์ผํ ํ์ต ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํด์ ์ฌ๋ฌ ๋ชจ๋ธ์ ํ์ตํ ํ ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ์กฐํฉํ๋ ํ์ต ๊ธฐ๋ฒ์ด๋ค. ์์๋ธ ๊ธฐ๋ฒ์ ์ฌ์ฉํ๋ฉด ๊ณผ์ ํฉ์ ๊ฐ์์ํค๊ณ , ๋จ์ผ ๋ชจ๋ธ ๋ณด๋ค ์์ธก ์ ํ๋๋ฅผ ๋์ผ ์ ์๋ค.
๋ชจ๋ธ์ ์์ธก๊ฒฐ๊ณผ์์ ์์ธก๊ฐ๊ณผ ์ค์ ๊ฐ์ด ๋ฉ๋ฆฌ ๋จ์ด์ ธ ์์ผ๋ฉด ๊ฒฐ๊ณผ์ ํธํฅ(bias)์ด ๋๊ณ , ์์ธก๊ฐ๋ค ๋ผ๋ฆฌ ๋ฉ๋ฆฌ ํฉ์ด์ ธ ์์ผ๋ฉด ๋ถ์ฐ(variance)์ด ๋๋ค๊ณ ํ๋ค. ์ด๋ ๋ฏ, ํ์ต ์ค๋ฅ์ ์ฃผ์ ์์ธ์ด ํธํฅ, ๋ถ์ฐ ๋๋ฌธ์ธ๋ฐ ์์๋ธ์ ์ด๋ฌํ ์์๋ฅผ ์ต์ํํ ์ ์๋ค.
์์๋ธ ํ์ต ๊ธฐ๋ฒ์๋ ๋ฐฐ๊น (Bagging)๊ณผ ๋ถ์คํ (Boosting)์ด ์๋ค. ๋จผ์ , ๊ฒฐ์ ํธ๋ฆฌ(Decision Tree)์ ๋ถํธ์คํธ๋ฉ(Bootstrap)์ ๋ํด ์์์ผ ํ๋ค.
๊ฒฐ์ ํธ๋ฆฌ๋ ํธ๋ฆฌ๊ตฌ์กฐ๋ก ๋ฐ์ดํฐ๋ฅผ ๊ฐ ๊ฒฐ์ ๊ท์น์ ๋ฐ๋ผ ๋ถํ ํ๊ณ ์ต์ข ์ ์ผ๋ก ์ด๋ค ๋ฒ์ฃผ์ ํด๋นํ๋์ง ๊ฒฐ์ ํ๋ ๋ฐฉ๋ฒ์ด๋ค.
๋ถํธ์คํธ๋ฉ์ resampling ๋ฐฉ๋ฒ ์ค ํ๋๋ก ๋ชจ์ง๋จ์ ๋ถํฌ๋ฅผ ๋ชจ๋ฅด๊ฑฐ๋ ์ํ์ด ๋ถ์กฑํ ๊ฒฝ์ฐ์ ๋ฐ์ดํฐ๋ฅผ ๋๋ค ์ํ๋ง์ผ๋ก ๋ณต์์ถ์ถํ์ฌ ํ์ต๋ฐ์ดํฐ๋ฅผ ๋๋ฆฌ๋ ๋ฐฉ๋ฒ์ด๋ค. ๋ถํธ์คํธ๋ฉ์ ์ฌ์ฉํ๋ฉด ๋ถํฌ๋ฅผ ๊ณ ๋ฅด๊ฒ ๋ง๋๋ ํจ๊ณผ๊ฐ ์๋ค. ์ฐธ๊ณ ๋ก, ๋ค๋ฅธ resampling ๋ฐฉ๋ฒ์ผ๋ก๋ K-Fold Cross Validation ์ด ์๋ค.
๋ฐฐ๊น ์ ๊ฐ ๋ชจ๋ธ์ด ์๋ก ๋ ๋ฆฝ์ด๊ณ ๋ณ๋ ฌ๋ก ํ์ตํ๋ค. ์ํ์ ์ฌ๋ฌ ๋ฒ ๋ฝ์(Bootstrap) ์ฌ๋ฌ ๊ฐ์ ๋ ๋ฆฝ์ ์ธ ๊ฒฐ์ ํธ๋ฆฌ๊ฐ ์์ธก ๋ชจ๋ธ์ ์์ฑํ ํ, ๊ทธ ๊ฒฐ๊ณผ๋ฌผ์ ์ง๊ณ(Aggregation)ํด ์ต์ข ๋ชจ๋ธ์ ๋ง๋๋ ๋ฐฉ๋ฒ์ด๋ค. ๋ถ๋ฅ ๋ฌธ์ ๋ ํฌํ ๋ฐฉ์(Voting)์ผ๋ก ๊ฒฐ๊ณผ๋ฅผ ์ง๊ณํ๋ฉฐ, ํ๊ท ๋ฌธ์ ๋ ํ๊ท ํน์ ์ค์๊ฐ์ผ๋ก ์ง๊ณํ๋ค. ๋ํ์ ์ธ ๋ฐฐ๊น ๊ธฐ๋ฒ์ ํ์ฉํ ์๊ณ ๋ฆฌ์ฆ์ด Random Forest์ด๋ค.
๋ฐฐ๊น ์ ๋ณ๋ ฌ๋ก ํ์ตํ๊ณ ๋ถ์คํ ์ ์์ฐจ์ ์ผ๋ก ํ์ตํ๋ค. ์ด์ ๋ชจ๋ธ๋ก ์์ธกํ ๊ฒฐ๊ณผ ์ค์ ์๋ชป ๋ถ๋ฅํ ๋ฐ์ดํฐ์ ๊ฐ์ค์น๋ฅผ ๋ฐ์ํด์ ๋ค์ ๋ชจ๋ธ์ ์ ๋ฌํ๋ค. ๋ค์ ๋ชจ๋ธ์ ํ์ตํ ๋ ํด๋น ๋ฐ์ดํฐ์ ๋ ์ง์คํ์ฌ ์๋ก์ด ๋ถ๋ฅ ๊ท์น์ ๋ง๋๋๋ฐ, ์ด ๋จ๊ณ๋ฅผ ๋ฐ๋ณตํ๋ค. ๋ํ์ ์ธ ๋ถ์คํ ์๊ณ ๋ฆฌ์ฆ์ผ๋ก Gradient Boosting ์๊ณ ์ด ์๊ณ ๋ฆฌ์ฆ์ผ๋ก ๋ณ๋ ฌ ํ์ต ๊ฐ๋ฅํ ์๊ณ ๋ฆฌ์ฆ์ด XGBoost์ด๋ค.
Gradient Boosting ์๊ณ ๋ฆฌ์ฆ์ ๋ถ์ฐํ๊ฒฝ์์ ์คํํ ์ ์๋๋ก ๊ตฌํํ ์๊ณ ๋ฆฌ์ฆ์ด๋ค.