๋จธ์ ๋ฌ๋ (5) ์ธ๋ค์ผํ ๋ฆฌ์คํธํ ์ 24์ฅ๐ML_LightGBM๐ lightGBM(Gradient Boosting Model)์ ๋ฌด์์ด๋? ๋จธ์ ๋ฌ๋์ ์์๋ธ ๊ธฐ๋ฒ์๋ ๋ฐฐ๊น (bagging)๊ณผ ๋ถ์คํ (boosting)์ด ์์ต๋๋ค ๋ถ์คํ ๊ธฐ๋ฒ์ ํด๋นํ๋ ๊ฒ์ด XGBoost์ธ๋ฐ ๋์ ์ฑ๋ฅ์ ๊ฐ์ง์ง๋ง ๊ทธ๋ฆฌ๋ ์์น๋ฅผ ์ด์ฉํ์ฌ ํ์ดํผ ํ๋ผ๋ฏธํฐ ํ๋์ ํ๋๋ฐ ๋ง์ ์๊ฐ๊ณผ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ์๋ชจํ๊ฒ ๋ฉ๋๋ค. ๊ทธ ์ ์ ๋ณด์ํ ๊ฒ์ด lightGBM์ด๋ผ๊ณ ์๊ฐํ๋ฉด ๋ฉ๋๋ค ๋น ๋ฅธ ์๊ฐ๊ณผ ์ ์ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ์๋ชจํ๊ฒ ๋ฉ๋๋ค. ์๋ฆฌ๋ ๋ฐ์ ์ฌ์ง์ ํตํด ์ค๋ช ๋๋ฆด๊ฒ์ lightGBM์ ๊ธฐ์กด์ boosting ์๊ณ ๋ฆฌ์ฆ๊ณผ๋ ๋ค๋ฅด๊ฒ ์๋ํฉ๋๋ค ๊ธฐ์กด boosting ๋ชจ๋ธ๋ค์ Level-wise ํ๊ฒ ๋์ด๋๋ ๋ฐฉ๋ฒ์ ์ฌ์ฉํ๋ ๋ฐฉ๋ฉด์ lightGBM ๊ฐ์ ๊ฒฝ์ฐ์๋ Leaf-wiseํํ๋ก ๋์ด๋ฉ๋๋ค. level wise = ํธ.. ์ 21์ฅ๐ML_RandomForest๐ ๐ฒ ์ ์ (RandomForest) ๊ฒฐ์ ํธ๋ฆฌ์ ๋จ์ ์(์ค๋ฒํผํ ) ๋ณด์์์ผ์ค ์์ ๋ชจ๋ธ ๋๋ค์ผ๋ก ์์ฑํ ๋ง์ ๋๋ฌด๋ก ์ด๋ฃจ์ด์ ธ ์์ธก์ ํ๊ธฐ ๋๋ฌธ์ ๋ง์น ์ฒ์ฒ๋ผ ๋ณด์ด๊ธฐ ๋๋ฌธ์ ์ด๋ฆ์ด Random Forest๋ผ๊ณ ๋ถ๋ฆฐ๋ค. ๐ฏ ํต์ฌ โป ์์๋ธ ๊ธฐ๋ฒ ๊ฐ๋ ฅํ ํ๋์ ๋ชจ๋ธ์ ์ฌ์ฉํ๋ ๋์ ๋ณด๋ค ์ฝํ ๋ชจ๋ธ ์ฌ๋ฌ ๊ฐ๋ฅผ ์กฐํฉํ์ฌ ๋ ์ ํํ ์์ธก์ ๋์์ ์ฃผ๋ ๋ฐฉ์ ๋๋ค ํฌ๋ ์คํธ๋ ์์๋ธ ๊ธฐ๋ฒ์ ์ฌ์ฉํ ํธ๋ฆฌ ๋ชจ๋ธ ์ค ํ๋์ด๋ฉฐ ๊ฐ์ฅ ๋ง์ ๋น์ค์ ์ฐจ์งํ๋ค ๋ถ์คํ ๋ชจ๋ธ๋ณด๋ค๋ ์๋, ์์ธก๋ ฅ ๋ฉด์์๋ ๋ชป ๋ฏธ์น์ง๋ง ์๊ฐํ๊ฐ ๋งค์ฐ ๋ฐ์ด๋ ๋จผ์ ์ดํด๋๋ฅผ ํค์์ผ ํ๋ค. ์ข ์๋ณ์๊ฐ ์ฐ์ํ/๋ฒ์ฃผํ ๋ฐ์ดํฐ์ธ ๊ฒฝ์ฐ์๋ ๋ชจ๋ ์ฌ์ฉ ๊ฐ๋ฅํ๋ค. ์์๋ผ์ด์ด(์ด์์น)๊ฐ ๋ฌธ์ ๋ ์ ์ข์ ๋์์ด ๋๋ ๋ชจ๋ธ์ด๋ค. ๊ฒฐ์ ํธ๋ฆฌ๋ก ์ค๋ฒ ํผํ ์ด ์ผ์ด ๋ ์จ ์ฌ์ฉํ๋ฉด .. ์ 20์ฅ๐ML_๊ฒฐ์ ํธ๋ฆฌ(Decision Tree)๐ ๊ฒฐ์ ํธ๋ฆฌ(Decision Tree)โโโ • ๊ด์ธก๊ฐ๊ณผ ๋ชฉํฏ๊ฐ์ ์ฐ๊ฒฐ์์ผ์ฃผ๋ ์์ธก ๋ชจ๋ธ, ๋๋ฌด ๋ชจ์์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฅํจ • ์๋ง์ ํธ๋ฆฌ ๊ธฐ๋ฐ ๋ชจ๋ธ์ ๊ธฐ๋ณธ ๋ชจ๋ธ(based model)์ด ๋๋ ์ค์ ๋ชจ๋ธ • VS ์ ํ ๋ชจ๋ธ : ์ ํ ๋ชจ๋ธ์ด ๊ฐ ๋ณ์์ ๋ํ ๊ธฐ์ธ๊ธฐ ๊ฐ๋ค์ ์ต์ ํํ์ฌ ๋ชจ๋ธ์ ๋ง๋ค์ด ๋๊ฐ๋ค๋ฉด, ํธ๋ฆฌ ๋ชจ๋ธ์์๋ ๊ฐ ๋ณ์์ ํน์ ์ง์ ์ ๊ธฐ์ค์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฅ ํด๊ฐ๋ฉฐ ์์ธก ๋ชจ๋ธ์ ๋ง๋ฆ - ์ข ์๋ณ์๊ฐ ์ฐ์ํ ๋ฐ์ดํฐ์ ๋ฒ์ฃผํ ๋ฐ์ดํฐ ๋ชจ๋์ ์ฌ์ฉํ ์ ์์ - ๋ชจ๋ธ๋ง ๊ฒฐ๊ณผ๋ฅผ ์๊ฐํํ ๋ชฉ์ ์ผ๋ก ๊ฐ์ฅ ์ ์ฉ - ์์๋ผ์ด์ด๊ฐ ๋ฌธ์ ๋ ์ ๋๋ก ๋ง์ ๋ ์ ํ ๋ชจ๋ธ๋ณด๋ค ์ข์ ๋์์ด ๋ ์ ์๋ค. - ๋ฐ์ดํฐ๋ฅผ ๋ฌด์ํ๊ฒ ์ชผ๊ฐ์ด ๋๊ฐ๊ณ , ๊ฐ ๊ทธ๋ฃน์ ๋ํ ์์ธก์น๋ฅผ ๋ง๋ค์ด๋ด๋ ๋ฐฉ์ ex) ๋จ์/์ฌ์๋ก ๋๋ ์ ๊ฐ ๋ชฉํฏ๊ฐ, ํ๊ท ์น๋ฅผ.. ์ 19์ฅ๐ML_Naive Bayes๐ ๋์ด๋ธ ๋ฒ ์ด์ฆ(Naive Bayes) ๋ฒ ์ด์ฆ ์ ๋ฆฌ๋ฅผ ์ ์ฉํ ์กฐ๊ฑด๋ถ ํ๋ฅ ๊ธฐ๋ฐ์ ๋ถ๋ฅ ๋ชจ๋ธ ์กฐ๊ฑด๋ถ ํ๋ฅ : X๊ฐ ์ผ์ด๋ฌ์ ๋ Y๊ฐ ์ผ์ด๋ ํ๋ฅ ์ ์๋ฏธ ex) '๋ฌด๋ฃ'๋ผ๋ ๋จ์ด๊ฐ ๋ค์ด ์์ ๋ ํด๋น ๋ฉ์ผ์ด ์คํธ์ ํ๋ฅ ์คํธ ํํฐ๋ง์ ์ํ ๋ํ์ ์ธ ๋ชจ๋ธ ๋ฒ์ฉ์ฑ์ด ๋์ง๋ ์์ง๋ง ๋ ๋ฆฝ๋ณ์๋ค์ด ๋ชจ๋ ๋ ๋ฆฝ์ ์ด๋ผ๋ฉด ์ ์๋ฏธํ๋ค. ๋ฅ๋ฌ๋์ ์ ์ธํ๊ณ ์์ฐ์ด ์ฒ๋ฆฌ์ ๊ฐ์ฅ ์ ํฉํ ์๊ณ ๋ฆฌ์ฆ ๊ฐ ๋ ๋ฆฝ๋ณ์๋ค์ด ๋ชจ๋ ๋ ๋ฆฝ์ ์ด๊ณ ๊ทธ ์ค์๋๊ฐ ๋น์ทํ ๋ ์ ์ฉํจ ์์ฐ์ด ์ฒ๋ฆฌ(NLP)์์ ๊ฐ๋จํ์ง๋ง ์ข์ ์ฑ๋ฅ์ ๋ณด์ฌ์ค ๋ฒ์ฃผ ํํ์ ๋ณ์๊ฐ ๋ง์ ๋ ์ ํฉํ๋ฉฐ, ์ซ์ํ ๋ณ์๊ฐ ๋ง์ ๋๋ ์ ํฉํ์ง ์์ โ ์ฅ์ ๋น๊ต์ ๊ฐ๋จํ ์๊ณ ๋ฆฌ์ฆ์ ์ํ๋ฉฐ ์๋ ๋ํ ๋น ๋ฆ ์์ ํ๋ จ์ ์ผ๋ก๋ ์ ์์ธกํ๋ค. ๐ ๋จ์ ๋ชจ๋ ๋ ๋ฆฝ๋ณ์๊ฐ ๊ฐ๊ฐ ๋ ๋ฆฝ์ ์์ ์ ์ ๋ ๋ฆฝ๋ณ์๋ค์ด.. ์ 18์ฅ๐Machine Learning_ML๐ 1. ๋จธ์ ๋ฌ๋์ด๋ ๋ฌด์์ผ๊น ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ์ตํ์ฌ ๋ฌด์์ธ๊ฐ ์์ธกํ๊ฑฐ๋, ๋ฐ์ดํฐ ์์ฒด์ ์ด๋ค ํน์ฑ์ ์ฐพ์๋ด๋ ํ๋ก๊ทธ๋จ์ด๋ค ๋จธ์ ๋ฌ๋? ์ธ๊ณต์ง๋ฅ? ๋ฅ๋ฌ๋? ์ธ๊ณต์ง๋ฅ์ ์ธ๊ฐ์ ๋๋ฅผ ๋ชจ๋ฐฉํ๋ ๋ชจ๋ ํ๋ก๊ทธ๋จ์ ๋ปํ๊ณ ๋ฅ๋ฌ๋์ ์ฃผ๋ก ์ด๋ฏธ์ง, ๋น๋์ค, ์์ฐ์ด๋ฅผ ๋ถ์ํ๋๋ฐ ์ฐ์ธ๋ค . ๋จธ์ ๋ฌ๋์ ๊ณผ์ - ์ํ๋ฐ์ดํฐ + ์ ๋ต๊ฐ => X => ๋ชจ๋ธ => ๋ชจ๋ธ+์๋ก์ด ๋ฐ์ดํฐ => ๊ฒฐ๊ณผ ์ฌ๊ธฐ์ ๋ชจ๋ธ์ด๋ - ๋จธ์ ๋ฌ๋์๊ณ ๋ฆฌ์ฆ์์ํด ํ์ต๋๊ฒฐ๊ณผ๋ฅผ์ ์ฅํ๊ณ ์๋ ๊ฒฐ๊ณผ๋ฌผ ์ฃผ์ด์ง๋ฐ์ดํฐ์ ์๋ํด ํ๋ จ์ ์งํํด ์ป์(์์ธก์์ฌ์ฉํ ) ๊ท์น๊ณผํจํด๋ฑ์์ง๋๊ณ ์๋ค 2. ๋จธ์ ๋ฌ๋ ๊ธฐ๋ฒ 2-1) ์ง๋ํ์ต(supervisedlearning) โ ์ ๋ ฅ๊ฐ๊ณผ ๊ทธ์๋ํ์ ๋ต์ ์ฌ์ฉํด์ด๋์๊ด๊ณ๋ฅผ๋ถ์ํ๊ณ ์์ธก๋ชจ๋ธ์์์ฑ - ์)์๋์ฐจ์ํน์ฑ๊ณผ๊ฐ๊ฒฉ์ ๋ ฅ→ ์ค๊ณ ์ฐจ๊ฐ๊ฒฉ์์์ธก โ ํ๊ท๋ฌธ์ .. ์ด์ 1 ๋ค์