ํ๋ฃจ๊ณต๋ถ (37) ์ธ๋ค์ผํ ๋ฆฌ์คํธํ ์ 26์ฅ ๐JAVAโ ๊ธฐ์ด ๋ค๋ฃจ๊ธฐ๐ ์๋ฐ์คํ์ ์ดํด๋ฆฝ์ค ๋ค์ด๋ก๋ ๋ฐ๊ธฐ https://www.eclipse.org/downloads/ Eclipse Downloads | The Eclipse Foundation The Eclipse Foundation - home to a global community, the Eclipse IDE, Jakarta EE and over 415 open source projects, including runtimes, tools and frameworks. www.eclipse.org โ์๋ฐ?? JAVA๋ ๋ฌด์์ผ๊น?? ํ๋ก๊ทธ๋๋ฐ ์ธ์ด๋ ๊ธฐ๊ณ์ด, ์ด์ ๋ธ๋ฆฌ์ด, ๊ณ ๊ธ์ธ์ด๋ก ๋๋์๊ฐ ์๋๋ฐ ๊ทธ์ค ๊ณ ๊ธ์ธ์ด์ ์ํ๋ค ๋๋ฃ๋ก๋ Pascal, Basic, C/C++, C# ๋ฑ์ด ์๊ฒ ๋ค. ์๋ฐ๋ฅผ ์ฌ์ฉํ๋ ์ด์ ๋ ์ปดํจํฐ๊ฐ ์์ค.. ์ 24์ฅ๐ML_LightGBM๐ lightGBM(Gradient Boosting Model)์ ๋ฌด์์ด๋? ๋จธ์ ๋ฌ๋์ ์์๋ธ ๊ธฐ๋ฒ์๋ ๋ฐฐ๊น (bagging)๊ณผ ๋ถ์คํ (boosting)์ด ์์ต๋๋ค ๋ถ์คํ ๊ธฐ๋ฒ์ ํด๋นํ๋ ๊ฒ์ด XGBoost์ธ๋ฐ ๋์ ์ฑ๋ฅ์ ๊ฐ์ง์ง๋ง ๊ทธ๋ฆฌ๋ ์์น๋ฅผ ์ด์ฉํ์ฌ ํ์ดํผ ํ๋ผ๋ฏธํฐ ํ๋์ ํ๋๋ฐ ๋ง์ ์๊ฐ๊ณผ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ์๋ชจํ๊ฒ ๋ฉ๋๋ค. ๊ทธ ์ ์ ๋ณด์ํ ๊ฒ์ด lightGBM์ด๋ผ๊ณ ์๊ฐํ๋ฉด ๋ฉ๋๋ค ๋น ๋ฅธ ์๊ฐ๊ณผ ์ ์ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ์๋ชจํ๊ฒ ๋ฉ๋๋ค. ์๋ฆฌ๋ ๋ฐ์ ์ฌ์ง์ ํตํด ์ค๋ช ๋๋ฆด๊ฒ์ lightGBM์ ๊ธฐ์กด์ boosting ์๊ณ ๋ฆฌ์ฆ๊ณผ๋ ๋ค๋ฅด๊ฒ ์๋ํฉ๋๋ค ๊ธฐ์กด boosting ๋ชจ๋ธ๋ค์ Level-wise ํ๊ฒ ๋์ด๋๋ ๋ฐฉ๋ฒ์ ์ฌ์ฉํ๋ ๋ฐฉ๋ฉด์ lightGBM ๊ฐ์ ๊ฒฝ์ฐ์๋ Leaf-wiseํํ๋ก ๋์ด๋ฉ๋๋ค. level wise = ํธ.. ์ 23์ฅ๐ML_๋ก์ง์คํฑ ํ๊ท(Logistic Regression)๐ ๐๋ก์ง์คํฑ ํ๊ท๋?? ๋ก์ง์คํฑ ํ๊ท(Logistic Regression)๋ ๋ฐ์ดํฐ๊ฐ ์ด๋ค ๋ฒ์ฃผ์ ์ํ ํ๋ฅ ์ 0~1 ์ฌ์ด์ ๊ฐ์ผ๋ก ์์ธกํ๊ณ ๊ทธ ํ๋ฅ ์ ๋ฐ๋ผ ๊ฐ๋ฅ์ฑ์ด ๋ ๋์ ๋ฒ์ฃผ์ ์ํ๋ ๊ฒ์ผ๋ก ๋ถ๋ฅํด์ฃผ๋ ์ง๋ ํ์ต ์๊ณ ๋ฆฌ์ฆ์ด๋ค. ์ ํ ํ๊ท๋ฅผ ์ดํดํ๋ค๋ฉด ๊ฐ์ฅ ์ดํดํ๊ธฐ ์ฌ์ด ๊ฐ๋ ์ด๋ค ์ ํํ๊ท - ๋ก์ง์คํฑํ๊ท ์์ผ๋ก ํ์ต์ ํ๋๊ฒ ํจ์จ์ ์ด๋ค 2๊ฐ์ ๊ทธ๋ฃน,๋ฒ์ฃผ์ค์ ํ๋์ ์ํ๋ค๊ณ ๊ฒฐ์ ์ง๋๊ฒ์ 2์ง๋ถ๋ฅ ๋ผ๊ณ ํ๋ค. ๋ํ์ ์ธ ์์๋ก ์ฑ๋ณ, ์ฑ๊ณต ์ฌ๋ถ, ํฉ๊ฒฉ/๋ถํฉ๊ฒฉ, ์์ฑ/์์ฑ ๋ฑ์ด ์๋ค. https://kmbeach.tistory.com/36 ์ 22์ฅ๐ML_์ ํํ๊ท(Linear Regression)๐ ๐ค ์ ํ ํ๊ท๋ ๋ฌด์์ธ๊ฐ? โถ ๋ ๋ฆฝ๋ณ์์ ์ข ์๋ณ์ ๊ฐ์ ์ง์ ์์ ํํ๊ฐ ์์์(์ ํ๊ด๊ณ๋ผ๊ณ ํจ) ๊ฐ์ ํ์ฌ ์ต์ ์ .. ์ 22์ฅ๐ML_์ ํํ๊ท(Linear Regression)๐ ๐ค ์ ํ ํ๊ท๋ ๋ฌด์์ธ๊ฐ? โถ ๋ ๋ฆฝ๋ณ์์ ์ข ์๋ณ์ ๊ฐ์ ์ง์ ์์ ํํ๊ฐ ์์์(์ ํ๊ด๊ณ๋ผ๊ณ ํจ) ๊ฐ์ ํ์ฌ ์ต์ ์ ์ ์ ๊ทธ์ด ์์ธก์ ํ๊ธฐ ์ํ ๋ฐฉ๋ฒ โถ ๋จธ์ ๋ฌ๋์์๋ Loss(์์ค) ์ ์ต์ํํ๋ ์ ์ ์ฐพ์์ ๋ชจ๋ธ์ ๋ง๋ค์ด๋ธ๋ค โถ ์์์ ๋์ถํ๊ธฐ ์ฌ์์ผ๋ก ํด์์ด ๋งค์ฐ ์ง๊ด์ ์ธ๊ฒ์ด ํน์ง์ด๋ค. ์์) ๊ท๋๋ผ๋ฏธ๋ ๋์ธ๋ ๋ ๋ง์ด ์ด๋ค. ๐ธ Loss(์์ค) ์ค์ฌ๋ณด๊ธฐ ์ ๊ทธ๋ํ๋ฅผ ๋ณด๋ฉด ์ต๋ 4๊ฑฐ๋ฆฌ ๋งํผ์ Loss๊ฐ ๋๋๋ฐ ์ด๋ฅผ ์ต์ํ ํ๊ธฐ ์ํด ๊ฒฝ์ฌํ๊ฐ๋ฒ์ ์ฌ์ฉํ๋๋ฐ ์ด๋ฌํ ์์์ MSE(Mean Square Error) "ํ๊ท ์ ๊ณฑ ์ค์ฐจ" ๋ผ๊ณ ํ๋ค ๋ ๋ ์ ๋ฐํ ๊ฐ์ ๋ฝ๊ธฐ ์ํด์ MSE ์ ์ฒด์ ๋ฃจํธ๋ฅผ ์์ด RMSE(๋ฒกํฐ์ ๊ฑฐ๋ฆฌ๋ฅผ ๊ตฌํ๋ ๊ฐ๋ )๋ฅผ ์ฌ์ฉํ๊ธฐ๋ ํ๋ค. ๋ณดํธ์ ์ผ๋ก๋ ๊ฐํธํ MSE๋ฅผ ์ฌ์ฉํ๋ค. ๐ก ํต์ฌ,.. ๐ฉ์ฌ๋ฏธ๋ก ์ฌ๋ฆฌ๋ ์์ด๋ณด Data Analysis(๋ฐ์ดํฐ ๋ถ์) ์ฌ์ด ์์ ๊ฑฐ๋ํ ์ธํฐ๋ท์ ์นํ์ด์ง ๊ณต๊ฐ = ๋ฐ๋ค ์ฒ๋ผ ๊ดํ ํ ๊ณต๊ฐ์ด๋ผ ์๋ฅผ ๋ค๊ฒ ์ต๋๋ค. crowling = ๋ฐ์ดํฐ๋ฅผ ์ถ์ถํ๋ ์์ => Fishing(๋์) ๋ฌผ๊ณ ๊ธฐ = ๋ฐ์ดํฐ : ๋ผ๊ณ ์๊ฐํด๋ด ๋๋ค. ๋ ๊ฒ์ ์์ or ๋ฌด์์ธ๊ฐ๋ฅผ ํ๋ํ๋ค๋ฉด ์ฌ์ฉ,ํน์ ๋จน๊ธฐ ์ํด ๊ฐ๊ณต์ ํด์ผํฉ๋๋ค. ์ถ์ถํ ๋ ๊ฒ์ ๋ฐ์ดํฐ(Data) ๋ ๊ฒ์ ๋ฐ์ดํฐ๋ฅผ ์์ง(๊ฐ๊ณต) ํ๋ ๊ณผ์ ์ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ(preprocessing) ๊ฐ๊ณต๋(์์ง๋) ๋ฐ์ดํฐ๋ฅผ ์์๊ฒ Decoration ํ๋๊ฒ data visualization(๋ฐ์ดํฐ ์๊ฐํ) ์ด๋ ๊ฒ ์๋ฅผ๋ค์ด ๋ณด๋ฉด ๋งค์ฐ ์ฝ์ต๋๋ค. ๊ฐ์ธ์ ์ธ ์๊ฐ์ ๋๋ค ์ 21์ฅ๐ML_RandomForest๐ ๐ฒ ์ ์ (RandomForest) ๊ฒฐ์ ํธ๋ฆฌ์ ๋จ์ ์(์ค๋ฒํผํ ) ๋ณด์์์ผ์ค ์์ ๋ชจ๋ธ ๋๋ค์ผ๋ก ์์ฑํ ๋ง์ ๋๋ฌด๋ก ์ด๋ฃจ์ด์ ธ ์์ธก์ ํ๊ธฐ ๋๋ฌธ์ ๋ง์น ์ฒ์ฒ๋ผ ๋ณด์ด๊ธฐ ๋๋ฌธ์ ์ด๋ฆ์ด Random Forest๋ผ๊ณ ๋ถ๋ฆฐ๋ค. ๐ฏ ํต์ฌ โป ์์๋ธ ๊ธฐ๋ฒ ๊ฐ๋ ฅํ ํ๋์ ๋ชจ๋ธ์ ์ฌ์ฉํ๋ ๋์ ๋ณด๋ค ์ฝํ ๋ชจ๋ธ ์ฌ๋ฌ ๊ฐ๋ฅผ ์กฐํฉํ์ฌ ๋ ์ ํํ ์์ธก์ ๋์์ ์ฃผ๋ ๋ฐฉ์ ๋๋ค ํฌ๋ ์คํธ๋ ์์๋ธ ๊ธฐ๋ฒ์ ์ฌ์ฉํ ํธ๋ฆฌ ๋ชจ๋ธ ์ค ํ๋์ด๋ฉฐ ๊ฐ์ฅ ๋ง์ ๋น์ค์ ์ฐจ์งํ๋ค ๋ถ์คํ ๋ชจ๋ธ๋ณด๋ค๋ ์๋, ์์ธก๋ ฅ ๋ฉด์์๋ ๋ชป ๋ฏธ์น์ง๋ง ์๊ฐํ๊ฐ ๋งค์ฐ ๋ฐ์ด๋ ๋จผ์ ์ดํด๋๋ฅผ ํค์์ผ ํ๋ค. ์ข ์๋ณ์๊ฐ ์ฐ์ํ/๋ฒ์ฃผํ ๋ฐ์ดํฐ์ธ ๊ฒฝ์ฐ์๋ ๋ชจ๋ ์ฌ์ฉ ๊ฐ๋ฅํ๋ค. ์์๋ผ์ด์ด(์ด์์น)๊ฐ ๋ฌธ์ ๋ ์ ์ข์ ๋์์ด ๋๋ ๋ชจ๋ธ์ด๋ค. ๊ฒฐ์ ํธ๋ฆฌ๋ก ์ค๋ฒ ํผํ ์ด ์ผ์ด ๋ ์จ ์ฌ์ฉํ๋ฉด .. ์ 20์ฅ๐ML_๊ฒฐ์ ํธ๋ฆฌ(Decision Tree)๐ ๊ฒฐ์ ํธ๋ฆฌ(Decision Tree)โโโ • ๊ด์ธก๊ฐ๊ณผ ๋ชฉํฏ๊ฐ์ ์ฐ๊ฒฐ์์ผ์ฃผ๋ ์์ธก ๋ชจ๋ธ, ๋๋ฌด ๋ชจ์์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฅํจ • ์๋ง์ ํธ๋ฆฌ ๊ธฐ๋ฐ ๋ชจ๋ธ์ ๊ธฐ๋ณธ ๋ชจ๋ธ(based model)์ด ๋๋ ์ค์ ๋ชจ๋ธ • VS ์ ํ ๋ชจ๋ธ : ์ ํ ๋ชจ๋ธ์ด ๊ฐ ๋ณ์์ ๋ํ ๊ธฐ์ธ๊ธฐ ๊ฐ๋ค์ ์ต์ ํํ์ฌ ๋ชจ๋ธ์ ๋ง๋ค์ด ๋๊ฐ๋ค๋ฉด, ํธ๋ฆฌ ๋ชจ๋ธ์์๋ ๊ฐ ๋ณ์์ ํน์ ์ง์ ์ ๊ธฐ์ค์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฅ ํด๊ฐ๋ฉฐ ์์ธก ๋ชจ๋ธ์ ๋ง๋ฆ - ์ข ์๋ณ์๊ฐ ์ฐ์ํ ๋ฐ์ดํฐ์ ๋ฒ์ฃผํ ๋ฐ์ดํฐ ๋ชจ๋์ ์ฌ์ฉํ ์ ์์ - ๋ชจ๋ธ๋ง ๊ฒฐ๊ณผ๋ฅผ ์๊ฐํํ ๋ชฉ์ ์ผ๋ก ๊ฐ์ฅ ์ ์ฉ - ์์๋ผ์ด์ด๊ฐ ๋ฌธ์ ๋ ์ ๋๋ก ๋ง์ ๋ ์ ํ ๋ชจ๋ธ๋ณด๋ค ์ข์ ๋์์ด ๋ ์ ์๋ค. - ๋ฐ์ดํฐ๋ฅผ ๋ฌด์ํ๊ฒ ์ชผ๊ฐ์ด ๋๊ฐ๊ณ , ๊ฐ ๊ทธ๋ฃน์ ๋ํ ์์ธก์น๋ฅผ ๋ง๋ค์ด๋ด๋ ๋ฐฉ์ ex) ๋จ์/์ฌ์๋ก ๋๋ ์ ๊ฐ ๋ชฉํฏ๊ฐ, ํ๊ท ์น๋ฅผ.. ์ 19์ฅ๐ML_Naive Bayes๐ ๋์ด๋ธ ๋ฒ ์ด์ฆ(Naive Bayes) ๋ฒ ์ด์ฆ ์ ๋ฆฌ๋ฅผ ์ ์ฉํ ์กฐ๊ฑด๋ถ ํ๋ฅ ๊ธฐ๋ฐ์ ๋ถ๋ฅ ๋ชจ๋ธ ์กฐ๊ฑด๋ถ ํ๋ฅ : X๊ฐ ์ผ์ด๋ฌ์ ๋ Y๊ฐ ์ผ์ด๋ ํ๋ฅ ์ ์๋ฏธ ex) '๋ฌด๋ฃ'๋ผ๋ ๋จ์ด๊ฐ ๋ค์ด ์์ ๋ ํด๋น ๋ฉ์ผ์ด ์คํธ์ ํ๋ฅ ์คํธ ํํฐ๋ง์ ์ํ ๋ํ์ ์ธ ๋ชจ๋ธ ๋ฒ์ฉ์ฑ์ด ๋์ง๋ ์์ง๋ง ๋ ๋ฆฝ๋ณ์๋ค์ด ๋ชจ๋ ๋ ๋ฆฝ์ ์ด๋ผ๋ฉด ์ ์๋ฏธํ๋ค. ๋ฅ๋ฌ๋์ ์ ์ธํ๊ณ ์์ฐ์ด ์ฒ๋ฆฌ์ ๊ฐ์ฅ ์ ํฉํ ์๊ณ ๋ฆฌ์ฆ ๊ฐ ๋ ๋ฆฝ๋ณ์๋ค์ด ๋ชจ๋ ๋ ๋ฆฝ์ ์ด๊ณ ๊ทธ ์ค์๋๊ฐ ๋น์ทํ ๋ ์ ์ฉํจ ์์ฐ์ด ์ฒ๋ฆฌ(NLP)์์ ๊ฐ๋จํ์ง๋ง ์ข์ ์ฑ๋ฅ์ ๋ณด์ฌ์ค ๋ฒ์ฃผ ํํ์ ๋ณ์๊ฐ ๋ง์ ๋ ์ ํฉํ๋ฉฐ, ์ซ์ํ ๋ณ์๊ฐ ๋ง์ ๋๋ ์ ํฉํ์ง ์์ โ ์ฅ์ ๋น๊ต์ ๊ฐ๋จํ ์๊ณ ๋ฆฌ์ฆ์ ์ํ๋ฉฐ ์๋ ๋ํ ๋น ๋ฆ ์์ ํ๋ จ์ ์ผ๋ก๋ ์ ์์ธกํ๋ค. ๐ ๋จ์ ๋ชจ๋ ๋ ๋ฆฝ๋ณ์๊ฐ ๊ฐ๊ฐ ๋ ๋ฆฝ์ ์์ ์ ์ ๋ ๋ฆฝ๋ณ์๋ค์ด.. ์ด์ 1 2 3 4 5 ๋ค์