๋ฐ์ดํฐ์ ์ฒ๋ฆฌ (2) ์ธ๋ค์ผํ ๋ฆฌ์คํธํ ์ 17์ฅ ๐๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ_ํ์ดํ๋ ๋ฐ์ดํฐ์ ํ์ฉ-2๐ ์ ์ฒ๋ฆฌ ๊ณผ์ 1) .isnull( ) ํจ์๋ฅผ ์ด์ฉํ๋ฉด ๊ฒฐ์ธก์น๋ฅผ ๋ํ๋ด ์ค๋ค. sum( )์ ์ด์ฉํ์ฌ ๊ฒฐ์ธก์น ๊ฐ์๋ฅผ ํ์ธ 2) ์ ์ฒด ๋ฐ์ดํฐ ๋๋น ๊ฒฐ์ธก์น์ ๋น์ค์ ๊ตฌํ๋ ค๋ฉด = ๊ฒฐ์ธก์น / ์ ์ฒด ๋ฐ์ดํฐ ๊ฐ์ x 100 โ data.drop('ticket', axis=1, inplace=True) or โ del data['ticket'] ์ด์ฉํ๊ธฐ 3) ticket ์ปฌ๋ผ์ ๋๋ฝ์ํจ csvํ์ผ์ ์ธ๋ถ๋ก ๋นผ๋ด๊ธฐ to_csv๋ฅผ ํ ๊ฒฝ์ฐ๋ ์๋์ผ๋ก csv์ ๋ก์ฐ๋ช ์ ๋งค๊ฒจ์ฃผ๊ธฐ ๋๋ฌธ์ ์ถํ ๋ค์ importํ ๋ Unnamed :0 ์ปฌ๋ผ์ด ๋ค์ด์ต๋๋ค. ์ด๋ฅผ ๋ฐฉ์งํ๊ธฐ ์ํด index=False๋ฅผ ์ค ์ ์์ต๋๋ค. ๐ Cabin ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ์ฌ ์ ๋๋ณ์ ์์ฑ ๊ฐ๋ณ ๊ฐ์ค ๋ฒํธ๋ ์๋ฏธ๊ฐ ์์(123, 456 ...) cabin ๋ฐ.. ์ 15์ฅ ๐๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ_ํ์คํ ๋ฑ..๐ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ๋ฐ์ดํฐ ํ์์ ๋ํ ์ฒ๋ฆฌ ๊ณต๋ฐฑ ๋ฌธ์ str.strip() : ์์ชฝ ๊ณต๋ฐฑ ์ ๊ฑฐ str.lstrip() : ์ผ์ชฝ ๊ณต๋ฐฑ ์ ๊ฑฐ str.rstip() : ์ค๋ฅธ์ชฝ ๊ณต๋ฐฑ ์ ๊ฑฐ ๋ฐ์ดํฐ ํ์ ๋ถ๊ท์นํ ๋์๋ฌธ์ ๋ถ๊ท์นํ ๊ตฌ๋ถ ๊ธฐํธ ์ ํจํ์ง ์์ ๋ฌธ์ ๋ถ๊ท์นํ ๋ ์ง ๋ฐ ์๊ฐ ํ๊ธฐ 1. ๋ผ๋ฒจ ํ์ ํต์ผ ๋ฐ์ดํฐ์ ์ธ์ฝ๋ฉ ์์ ์ ํฌํจ 1-1) dictionary ํ์ ์ผ๋ก encoding map์ ์์ฑํด์ ์ ์ฉ โ df = pd.DataFrame({ }) _map = { } 1-2) df ๋ณ์์ ' ' ์ปฌ๋ผ์ ๊ฐ์ map ํจ์๋ฅผ ์ด์ฉํด ๋ณํ โ df[' '].map( ) 1-3) ์ฐพ์ ๋ฐ๊พธ๊ธฐ์ธ replace()๋ฅผ ์จ๋ ๋ฉ๋๋ค. โ df[' '] = df[' '].replace([ ๊ธฐ์กด๊ฐ ], [ ๋ฐ๊ฟ๊ฐ ]) 2. ๋ฌธ์.. ์ด์ 1 ๋ค์