๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

๋ฐ์ดํ„ฐ์ „์ฒ˜๋ฆฌ

(2)
์ œ 17์žฅ ๐Ÿ“’๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ_ํƒ€์ดํƒ€๋‹‰ ๋ฐ์ดํ„ฐ์…‹ ํ™œ์šฉ-2๐Ÿ“’ ์ „์ฒ˜๋ฆฌ ๊ณผ์ • 1) .isnull( ) ํ•จ์ˆ˜๋ฅผ ์ด์šฉํ•˜๋ฉด ๊ฒฐ์ธก์น˜๋ฅผ ๋‚˜ํƒ€๋‚ด ์ค€๋‹ค. sum( )์„ ์ด์šฉํ•˜์—ฌ ๊ฒฐ์ธก์น˜ ๊ฐœ์ˆ˜๋ฅผ ํ™•์ธ 2) ์ „์ฒด ๋ฐ์ดํ„ฐ ๋Œ€๋น„ ๊ฒฐ์ธก์น˜์˜ ๋น„์ค‘์„ ๊ตฌํ•˜๋ ค๋ฉด = ๊ฒฐ์ธก์น˜ / ์ „์ฒด ๋ฐ์ดํ„ฐ ๊ฐœ์ˆ˜ x 100 โœ… data.drop('ticket', axis=1, inplace=True) or โœ… del data['ticket'] ์ด์šฉํ•˜๊ธฐ 3) ticket ์ปฌ๋Ÿผ์„ ๋ˆ„๋ฝ์‹œํ‚จ csvํŒŒ์ผ์„ ์™ธ๋ถ€๋กœ ๋นผ๋‚ด๊ธฐ to_csv๋ฅผ ํ•  ๊ฒฝ์šฐ๋Š” ์ž๋™์œผ๋กœ csv์— ๋กœ์šฐ๋ช…์„ ๋งค๊ฒจ์ฃผ๊ธฐ ๋•Œ๋ฌธ์— ์ถ”ํ›„ ๋‹ค์‹œ importํ• ๋•Œ Unnamed :0 ์ปฌ๋Ÿผ์ด ๋“ค์–ด์˜ต๋‹ˆ๋‹ค. ์ด๋ฅผ ๋ฐฉ์ง€ํ•˜๊ธฐ ์œ„ํ•ด index=False๋ฅผ ์ค„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๐Ÿ“Œ Cabin ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์œ ๋„๋ณ€์ˆ˜ ์ƒ์„ฑ ๊ฐœ๋ณ„ ๊ฐ์‹ค ๋ฒˆํ˜ธ๋Š” ์˜๋ฏธ๊ฐ€ ์—†์Œ(123, 456 ...) cabin ๋ฐ..
์ œ 15์žฅ ๐Ÿ“’๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ_ํ‘œ์ค€ํ™” ๋“ฑ..๐Ÿ“’ ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ ๋ฐ์ดํ„ฐ ํ˜•์‹์— ๋Œ€ํ•œ ์ฒ˜๋ฆฌ ๊ณต๋ฐฑ ๋ฌธ์ž str.strip() : ์–‘์ชฝ ๊ณต๋ฐฑ ์ œ๊ฑฐ str.lstrip() : ์™ผ์ชฝ ๊ณต๋ฐฑ ์ œ๊ฑฐ str.rstip() : ์˜ค๋ฅธ์ชฝ ๊ณต๋ฐฑ ์ œ๊ฑฐ ๋ฐ์ดํ„ฐ ํƒ€์ž… ๋ถˆ๊ทœ์น™ํ•œ ๋Œ€์†Œ๋ฌธ์ž ๋ถˆ๊ทœ์น™ํ•œ ๊ตฌ๋ถ„ ๊ธฐํ˜ธ ์œ ํšจํ•˜์ง€ ์•Š์€ ๋ฌธ์ž ๋ถˆ๊ทœ์น™ํ•œ ๋‚ ์งœ ๋ฐ ์‹œ๊ฐ„ ํ‘œ๊ธฐ 1. ๋ผ๋ฒจ ํ˜•์‹ ํ†ต์ผ ๋ฐ์ดํ„ฐ์˜ ์ธ์ฝ”๋”ฉ ์ž‘์—…์— ํฌํ•จ 1-1) dictionary ํƒ€์ž…์œผ๋กœ encoding map์„ ์ƒ์„ฑํ•ด์„œ ์ ์šฉ โœ…df = pd.DataFrame({ }) _map = { } 1-2) df ๋ณ€์ˆ˜์˜ ' ' ์ปฌ๋Ÿผ์˜ ๊ฐ’์„ map ํ•จ์ˆ˜๋ฅผ ์ด์šฉํ•ด ๋ณ€ํ™˜ โœ… df[' '].map( ) 1-3) ์ฐพ์•„ ๋ฐ”๊พธ๊ธฐ์ธ replace()๋ฅผ ์จ๋„ ๋ฉ๋‹ˆ๋‹ค. โœ… df[' '] = df[' '].replace([ ๊ธฐ์กด๊ฐ’ ], [ ๋ฐ”๊ฟ€๊ฐ’ ]) 2. ๋ฌธ์ž..