๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

pandas

(2)
์ œ 13์žฅ ๐Ÿ“’๋ฐ์ดํ„ฐ ๋ถ„์„_pandas(Data_Frame)๐Ÿ“’ DataFrame ์ƒ์„ฑ 2์ฐจ์› ๋ฐฐ์—ด๊ณผ ์œ ์‚ฌํ•œ ์ž๋ฃŒํ˜• ๋‹ค์ฐจ์› ๋ฆฌ์ŠคํŠธ, ๋”•์…”๋„ˆ๋ฆฌ ์ž๋ฃŒํ˜•์œผ๋กœ ๋ฐ์ดํ„ฐ ๊ตฌ์„ฑ ๊ฐ€๋Šฅ ๊ด€๊ณ„ํ˜• ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์˜ ํ…Œ์ด๋ธ” ๊ตฌ์กฐ, excel/csv ๋ฐ์ดํ„ฐ ๊ตฌ์กฐ์™€ ์œ ์‚ฌ ํ•˜๋‚˜์˜ ์ปฌ๋Ÿผ์€ ํ•˜๋‚˜์˜ Series๋กœ์„œ ํ•˜๋‚˜์˜ Dataframe์€ ์—ฌ๋Ÿฌ ๊ฐœ์˜ Series ๋ฌถ์Œ์œผ๋กœ ๊ตฌ์„ฑ๋จ index ํŠน์ง• row index(ํ–‰ ์ธ๋ฑ์Šค) : ๊ธฐ๋ณธ ์ˆซ์žํ˜• ์ธ๋ฑ์Šค๊ฐ€ ์•„๋‹Œ ์ƒˆ๋กญ๊ฒŒ ์ง€์ •ํ•œ ๋กœ์šฐ๋ช…(๋ผ๋ฒจ) ์ธ๋ฑ์Šค๋ฅผ ์‚ฌ์šฉํ•ด๋„ ๊ธฐ๋ณธ ์ˆซ์žํ˜• ์ธ๋ฑ์Šค๋ฅผ ํ•จ๊ป˜ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Œ column index(์—ด ์ธ๋ฑ์Šค) : ์ƒˆ๋กญ๊ฒŒ ์ปฌ๋Ÿผ๋ช…(๋ผ๋ฒจ) ์ธ๋ฑ์Šค๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ๊ธฐ๋ณธ ์ˆซ์žํ˜• ์ธ๋ฑ์Šค๋Š” ์‚ฌ์šฉํ•  ์ˆ˜ ์—†์Œ - ์ธ๋ฑ์Šค๋ฅผ ์ง€์ •ํ•˜์—ฌ ๊ฐ์ฒด ์ƒ์„ฑ : DataFrame ํ•จ์ˆ˜์—์„œ ํŒŒ๋ผ๋ฏธํ„ฐ๋กœ ์ง€์ • - columns ํŒŒ๋ผ๋ฏธํ„ฐ : ์ปฌ๋Ÿผ๋ช…(์—ด ๊ฐœ์ˆ˜์™€ ๋™์ผํ•œ ๊ธธ์ด๋ฅผ ๊ฐ€์ง„ ..
์ œ 12์žฅ ๐Ÿ“’๋ฐ์ดํ„ฐ ๋ถ„์„_pandas(Series ์ž๋ฃŒํ˜•)๐Ÿ“’ Numpy๋ฅผ ๋ฐฐ์šด๊ฒƒ์€ Pandas ๋ฅผ ์“ฐ๊ธฐ ์œ„ํ•ด ๋„ˆ๋ฌด ์ค‘์š”ํ•˜๊ธฐ ๋•Œ๋ฌธ์ด๋ผ๊ณ ๋„ ๋งํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค๐Ÿ˜ฒ ๋“œ๋””์–ด ๋ฐ์ดํ„ฐ ์‹œ๊ฐํ™”์— ์‹ค๋ฌด์—๋„ ๋งŽ์ด ์“ฐ์ด๋Š” pandas๐Ÿผ์— ๋Œ€ํ•ด ๋ฐฐ์šฐ๋Š” ์‹œ๊ฐ„์ž…๋‹ˆ๋‹ค. Pandas ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ๋ฐ ๋ถ„์„์„ ์œ„ํ•œ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ๋Œ€์šฉ๋Ÿ‰ ๋ฐ์ดํ„ฐ๋ฅผ ์•ˆ์ •์ ์ด๋ฉด์„œ๋„ ๊ฐ„ํŽธํ•˜๊ฒŒ ์ฒ˜๋ฆฌ ์„œ๋กœ ๋‹ค๋ฅธ ๋ฐ์ดํ„ฐํƒ€์ž…์œผ๋กœ ์—ด์„ ๊ตฌ์„ฑํ•  ์ˆ˜ ์žˆ์Œ (์ฐธ๊ณ ) Numpy : ์ „์ฒด ๋ฐฐ์—ด ์›์†Œ๋ฅผ ๋™์ผํ•œ ํƒ€์ž…์œผ๋กœ ์ œํ•œ ์ฃผ์š” ๊ธฐ๋Šฅ ๋ฐ์ดํ„ฐ ์ž…์ถœ๋ ฅ : csv, excel, RDB, JSON ๋“ฑ ๋‹ค์–‘ํ•œ ํฌ๋งท์˜ ๋ฐ์ดํ„ฐ๋ฅผ ํšจ์œจ์ ์œผ๋กœ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ํ˜•์‹์„ ์‚ฌ์šฉ ๋ฐ์ดํ„ฐ ๊ฐ€๊ณต : ๋ถ„๋ฆฌ, ๊ฒฐํ•ฉ, ๊ณ„์ธต, ํ”ผ๋ด‡ ๋“ฑ ํ†ต๊ณ„ ๋ถ„์„ ์ฒ˜๋ฆฌ ์ž๋ฃŒํ˜• Series 1์ฐจ์› ๋ฐฐ์—ด๊ณผ ์œ ์‚ฌํ•œ ์ž๋ฃŒํ˜• ์ƒ‰์ธ(index) : ํ–‰ ๋ฒˆํ˜ธ ๊ฐ๊ฐ์˜ ๋ฐ์ดํ„ฐ์— ๋ถ€์—ฌํ•˜๋Š” ์†์„ฑ์œผ๋กœ ๊ธฐ๋ณธ๊ฐ’์€ 0๋ถ€ํ„ฐ ..