본문 바로가기

python

[한빛 리뷰어] 파이썬 증권 데이터 분석 : 팬더스 시리즈

반응형
팬더스(pandas)는 금융 데이터 분석을 목적으로 개발되었으며 구조화된 데이터를 쉽고 빠르게 가공할 수 있는
자료형과 함수를 제공합니다.
팬더스 이름은 계량 경제학에서 동일한 조사 대상으로부터 여러 시점에 걸쳐 반복적으로 수집한 데이터를 지칭하는
패널 데이터(panel data)와 파이썬 데이터 분석(Python data analysis)에서 유래했습니다.
팬더스는 넘파이를 기반으로 구현했기 때문에 대부분의 함수가 넘파이와 유사합니다. 또한 파이썬 기반 데이터 시각화
라이브러리인 파이플롯(pyplot)과도 쉽게 호환되기 때문에 데이터 과학용 기반 라이브러리로 널리 활용됩니다.
팬더스의 개발자 웨스 매키니는 설계 당시부터 R 언어의 data.frame 객체를 고려했기 때문에 팬더스도 시리즈(Series)와
데이터프레임(DataFrame) 자료형 객체를 제공합니다.
시리즈는 인덱스 처리가 된 1차원 벡터 형태의 자료형입니다. 시간의 흐름에 따라 기록한 데이터를 시계열(time series)이라고
부르는데 시리즈는 이러한 시계열 데이터를 다루는 데 적합합니다.
데이터프레임은 여러 시리즈가 한 가지 인덱스를 기준으로 합쳐진 형태입니다.







반응형