나무모에 미러 (일반/밝은 화면)
최근 수정 시각 : 2025-03-12 12:30:29

Pandas

<#ffffff,#1c1d1f>파일:Pandas 로고.svg
1. 개요2. 역사3. 특성4. 여담

1. 개요

#!syntax python
import pandas as pd

Pandas (판다스)는 Python의 정형 데이터 (테이블 데이터) 전처리 라이브러리다.[1] 판다스의 이름은 계량 경제학에서 사용되는 용어인 'PANel DAta'의 앞 글자를 따서 지어졌다. 당연히 실제 동물인 팬더와는 아무런 관련이 없지만, 이름이 이름이니만큼 각종 개발 관련 사이트에서 판다 이미지를 활용하여 판다스를 소개하곤 한다. 판다스는 수치형 테이블과 시계열 데이터를 조작하고 운영하기 위한 데이터를 제공하는데, 3조항 BSD 라이선스 조건 하에서 무료로 사용 가능하다.

2. 역사

개발자 웨스 메키니 (Wes McKinney)는 금융 데이터에 대한 계량적 분석을 수행하기 위한 고성능의 유연한 툴을 만들 필요가 있다 생각하여, AQR Capital Management에서 근무하던 2008년부터 팬더스 개발 작업을 시작하였다. 웨스 메키니는 AQR에서 퇴사하기 전에 경영진을 설득하여 그가 개발하던 팬더스를 개방할 수 있도록 하여, 대중적으로 사용할 수 있게 되었다.

3. 특성

판다스는 R에서 사용되는 data.frame 구조를 본뜬 DataFrame이라는 구조를 사용하기 때문에, R의 data.frame에서 사용하던 기능 상당수를 무리없이 사용할 수 있도록 만들었다. 더욱이 파이썬이라는 접근성이 좋은 언어 기반으로 동작하기 때문에 데이터 분석을 파이썬으로 입문하는 사람들이 필수적으로 사용하는 라이브러리가 되었다.

Pandas의 주요 코드는 Python으로 작성되었고 극히 일부는 C로 작성되었다.

4. 여담



[1] 외래어 표기법에 따라서 원칙적으로 팬더즈라고 표기해야 한다. 하지만 국내 업계에서는 주로 판다스라고 표기하고 그렇게 부른다.[2] 개발진에 따르면 쿠디에프라고 읽어야 한다.