Pandas 의 데이터 구조
🔨 절차형
💡
학습 전략: 연습 (Practice)
즉시 실전에 적용해 보는 것이 핵심
핵심 데이터 구조
Pandas의 핵심 데이터 구조는 Series와 DataFrame입니다.
Series
특징
- 1차원 구조
- 하나의 분류에 해당하는 데이터 저장
- 인덱스(index)와 값(value)로 구성
생성 예시
기본 생성
1
2
3
4
5
import pandas as pd
# 기본 생성
animal_series = pd.Series(['돼지', '코끼리', '하마', '상어'])
print(animal_series)
딕셔너리로 생성
1
2
s2 = pd.Series({'a': 1, 'b': 2, 'c': 3})
print(s2)
사용자 정의 인덱스 지정
1
2
s3 = pd.Series([4, 7, -5, 3], index=["d", "b", "a", "c"])
print(s3)
DataFrame
특징
- 복수의 열을 가진 2차원 데이터 구조
- 여러 개의 Series를 포함할 수 있음
- 행(row)과 열(column)로 구성
생성 예시
1
2
3
4
5
6
7
8
9
# 딕셔너리로 생성
data = {
'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35],
'city': ['Seoul', 'Busan', 'Daegu']
}
df = pd.DataFrame(data)
print(df)
Series vs DataFrame
| 특징 | Series | DataFrame |
|---|---|---|
| 차원 | 1차원 | 2차원 |
| 구조 | 단일 열 | 여러 열 |
| 인덱싱 | 인덱스 | 행/열 인덱스 |