Pandas의 데이터 조회 및 검사

Pandas의 데이터 조회 및 검사

🔨 절차형
💡
학습 전략: 연습 (Practice)
즉시 실전에 적용해 보는 것이 핵심

예시 데이터프레임

1
2
3
4
5
6
7
import pandas as pd

df = pd.DataFrame({
    'A': [1, 2, 3, 4, 5],
    'B': [10, 20, 30, 40, 50],
    'C': [100, 200, 300, 400, 500],
})

describe() 메서드

데이터프레임의 시리즈(Series)에 대한 기본적인 통계를 반환합니다:

1
print(df.describe())

출력 예시

1
2
3
4
5
6
7
8
9
       A    B     C
count 5.000000 5.000000 5.000000
mean  3.000000 30.000000 300.000000
std   1.581139 15.811388 158.113883
min   1.000000 10.000000 100.000000
25%   2.000000 20.000000 200.000000
50%   3.000000 30.000000 300.000000
75%   4.000000 40.000000 400.000000
max   5.000000 50.000000 500.000000

주요 통계 정보

  • count: 데이터 개수
  • mean: 평균
  • std: 표준편차
  • min: 최솟값
  • 25%, 50%, 75%: 사분위수
  • max: 최댓값

기타 유용한 메서드

1
2
3
4
5
6
7
8
9
10
11
12
13
14
# 데이터 정보
df.info()

# 상위 n개 행
df.head()

# 하위 n개 행
df.tail()

# 데이터 타입
df.dtypes

# 결측치 확인
df.isnull().sum()

참고 자료

💬 댓글