본문 바로가기
5-3. Pandas 제공 자료구조/DataFrame 통계함수

[파이썬 판다스] 데이터프레임 각 열의 개수,평균,표준편차,최댓값,최솟값,분위수 출력

by 만다린망고 2022. 1. 4.
반응형

판다스 패키지와 넘파이 패키지를 불러옵니다

import pandas as pd
import numpy as np


np.rand.rand 함수를 이용하여 0~1 사이 균등분포에서 배열을 생성합니다. 생성한 배열로 데이터프레임을 생성합다. 행과 열의 이름을 아래와 같이 입력합니다. 

>>> df1=pd.DataFrame(np.random.rand(3,4),index=["R1","R2","R3"],columns=["C1","C2","C3","C4"])

>>> df1
          C1        C2        C3        C4
R1  0.365426  0.376201  0.644952  0.642808
R2  0.824492  0.194468  0.876285  0.700862
R3  0.926402  0.327502  0.481516  0.087809


각 열의 개수,평균,표준편차,최댓값,최솟값,분위수를 출력해봅시다. describe 메소드를 사용합니다. 

>>> df1.describe()
             C1        C2        C3        C4
count  3.000000  3.000000  3.000000  3.000000
mean   0.705440  0.299390  0.667584  0.477160
std    0.298837  0.094071  0.198355  0.338435
min    0.365426  0.194468  0.481516  0.087809
25%    0.594959  0.260985  0.563234  0.365308
50%    0.824492  0.327502  0.644952  0.642808
75%    0.875447  0.351851  0.760618  0.671835
max    0.926402  0.376201  0.876285  0.700862
반응형

댓글