본문 바로가기
5-3. Pandas 제공 자료구조/DataFrame 통계함수

[파이썬 판다스] 데이터프레임 열별 평균 구하기

by 만다린망고 2022. 1. 4.
반응형

판다스 패키지와 넘파이 패키지를 불러옵니다

import pandas as pd
import numpy as np


np.rand.rand 함수를 이용하여 0~1 사이 균등분포에서 배열을 생성합니다. 생성한 배열로 데이터프레임을 생성합다. 행과 열의 이름을 아래와 같이 입력합니다. 

>>> df1=pd.DataFrame(np.random.rand(3,4),index=["R1","R2","R3"],columns=["C1","C2","C3","C4"])

>>> df1
          C1        C2        C3        C4
R1  0.365426  0.376201  0.644952  0.642808
R2  0.824492  0.194468  0.876285  0.700862
R3  0.926402  0.327502  0.481516  0.087809


열 별 평균을 구해봅시다. mean 메소드를 사용합니다. 

>>> df1.mean()
C1    0.705440
C2    0.299390
C3    0.667584
C4    0.477160
dtype: float64


NaN 취급의 기본설정은 제외하고 계산되는 것입니다. skipna=False 옵션을 입력하면 NaN이 하나만 있어도 해당 열은 NaN 를 결과값으로 갖습니다. 

반응형

댓글