본문 바로가기
5-3. Pandas 제공 자료구조/DataFrame 통계함수

[파이썬 판다스] 데이터프레임 행별 평균 구하기

by 만다린망고 2022. 1. 4.
반응형

판다스 패키지와 넘파이 패키지를 불러옵니다

import pandas as pd
import numpy as np


np.rand.rand 함수를 이용하여 0~1 사이 균등분포에서 배열을 생성합니다. 생성한 배열로 데이터프레임을 생성합다. 행과 열의 이름을 아래와 같이 입력합니다. 

>>> df1=pd.DataFrame(np.random.rand(3,4),index=["R1","R2","R3"],columns=["C1","C2","C3","C4"])

>>> df1
          C1        C2        C3        C4
R1  0.365426  0.376201  0.644952  0.642808
R2  0.824492  0.194468  0.876285  0.700862
R3  0.926402  0.327502  0.481516  0.087809


열 별 합을 구해봅시다. mean 메소드를 사용합니다. axis='columns' 옵션을 설정합니다. 열 방향은 좌->우 방향을 말하므로, 행별 합이 계산됩니다. 

>>> df1.mean(axis='columns')
R1    0.507347
R2    0.649027
R3    0.455807
dtype: float64


NaN 취급의 기본설정은 제외하고 계산되는 것입니다. skipna=False 옵션을 입력하면 NaN이 하나만 있어도 해당 열은 NaN 를 결과값으로 갖습니다. 

반응형

댓글