반응형
판다스 패키지와 넘파이 패키지를 불러옵니다
import pandas as pd
import numpy as np
np.rand.rand 함수를 이용하여 0~1 사이 균등분포에서 배열을 생성합니다. 생성한 배열로 데이터프레임을 생성합다. 행과 열의 이름을 아래와 같이 입력합니다.
>>> df1=pd.DataFrame(np.random.rand(3,4),index=["R1","R2","R3"],columns=["C1","C2","C3","C4"])
>>> df1
C1 C2 C3 C4
R1 0.365426 0.376201 0.644952 0.642808
R2 0.824492 0.194468 0.876285 0.700862
R3 0.926402 0.327502 0.481516 0.087809
열 별 합을 구해봅시다. sum 메소드를 사용합니다.
>>> df1.sum()
C1 2.116319
C2 0.898170
C3 2.002753
C4 1.431479
dtype: float64
NaN 취급의 기본설정은 제외하고 계산되는 것입니다. skipna=False 옵션을 입력하면 NaN이 하나만 있어도 해당 열은 NaN 를 결과값으로 갖습니다.
반응형
'5-3. Pandas 제공 자료구조 > DataFrame 통계함수' 카테고리의 다른 글
[파이썬 판다스] 데이터프레임 행 방향으로 누적값 계산 (cumsum) (0) | 2022.01.04 |
---|---|
[파이썬 판다스] 데이터프레임 열별 최댓값이 들어있는 행을 출력 (0) | 2022.01.04 |
[파이썬 판다스] 데이터프레임 행별 평균 구하기 (0) | 2022.01.04 |
[파이썬 판다스] 데이터프레임 열별 평균 구하기 (0) | 2022.01.04 |
[파이썬 판다스] 데이터프레임 행별 합 구하기 (0) | 2022.01.04 |
댓글