반응형
데이터프레임에 사용되는 통계관련 함수는 아래와 같습니다. 메소드 형태로 사용합니다. 데이터프레임 이름이 df1이고 함수명이 aa라면 아래와 같이 사용합니다.
df1.aa()
기본적으로 각 열에 적용됩니다. 각 행에 적용을 원하는 경우 axis='columns' 옵션을 설정하면 됩니다.
함수는 아래와 같습니다.
1. 통계량 관련
메소드 | 설명 |
mean | 평균 |
var | 분산 |
std | 표준편차 |
skew | 왜도 |
kurt | 첨도 |
median | 중앙값 |
mad | 중앙값 절대편차 |
describe | 여러 통계량 한번에 출력 |
quantile | 분위수 (0~1사이값 입력) |
2. 개수, 합, 차, 곱, 변화율 관련
메소드 | 설명 |
count | 개수 |
sum | 합 |
cumsum | 누적합 |
prod | 곱 |
diff | 앞 원소와의 차이 |
pct_change | 앞 원소와의 변화율 |
3. 최대 최소 관련
메소드 | 설명 |
min | 최솟값 |
max | 최댓값 |
idxmin | 최솟값 행이름 |
idxmax | 최댓값 행이름 |
cummin | 누적 최솟값 |
cummax | 누적 최솟값 |
반응형
'5-3. Pandas 제공 자료구조 > DataFrame 통계함수' 카테고리의 다른 글
[파이썬 판다스] 데이터프레임 각 열의 개수,평균,표준편차,최댓값,최솟값,분위수 출력 (0) | 2022.01.04 |
---|---|
[파이썬 판다스] 데이터프레임 행 방향으로 누적값 계산 (cumsum) (0) | 2022.01.04 |
[파이썬 판다스] 데이터프레임 열별 최댓값이 들어있는 행을 출력 (0) | 2022.01.04 |
[파이썬 판다스] 데이터프레임 행별 평균 구하기 (0) | 2022.01.04 |
[파이썬 판다스] 데이터프레임 열별 평균 구하기 (0) | 2022.01.04 |
댓글