본문 바로가기
5-3. Pandas 제공 자료구조/DataFrame

[파이썬 판다스] 데이터프레임해서 열별로 각 원소 개수 추출하기 (value_counts)

by 만다린망고 2022. 1. 10.
반응형

판다스를 불러오고 데이터프레임을 하나 정의합시다. 

import pandas as pd

df1=pd.DataFrame({"C1":[1,2,3],"C2":[1,3,4],"C3":[1,5,6]})

>>> df1
   C1  C2  C3
0   1   1   1
1   2   3   5
2   3   4   6


열별로 각 원소의 개수를 출력해봅시다. apply 메소드를 이용하여 value_count 함수를 각 열에 적용합니다. 

>>> df1.apply(pd.value_counts)  
    C1   C2   C3
1  1.0  1.0  1.0
2  1.0  NaN  NaN
3  1.0  1.0  NaN
4  NaN  1.0  NaN
5  NaN  NaN  1.0
6  NaN  NaN  1.0


NaN 을 다른 수로 채우려면 아래와 같이 하면 됩니다. 

>>> df1.apply(pd.value_counts).fillna(0)
    C1   C2   C3
1  1.0  1.0  1.0
2  1.0  0.0  0.0
3  1.0  1.0  0.0
4  0.0  1.0  0.0
5  0.0  0.0  1.0
6  0.0  0.0  1.0


>>> df1.apply(pd.value_counts).fillna(100) 
      C1     C2     C3
1    1.0    1.0    1.0
2    1.0  100.0  100.0
3    1.0    1.0  100.0
4  100.0    1.0  100.0
5  100.0  100.0    1.0
6  100.0  100.0    1.0
반응형

댓글