5-3. Pandas 제공 자료구조/DataFrame
[파이썬 판다스] 데이터프레임해서 열별로 각 원소 개수 추출하기 (value_counts)
만다린망고
2022. 1. 10. 14:17
반응형
판다스를 불러오고 데이터프레임을 하나 정의합시다.
import pandas as pd
df1=pd.DataFrame({"C1":[1,2,3],"C2":[1,3,4],"C3":[1,5,6]})
>>> df1
C1 C2 C3
0 1 1 1
1 2 3 5
2 3 4 6
열별로 각 원소의 개수를 출력해봅시다. apply 메소드를 이용하여 value_count 함수를 각 열에 적용합니다.
>>> df1.apply(pd.value_counts)
C1 C2 C3
1 1.0 1.0 1.0
2 1.0 NaN NaN
3 1.0 1.0 NaN
4 NaN 1.0 NaN
5 NaN NaN 1.0
6 NaN NaN 1.0
NaN 을 다른 수로 채우려면 아래와 같이 하면 됩니다.
>>> df1.apply(pd.value_counts).fillna(0)
C1 C2 C3
1 1.0 1.0 1.0
2 1.0 0.0 0.0
3 1.0 1.0 0.0
4 0.0 1.0 0.0
5 0.0 0.0 1.0
6 0.0 0.0 1.0
>>> df1.apply(pd.value_counts).fillna(100)
C1 C2 C3
1 1.0 1.0 1.0
2 1.0 100.0 100.0
3 1.0 1.0 100.0
4 100.0 1.0 100.0
5 100.0 100.0 1.0
6 100.0 100.0 1.0
반응형