반응형
판다스를 불러오고 데이터프레임을 하나 정의합시다.
import pandas as pd
df1=pd.DataFrame({"C1":[1,2,3],"C2":[1,3,4],"C3":[1,5,6]})
>>> df1
C1 C2 C3
0 1 1 1
1 2 3 5
2 3 4 6
열별로 각 원소의 개수를 출력해봅시다. apply 메소드를 이용하여 value_count 함수를 각 열에 적용합니다.
>>> df1.apply(pd.value_counts)
C1 C2 C3
1 1.0 1.0 1.0
2 1.0 NaN NaN
3 1.0 1.0 NaN
4 NaN 1.0 NaN
5 NaN NaN 1.0
6 NaN NaN 1.0
NaN 을 다른 수로 채우려면 아래와 같이 하면 됩니다.
>>> df1.apply(pd.value_counts).fillna(0)
C1 C2 C3
1 1.0 1.0 1.0
2 1.0 0.0 0.0
3 1.0 1.0 0.0
4 0.0 1.0 0.0
5 0.0 0.0 1.0
6 0.0 0.0 1.0
>>> df1.apply(pd.value_counts).fillna(100)
C1 C2 C3
1 1.0 1.0 1.0
2 1.0 100.0 100.0
3 1.0 1.0 100.0
4 100.0 1.0 100.0
5 100.0 100.0 1.0
6 100.0 100.0 1.0
반응형
'5-3. Pandas 제공 자료구조 > DataFrame' 카테고리의 다른 글
[파이썬 판다스] 데이터프레임에서 중복 행 확인하고 제거하기 (0) | 2022.01.19 |
---|---|
[파이썬 판다스] 데이터프레임 행 개수, 열 개수 (0) | 2022.01.12 |
[파이썬 판다스] 데이터 프레임 행별 원소 순위(rank) 출력하기 (0) | 2022.01.04 |
[파이썬 판다스] 데이터 프레임 열별 원소 순위(rank) 출력하기 (0) | 2022.01.04 |
[파이썬 판다스] 데이터프레임을 특정 열의 값 크기 순으로 정렬하기 (0) | 2022.01.04 |
댓글