5-3. Pandas 제공 자료구조/DataFrame
[파이썬 판다스] 데이터프레임에서 중복 행 확인하고 제거하기
만다린망고
2022. 1. 19. 10:15
반응형
판다스를 불러오고 결측치가 포함된 데이터프레임을 만들어줍니다.
import pandas as pd
df1=pd.DataFrame({'C1':[1,2,3,3],'C2':[10,20,30,30],'C3':[100,200,300,300]},index=['R1','R2','R3','R3'])
>>> df1
C1 C2 C3
R1 1 10 100
R2 2 20 200
R3 3 30 300
R3 3 30 300
3,4행이 겹칩니다. 중복행이 있는지 코드로도 확인해봅시다. duplicate 메소드를 사용합니다.
>>> df1.duplicated()
R1 False
R2 False
R3 False
R3 True
dtype: bool
4행이 겹친다고 말해줍니다. 중복행을 제거해봅시다. drop_duplicates 메소드를 사용합니다.
>>> df1.drop_duplicates()
C1 C2 C3
R1 1 10 100
R2 2 20 200
R3 3 30 300
반응형