본문 바로가기
5-3. Pandas 제공 자료구조/DataFrame

[파이썬 판다스] 데이터프레임에서 중복 행 확인하고 제거하기

by 만다린망고 2022. 1. 19.
반응형

판다스를 불러오고 결측치가 포함된 데이터프레임을 만들어줍니다. 

import pandas as pd

df1=pd.DataFrame({'C1':[1,2,3,3],'C2':[10,20,30,30],'C3':[100,200,300,300]},index=['R1','R2','R3','R3'])

>>> df1
    C1  C2   C3
R1   1  10  100
R2   2  20  200
R3   3  30  300
R3   3  30  300


3,4행이 겹칩니다. 중복행이 있는지 코드로도 확인해봅시다. duplicate 메소드를 사용합니다. 

>>> df1.duplicated()
R1    False
R2    False
R3    False
R3     True
dtype: bool


4행이 겹친다고 말해줍니다. 중복행을 제거해봅시다. drop_duplicates 메소드를 사용합니다. 

>>> df1.drop_duplicates() 
    C1  C2   C3
R1   1  10  100
R2   2  20  200
R3   3  30  300

 

반응형

댓글