반응형
판다스를 불러오고 결측치가 포함된 데이터프레임을 만들어줍니다.
import pandas as pd
df1=pd.DataFrame({'C1':[1,2,3,3],'C2':[10,20,30,30],'C3':[100,200,300,300]},index=['R1','R2','R3','R3'])
>>> df1
C1 C2 C3
R1 1 10 100
R2 2 20 200
R3 3 30 300
R3 3 30 300
3,4행이 겹칩니다. 중복행이 있는지 코드로도 확인해봅시다. duplicate 메소드를 사용합니다.
>>> df1.duplicated()
R1 False
R2 False
R3 False
R3 True
dtype: bool
4행이 겹친다고 말해줍니다. 중복행을 제거해봅시다. drop_duplicates 메소드를 사용합니다.
>>> df1.drop_duplicates()
C1 C2 C3
R1 1 10 100
R2 2 20 200
R3 3 30 300
반응형
'5-3. Pandas 제공 자료구조 > DataFrame' 카테고리의 다른 글
[파이썬 판다스] 값을 구간별로 나누기 (연속형데이터를 범주형으로) (0) | 2022.02.08 |
---|---|
[파이썬 판다스] 데이터프레임에서 매칭된 데이터 추가하기 (map) (0) | 2022.01.20 |
[파이썬 판다스] 데이터프레임 행 개수, 열 개수 (0) | 2022.01.12 |
[파이썬 판다스] 데이터프레임해서 열별로 각 원소 개수 추출하기 (value_counts) (0) | 2022.01.10 |
[파이썬 판다스] 데이터 프레임 행별 원소 순위(rank) 출력하기 (0) | 2022.01.04 |
댓글