반응형
오늘 불러올 데이터는 아래와 같습니다. 결측치도 있고, 숫자가 영어로 잘못 입력된 부분도 있습니다.
먼저 판다스와 os 패키지를 불러옵니다.
import pandas as pd
import os
열고 싶은 파일이 들어있는 폴더 경로를 작업경로로 지정해줍니다.
#작업경로 지정
os.chdir('C:/Users')
데이터를 불러옵시다. 열 이름이 없으므로 header=None 을 입력합니다.
df1=pd.read_csv('mycsv_with_NA.csv',header=None)
>>> df1
0 1 2
0 1 NaN 100.0
1 2 20 200.0
2 3 a 300.0
3 4 40 400.0
4 5 50 NaN
5 6 b 600.0
파일을 불러올 때, a를 결측치로 인식해봅시다. na_values='a' 옵션을 입력하면 됩니다.
df1=pd.read_csv('mycsv_with_NA.csv',header=None,na_values='a')
>>> df1
0 1 2
0 1 NaN 100.0
1 2 20 200.0
2 3 NaN 300.0
3 4 40 400.0
4 5 50 NaN
5 6 b 600.0
반응형
'11.파일 입출력 > DataFrame 파일 불러오기' 카테고리의 다른 글
불규칙한 띄어쓰기 텍스트 파이썬 불러오기 (판다스 데이터프레임) (0) | 2022.01.13 |
---|---|
파이썬으로 CSV 불러오기 (판다스 데이터프레임) (0) | 2022.01.11 |
띄어쓰기 텍스트 파이썬 불러오기 (판다스 데이터프레임) (0) | 2022.01.10 |
콤마 구분 텍스트 파이썬 불러오기 (판다스 데이터프레임) (0) | 2022.01.10 |
파이썬으로 엑셀 데이터 불러오기 (판다스 데이터프레임) (0) | 2022.01.10 |
댓글