반응형
아래 데이터를 봅시다.
띄어쓰기가 불규칙하게 되어 있습니다. 판다스의 read_table 함수로 불러오려고 해봅시다.
import pandas as pd
df1=pd.read_table('my_ex_tab.txt',header=None,sep=' ')
아래와 같은 오류가 발생합니다.
pandas.errors.ParserError: Error tokenizing data. C error: Expected 3 fields in line 2, saw 5
이 문제는 정규표현식으로 해결됩니다. \s 는 공백이라는 의미인데, 여기 +를 붙이면 반복을 의미합니다. 반복되는 공백이라는 말입니다. 공백이 몇개든 상관없습니다.
df1=pd.read_table('my_ex_tab.txt',header=None,sep='\s+')
>>> df1
0 1 2
0 1 2 3
1 4 5 6
2 7 8 9
잘 불러와 집니다.
반응형
'11.파일 입출력 > DataFrame 파일 불러오기' 카테고리의 다른 글
파이썬 데이터 불러올 때 문자를 결측치로 인식하기 (0) | 2022.01.12 |
---|---|
파이썬으로 CSV 불러오기 (판다스 데이터프레임) (0) | 2022.01.11 |
띄어쓰기 텍스트 파이썬 불러오기 (판다스 데이터프레임) (0) | 2022.01.10 |
콤마 구분 텍스트 파이썬 불러오기 (판다스 데이터프레임) (0) | 2022.01.10 |
파이썬으로 엑셀 데이터 불러오기 (판다스 데이터프레임) (0) | 2022.01.10 |
댓글