본문 바로가기
11.파일 입출력/DataFrame 파일 불러오기

띄어쓰기 텍스트 파이썬 불러오기 (판다스 데이터프레임)

by 만다린망고 2022. 1. 10.
반응형

파이썬에서 불러올 데이터는 아래와 같습니다.

 

 

코드는 아래와 같습니다. pd.read_table 함수를 사용합니다. sep 옵션을 이용하여 구분자가 무엇인지를 입력해야 합니다. 위 경우는 space 이므로 sep=' ' 옵션을 입력합니다. 

 

전체 경로를 입력하여 불러오는 방법과, 작업경로 지정 후 파일 이름으로 불러오는 방법이 있습니다. 

 

import pandas as pd
import os

#방법 1. 전체 경로 입력
df1=pd.read_table('C:/Users/ex_weight.xlsx',sep=' ')


#방법 2. 작업경로 지정 후 파일 이름 입력
os.chdir('C:/Users')

df1=pd.read_table('ex_weight.xlsx',sep=' ')

 

불러온 결과는 아래와 같습니다. 

 

>>> df1
       회사          제품     무게    최소    최대
0    AMOS  Glue_Stick  36.97  36.0  38.0
1  Monami    Name_Pan   7.54   7.0   8.0
2  Monami    Ball_Pan   5.71   5.2   6.5

 

첫줄 열이름(header)가 없는 경우 함수 안에 header=None 옵션을 입력하면 됩니다. 


자주쓰는 옵션 1) 열 이름 직접 입력

header 를 직접 입력할 수도 있습니다. 만약 위의 열이름이 삭제되어 있다면, 아래 옵션으로 입력하면 됩니다.

 

names=['회사','제품','무게','최소','최대']


자주 쓰는 옵션 2) 특정 열을 행 이름으로 사용

만약 첫 열을 행이름으로 하고 싶은 경우 아래와 같이 불러오면 됩니다. index_col 옵션을 입력합니다.

 

df1=pd.read_table('ex_weight.txt',sep=' ',index_col='회사')

>>> df1
                제품     무게    최소    최대
회사
AMOS    Glue_Stick  36.97  36.0  38.0
Monami    Name_Pan   7.54   7.0   8.0
Monami    Ball_Pan   5.71   5.2   6.5

 

여러 열을 행이름으로 할 수도 있습니다. 

 

df1=pd.read_table('ex_weight.txt',sep=' ',index_col=['회사','제품'])

>>> df1
                      무게    최소    최대
회사     제품
AMOS   Glue_Stick  36.97  36.0  38.0
Monami Name_Pan     7.54   7.0   8.0
       Ball_Pan     5.71   5.2   6.5

자주 쓰는 옵션3) 일부 행만 불러오기

일부 행만 불러오고 싶은 경우 nrows=원하는 개수 를 입력하면 됩니다. 

반응형

댓글