본문 바로가기
반응형

11.파일 입출력15

[파이썬] 문자열을 텍스트로 저장하는 방법 저장경로 확인 및 지정 import os #작업경로 확인 os.getcwd() #작업경로 지정 os.chdir('원하는 경로') 텍스트 파일 생성 file = open('myfile.txt', 'w') 텍스트 파일 입력 file.write('원하는 내용') 파일 닫기(저장 완료) file.close() 코드 모아보기 import os #작업경로 확인 os.getcwd() #작업경로 지정 os.chdir('원하는 경로') #텍스트 파일로 저장하기 file = open('myfile.txt', 'w') file.write('원하는 내용') file.close() 2022. 1. 17.
불규칙한 띄어쓰기 텍스트 파이썬 불러오기 (판다스 데이터프레임) 아래 데이터를 봅시다. 띄어쓰기가 불규칙하게 되어 있습니다. 판다스의 read_table 함수로 불러오려고 해봅시다. import pandas as pd df1=pd.read_table('my_ex_tab.txt',header=None,sep=' ') 아래와 같은 오류가 발생합니다. pandas.errors.ParserError: Error tokenizing data. C error: Expected 3 fields in line 2, saw 5 이 문제는 정규표현식으로 해결됩니다. \s 는 공백이라는 의미인데, 여기 +를 붙이면 반복을 의미합니다. 반복되는 공백이라는 말입니다. 공백이 몇개든 상관없습니다. df1=pd.read_table('my_ex_tab.txt',header=None,sep='\s.. 2022. 1. 13.
파이썬 데이터 불러올 때 문자를 결측치로 인식하기 오늘 불러올 데이터는 아래와 같습니다. 결측치도 있고, 숫자가 영어로 잘못 입력된 부분도 있습니다. 먼저 판다스와 os 패키지를 불러옵니다. import pandas as pd import os 열고 싶은 파일이 들어있는 폴더 경로를 작업경로로 지정해줍니다. #작업경로 지정 os.chdir('C:/Users') 데이터를 불러옵시다. 열 이름이 없으므로 header=None 을 입력합니다. df1=pd.read_csv('mycsv_with_NA.csv',header=None) >>> df1 0 1 2 0 1 NaN 100.0 1 2 20 200.0 2 3 a 300.0 3 4 40 400.0 4 5 50 NaN 5 6 b 600.0 파일을 불러올 때, a를 결측치로 인식해봅시다. na_values='a' .. 2022. 1. 12.
파이썬으로 텍스트 저장하기 (판다스 데이터프레임) 판다스와 os 패키지를 불러옵니다. import pandas as pd import os 데이터프레임을 하나 만들어 줍니다. >>> df1=pd.DataFrame({'C1':[1,2,3],'C2':[10,20,30],'C3':[100,200,300]}) >>> df1 C1 C2 C3 0 1 10 100 1 2 20 200 2 3 30 300 저장할 경로를 지정합니다. 원하는 폴더 경로를 지정하면 됩니다. os.chdir('C:/Users') to_table 메소드를 이용하여 텍스트파일을 저장합니다. 구분자는 원하는 것으로 넣습니다. 예시에서는 / 를 넣었습니다. df1.to_csv('mycsv.txt',sep='/') 아래와 같이 파일이 생성되었습니다. 자주 사용하는 옵션 1) 열 이름은 내보내지 않기 .. 2022. 1. 11.
파이썬으로 엑셀 저장하기 (판다스 데이터프레임) 판다스와 os 패키지를 불러옵니다. import pandas as pd import os 데이터프레임을 하나 만들어 줍니다. >>> df1=pd.DataFrame({'C1':[1,2,3],'C2':[10,20,30],'C3':[100,200,300]}) >>> df1 C1 C2 C3 0 1 10 100 1 2 20 200 2 3 30 300 저장할 경로를 지정합니다. 원하는 폴더 경로를 지정하면 됩니다. os.chdir('C:/Users') to_excel 메소드를 이용하여 엑셀파일을 저장합니다. df1.to_excel('mycsv.excel') 아래와 같이 파일이 생성되었습니다. 자주 사용하는 옵션 1) 열 이름은 내보내지 않기 header=False 옵션을 입력합니다. df1.to_excel('myc.. 2022. 1. 11.
파이썬으로 CSV 저장하기 (판다스 데이터프레임) 판다스와 os 패키지를 불러옵니다. import pandas as pd import os 데이터프레임을 하나 만들어 줍니다. >>> df1=pd.DataFrame({'C1':[1,2,3],'C2':[10,20,30],'C3':[100,200,300]}) >>> df1 C1 C2 C3 0 1 10 100 1 2 20 200 2 3 30 300 저장할 경로를 지정합니다. 원하는 폴더 경로를 지정하면 됩니다. os.chdir('C:/Users') to_csv 메소드를 이용하여 csv를 저장합니다. df1.to_csv('mycsv.csv') 아래와 같이 파일이 생성되었습니다. 자주 사용하는 옵션 1) 열 이름은 내보내지 않기 header=False 옵션을 입력합니다. df1.to_csv('mycsv.csv',h.. 2022. 1. 11.
파이썬으로 CSV 불러오기 (판다스 데이터프레임) 파이썬에서 불러올 데이터는 아래와 같습니다. 코드는 아래와 같습니다. pd.read_csv 함수를 사용합니다. 만약 오류가 날 경우 encoding='CP949' 옵션을 추가하면 됩니다. 한글 인코딩이 가능하게 해줍니다. 전체 경로를 입력하여 불러오는 방법과, 작업경로 지정 후 파일 이름으로 불러오는 방법이 있습니다. import pandas as pd import os #방법 1. 전체 경로 입력 df1=pd.read_table('C:/Users/ex_weight.xlsx',encoding='CP949') #방법 2. 작업경로 지정 후 파일 이름 입력 os.chdir('C:/Users') df1=pd.read_table('ex_weight.xlsx',encoding='CP949') 불러온 결과는 아래와.. 2022. 1. 11.
띄어쓰기 텍스트 파이썬 불러오기 (판다스 데이터프레임) 파이썬에서 불러올 데이터는 아래와 같습니다. 코드는 아래와 같습니다. pd.read_table 함수를 사용합니다. sep 옵션을 이용하여 구분자가 무엇인지를 입력해야 합니다. 위 경우는 space 이므로 sep=' ' 옵션을 입력합니다. 전체 경로를 입력하여 불러오는 방법과, 작업경로 지정 후 파일 이름으로 불러오는 방법이 있습니다. import pandas as pd import os #방법 1. 전체 경로 입력 df1=pd.read_table('C:/Users/ex_weight.xlsx',sep=' ') #방법 2. 작업경로 지정 후 파일 이름 입력 os.chdir('C:/Users') df1=pd.read_table('ex_weight.xlsx',sep=' ') 불러온 결과는 아래와 같습니다. >>.. 2022. 1. 10.
콤마 구분 텍스트 파이썬 불러오기 (판다스 데이터프레임) 파이썬에서 불러올 데이터는 아래와 같습니다. 코드는 아래와 같습니다. pd.read_table 함수를 사용합니다. sep 옵션을 이용하여 구분자가 무엇인지를 입력해야 합니다. 위 경우는 콤마이므로 sep=',' 옵션을 입력합니다. 전체 경로를 입력하여 불러오는 방법과, 작업경로 지정 후 파일 이름으로 불러오는 방법이 있습니다. import pandas as pd import os #방법 1. 전체 경로 입력 df1=pd.read_table('C:/Users/ex_weight.xlsx',sep=',') #방법 2. 작업경로 지정 후 파일 이름 입력 os.chdir('C:/Users') df1=pd.read_table('ex_weight.xlsx',sep=',') 불러온 결과는 아래와 같습니다. >>> df.. 2022. 1. 10.
파이썬으로 엑셀 데이터 불러오기 (판다스 데이터프레임) 파이썬에서 불러올 데이터는 아래와 같습니다. 코드는 아래와 같습니다. pd.read_excel 함수를 사용합니다. 전체 경로를 입력하여 불러오는 방법과, 작업경로 지정 후 파일 이름으로 불러오는 방법이 있습니다. import pandas as pd import os #방법 1. 전체 경로 입력 df1=pd.read_excel('C:/Users/ex_weight.xlsx') #방법 2. 작업경로 지정 후 파일 이름 입력 os.chdir('C:/Users') df1=pd.read_excel('ex_weight.xlsx') 불러온 결과는 아래와 같습니다. >>> df1 회사 제품 무게 최소 최대 0 AMOS Glue_Stick 36.97 36.0 38.0 1 Monami Name_Pan 7.54 7.0 8.0.. 2022. 1. 10.
[파이썬 판다스] 데이터프레임 데이터 불러오기 관련 함수들 모음 데이터프레임 데이터 불러오기 관련 함수들 모음입니다. 함수 기능 read_table tab 으로 구분된 자료 read_csv , 으로 구분된 자료 read_excel 엑셀자료 read_html html 자료 read_json json 자료 read_sql SQL 자료 read_sas sas 자료 read_stata stata 자료 2022. 1. 10.
파이썬 폴더 안의 파일 목록 가져오기 os 패키지의 listdir 함수를 사용합니다. 아래와 같이 사용합니다. import os file_names=os.listdir('경로') 결과는 리스트 자료형으로 반환됩니다. 2021. 5. 20.
파이썬에서 텍스트파일 불러오고 숫자만 추출하기 1. 정수 아래와 같은 텍스트 파일이가 있다고 합시다. 위 텍스트에서 숫자만 추출하는 코드입니다. import re #텍스트 불러오기 f = open("C:/Users/Public/mytext.txt") #각 줄을 리트스로 저장 data=f.readlines() ## >>> print(data) ## ["A's age is 24, weight is 65kg\n", "A's age is 42, weight is 77kg\n", "A's age is 55, weight is 99kg\n", '\n'] #첫째 줄의 숫자 num_line1=re.findall("\d+", data[0]) ## >>> num_line1 ## ['24', '65'] 2. 실수 아래와 같은 텍스트 파일이가 있다고 합시다. 소수점 아래.. 2021. 5. 17.
[파이썬 기초]텍스트 파일 읽기 [파이썬 기초] 텍스트 파일 읽기 텍스트 파일을 읽을 때는 open 함수를 사용합니다. 아래와 같은 형식으로 사용합니다. open('경로',옵션) 옵션은 아래와 같습니다. 디폴트는 r입니다. r 읽기전용w 쓰기전용. 새 파일을 생성, 같은 이름의 파일 삭제x 쓰기전용; 새파일을 생성, 같은 이름의 파일 있으면 생성안됨a 기존 파일 끝에 추가r+ 읽고 쓰기b 뒤에 b를 붙이면 이진파일에 해당. (ex. wb,rb) 텍스트 파일 만들기 먼저 원하는 경로에 텍스트 파일을 하나 생성하고 아래 내용을 적고 myfile 이라는 이름으로 저장해봅시다. The Apple is redThe Banana is yellowThe Orange is orange 제가 저장한 경로는 아래와 같습니다. C:\Users\Public.. 2020. 11. 6.
파이썬 작업 디렉토리(working directory) 확인 및 변경 파이썬 작업 디렉토리(working directory) 확인 및 변경 디렉토리 확인,변경 메소드 사용을 위해 os 라이브러리 가져오기 >>> import os 작업 디렉토리 확인 get current working directory 의 약거인 getcwd 메소드 이용 >>> os.getcwd() 작업 디렉토리 변경 change directory 의 약어 chdir 이용 >>> os.chdir('원하는 경로') 2020. 11. 6.
반응형