본문 바로가기
반응형

5-3. Pandas 제공 자료구조/DataFrame 인덱싱 관련12

[파이썬 판다스] 데이터프레임 인덱스 리셋하는 법 데이터 프레임 이름을 df 라고 하면 아래와 같이 인덱스를 리셋합니다. df=df.reset_index(drop=True) 위와 같이 리셋 결과를 df에 다시 입력해주어야 합니다. 2023. 1. 17.
[파이썬 판다스] 데이터프레임 특정 조건을 만족하는 행만 추리기(any,all) 먼저 데이터를 하나 생성합시다. import pandas as pd import numpy as np md = pd.DataFrame(10*np.random.randn(10, 4)) >>> md 0 1 2 3 0 4.538928 -5.226503 10.369977 6.726804 1 10.371321 6.897509 -9.493601 -21.909799 2 10.575935 -2.771346 7.853494 -1.184277 3 3.363696 -0.878508 2.587997 -8.812833 4 9.401511 33.617850 -12.975039 -8.628830 5 8.581020 18.303396 0.752900 8.202389 6 -0.521181 2.607637 5.511367 21.1723.. 2022. 2. 9.
[파이썬 판다스] 데이터프레임에서 특정 열을 대문자 또는 소문자로 변경하기 판다스를 불러오고 결측치가 포함된 데이터프레임을 만들어줍니다. import pandas as pd df1=pd.DataFrame({'C1':['A','B','C','D'],'C2':['a','b','c','d'],'C3':['A','b','C','d']},index=['R1','R2','R3','R4']) >>> df1 C1 C2 C3 R1 A a A R2 B b b R3 C c C R4 D d d 첫번째 열을 소문자로 바꿔봅시다. str.lower 메소드를 사용합니다. >>> df1['C1'].str.lower() R1 a R2 b R3 c R4 d Name: C1, dtype: object 이번에는 두번째 열을 대문자로 바꿔봅시다. str.upper 메소드를 사용합니다. >>> df1['C2'].st.. 2022. 1. 20.
[파이썬 판다스] 데이터프레임 행이름, 열이름 리스트로 추출 판다스를 불러오고 데이터프레임을 하나 정의합니다. import pandas as pd df1=pd.DataFrame({'C1':[1,2,3],'C2':[10,20,30],'C3':[100,200,300]},index=['R1','R2','R3']) >>> df1 C1 C2 C3 R1 1 10 100 R2 2 20 200 R3 3 30 300 행 이름을 출력해봅시다. >>> list(df1.index) ['R1', 'R2', 'R3'] 열 이름을 출력해봅시다. >>> list(df1.columns) ['C1', 'C2', 'C3'] 2022. 1. 12.
[파이썬 판다스] 데이터프레임 숫자로만 인덱싱 하는 법(iloc) 판다스를 불러오고 데이터프레임을 하나 정의합시다. import pandas as pd df1=pd.DataFrame({'C1':[1,2,3],'C2':[10,20,30],'C3':[100,200,300]},index=['R1','R2','R3']) >>> df1 C1 C2 C3 R1 1 10 100 R2 2 20 200 R3 3 30 300 숫자(index)로 인덱싱 할 때는 iloc 메소드를 사용합니다. 1행 1열에 접근해봅시다. >>> df1.iloc[0,0] 1 1행 3열에 접근해봅시다. >>> df1.iloc[0,2] 100 1행의 1,2열에 접근해봅시다. >>> df1.iloc[0,0:2] C1 1 C2 10 Name: R1, dtype: int64 1행의 1,3열에 접근해봅시다. >>> df1.. 2022. 1. 12.
[파이썬 판다스] 데이터 프레임에서 특정 열의 특정 행에 접근하기 (인덱스 이용) 판다스를 불러옵니다. import pandas as pd 먼저 딕셔너리를 정의합니다. dic={'이름':['이호정','이정진','이기호','정희진','이나리'], '성별':['남','남','남','여','여'], '나이':[25,45,72,25,37] } 딕셔너리를 이용하여 데이터프레임을 정의합니다. data1=pd.DataFrame(dic,index=['R1','R2','R3','R4','R5']) >>> data1 이름 성별 나이 R1 이호정 남 25 R2 이정진 남 45 R3 이기호 남 72 R4 정희진 여 25 R5 이나리 여 37 성별 열의 R2와 R4 행에 접근해봅시다. >>> data1.iloc[[1,3],1] R2 남 R4 여 Name: 성별, dtype: object 이름과 나이 열의 R.. 2021. 12. 30.
[파이썬 판다스] 데이터 프레임에서 특정 열의 특정 행에 접근하기 (행,열 이름으로 접근) 판다스를 불러옵니다. import pandas as pd 먼저 딕셔너리를 정의합니다. dic={'이름':['이호정','이정진','이기호','정희진','이나리'], '성별':['남','남','남','여','여'], '나이':[25,45,72,25,37] } 딕셔너리를 이용하여 데이터프레임을 정의합니다. data1=pd.DataFrame(dic,index=['R1','R2','R3','R4','R5']) >>> data1 이름 성별 나이 R1 이호정 남 25 R2 이정진 남 45 R3 이기호 남 72 R4 정희진 여 25 R5 이나리 여 37 성별 열의 R2와 R4 행에 접근해봅시다. >>> data1.loc[['R2','R4'],'성별'] R2 남 R4 여 Name: 성별, dtype: object 이름과.. 2021. 12. 30.
[파이썬 판다스] 데이터프레임에 값만 배열 형태로 추출 판다스를 불러옵니다. import pandas as pd 먼저 딕셔너리를 정의합니다. dic={'이름':['이호정','이정진','이기호','정희진','이나리'], '성별':['남','남','남','여','여'], '나이':[25,45,72,25,37] } 딕셔너리를 이용하여 데이터프레임을 정의합니다. data1=pd.DataFrame(dic) >>> data1 이름 성별 나이 0 이호정 남 25 1 이정진 남 45 2 이기호 남 72 3 정희진 여 25 4 이나리 여 37 값만 배열로 추출해봅시다. values 메소드를 사용합니다. >>> data1.values array([['이호정', '남', 25], ['이정진', '남', 45], ['이기호', '남', 72], ['정희진', '여', 25], [.. 2021. 12. 22.
[파이썬 판다스] 데이터프레임 특정 열 수정하기 판다스를 불러옵니다. import pandas as pd 먼저 딕셔너리를 정의합니다. dic={'이름':['이호정','이정진','이기호','정희진','이나리'], '성별':['남','남','남','여','여'], '나이':[25,45,72,25,37] } 딕셔너리를 이용하여 데이터프레임을 정의합니다. data1=pd.DataFrame(dic) >>> data1 이름 성별 나이 0 이호정 남 25 1 이정진 남 45 2 이기호 남 72 3 정희진 여 25 4 이나리 여 37 '나이' 열을 수정해봅시다. 아래와 같이 두 가지 방법이 있습니다. >>> data1.나이=[15,15,15,15,15] >>> data1 이름 성별 나이 0 이호정 남 15 1 이정진 남 15 2 이기호 남 15 3 정희진 여 15 .. 2021. 12. 17.
[파이썬 판다스] 데이터프레임 특정 열에 접근하기 판다스를 불러옵니다. import pandas as pd 먼저 딕셔너리를 정의합니다. dic={'이름':['이호정','이정진','이기호','정희진','이나리'], '성별':['남','남','남','여','여'], '나이':[25,45,72,25,37] } 딕셔너리를 이용하여 데이터프레임을 정의합니다. data1=pd.DataFrame(dic) >>> data1 이름 성별 나이 0 이호정 남 25 1 이정진 남 45 2 이기호 남 72 3 정희진 여 25 4 이나리 여 37 '이름' 열에 접근해봅시다. 아래와 같이 두 가지 방법이 있습니다. >>> data1.이름 0 이호정 1 이정진 2 이기호 3 정희진 4 이나리 Name: 이름, dtype: object >>> data1['이름'] 0 이호정 1 이정.. 2021. 12. 17.
[파이썬 판다스] 데이터프레임 열 이름 수정하기 판다스를 불러옵니다. import pandas as pd 먼저 딕셔너리를 정의합니다. dic={'이름':['이호정','이정진','이기호','정희진','이나리'], '성별':['남','남','남','여','여'], '나이':[25,45,72,25,37] } 딕셔너리를 이용하여 데이터프레임을 정의합니다. data1=pd.DataFrame(dic) >>> data1 이름 성별 나이 0 이호정 남 25 1 이정진 남 45 2 이기호 남 72 3 정희진 여 25 4 이나리 여 37 열 이름을 수정할 때는 columns 메소드를 사용합니다. 원하는 열이름을 리스트 형태로 입력하면 됩니다. >>> data1.columns=['name','sex','age'] >>> data1 name sex age 0 이호정 남 2.. 2021. 12. 17.
[파이썬 판다스] 데이터프레임 열 이름 출력하기 판다스를 불러옵니다. import pandas as pd 먼저 딕셔너리를 정의합니다. dic={'이름':['이호정','이정진','이기호','정희진','이나리'], '성별':['남','남','남','여','여'], '나이':[25,45,72,25,37] } 딕셔너리를 이용하여 데이터프레임을 정의합니다. data1=pd.DataFrame(dic) >>> data1 이름 성별 나이 0 이호정 남 25 1 이정진 남 45 2 이기호 남 72 3 정희진 여 25 4 이나리 여 37 열 이름에 접근할 때는 columns 메소드를 사용합니다. >>> data1.columns Index(['이름', '성별', '나이'], dtype='object') 2021. 12. 17.
반응형