본문 바로가기
반응형

판다스94

[파이썬 판다스] 데이터프레임 첫 5개 데이터만 출력 (head) 판다스 데이터프레임을 하나 정의합시다. import pandas as pd data=pd.DataFrame(data={'이름':['이호정','이정진','이기호','정희진','이나리','여민정','송지은'], '성별':['남','남','남','여','여','여','여'], '나이':[25,45,72,25,37,23,66] }) >>> data 이름 성별 나이 0 이호정 남 25 1 이정진 남 45 2 이기호 남 72 3 정희진 여 25 4 이나리 여 37 5 여민정 여 23 6 송지은 여 66 head 메소드를 이용하여 첫 5개 데이터만 출력해봅시다. 데이터가 아주 많은 경우 앞부분만 확인하고 싶을 때 사용합니다. >>> data.head() 이름 성별 나이 0 이호정 남 25 1 이정진 남 45 2 이기.. 2021. 12. 16.
[파이썬 판다스] 데이터프레임 정의하기 데이터프레임은 엑셀과 가장 유사합니다. 엑셀시트라고 생각하시면 됩니다. 차이가 있다면 행과 열의 이름을 지정할 수가 있습니다. 엑셀은 행이름은 숫자, 열이름은 알파벳으로 되어 있습니다. 데이터프레임을 하나 만들어봅시다. 아래와 같은 표를 데이터프레임으로 정의해봅시다. 아래와 같이 정의합니다. >>> import pandas as pd >>> data=pd.DataFrame({'이름':['이호정','이정진','이기호','정희진','이나리'], '성별':['남','남','남','여','여'], '나이':[25,45,72,25,37]}) >>> data 이름 성별 나이 0 이호정 남 25 1 이정진 남 45 2 이기호 남 72 3 정희진 여 25 4 이나리 여 37 pd.DataFrame 괄호 안에 입력된 데.. 2021. 12. 16.
[파이썬 판다스] 시리즈 원소 NaN 여부 확인하기 (결측값) 판다스 시리즈를 하나 정의합시다. NaN을 정의하기 위해 넘파이도 불러옵니다. >>> import pandas as pd >>> import numpy as np >>> s1=pd.Series([1,2,np.NaN,4,5]) >>> s1 0 1.0 1 2.0 2 NaN 3 4.0 4 5.0 dtype: float64 결측값을 True로 출력해봅시다. >>> pd.isnull(s1) 0 False 1 False 2 True 3 False 4 False dtype: bool 또는 아래와 같이 메소드를 사용할 수도 있습니다. >>> s1.isnull() 0 False 1 False 2 True 3 False 4 False dtype: bool 결측값을 False로 출력해봅시다. >>> pd.notnull(s1.. 2021. 12. 14.
[파이썬 판다스] 부등식을 이용한 시리즈 인덱싱 판다스 시리즈를 하나 정의합시다. >>> import pandas as pd >>> s1=pd.Series([1,2,3,4,5]) >>> s1 0 1 1 2 2 3 3 4 4 5 dtype: int64 2이상인 원소를 인덱싱 해봅시다. >>> s1[s1>=2] 1 2 2 3 3 4 4 5 dtype: int64 2 이상 4 이하인 원소를 인덱싱 해봅시다. 판다스에서는 and 연산자가 아니라 & 를 사용해야 합니다. >>> s1[(s1>=2) & (s1 2021. 12. 13.
반응형