5-3. Pandas 제공 자료구조/Series
[파이썬 판다스] 시리즈에서 인덱스 여러 층으로 정의하기 (계층적 인덱스)
만다린망고
2022. 2. 24. 09:40
반응형
독립변수가 두개 이상인 자료를 표로 정리해야하는 경우가 있습니다. 예를들어 독립변수가 거주지, 성별이고 종속변수가 인구 수인 경우를 생각해봅시다.
독립변수 : 거주지, 성별
종속변수 : 인구 수
표로 정리하면 아래와 같습니다.
파이썬 시리즈에서 위 표를 정의해봅시다.
import pandas as pd
import numpy as np
#데이터 생성
sr1=pd.Series([50,50,30,30,20,20],
index=[['서울','서울','경기','경기','제주',"제주"],['남자','여자','남자','여자','남자','여자']])
인덱스를 2차원 리스트로 정의하면 됩니다. 결과는 아래와 같습니다.
>>> sr1
서울 남자 50
여자 50
경기 남자 30
여자 30
제주 남자 20
여자 20
dtype: int64
반응형