5-3. Pandas 제공 자료구조/Series

[파이썬 판다스] 시리즈에서 인덱스 여러 층으로 정의하기 (계층적 인덱스)

만다린망고 2022. 2. 24. 09:40
반응형

독립변수가 두개 이상인 자료를 표로 정리해야하는 경우가 있습니다. 예를들어 독립변수가 거주지, 성별이고 종속변수가 인구 수인 경우를 생각해봅시다.

독립변수 : 거주지, 성별
종속변수 : 인구 수 

표로 정리하면 아래와 같습니다. 

 

 

파이썬 시리즈에서 위 표를 정의해봅시다. 

 

import pandas as pd
import numpy as np

#데이터 생성
sr1=pd.Series([50,50,30,30,20,20],
                index=[['서울','서울','경기','경기','제주',"제주"],['남자','여자','남자','여자','남자','여자']])

 

인덱스를 2차원 리스트로 정의하면 됩니다. 결과는 아래와 같습니다. 

 

>>> sr1
서울  남자    50
    여자    50
경기  남자    30
    여자    30
제주  남자    20
    여자    20
dtype: int64
반응형