본문 바로가기
5-3. Pandas 제공 자료구조/Series

[파이썬 판다스] 시리즈에서 인덱스 여러 층으로 정의하기 (계층적 인덱스)

by 만다린망고 2022. 2. 24.
반응형

독립변수가 두개 이상인 자료를 표로 정리해야하는 경우가 있습니다. 예를들어 독립변수가 거주지, 성별이고 종속변수가 인구 수인 경우를 생각해봅시다.

독립변수 : 거주지, 성별
종속변수 : 인구 수 

표로 정리하면 아래와 같습니다. 

 

 

파이썬 시리즈에서 위 표를 정의해봅시다. 

 

import pandas as pd
import numpy as np

#데이터 생성
sr1=pd.Series([50,50,30,30,20,20],
                index=[['서울','서울','경기','경기','제주',"제주"],['남자','여자','남자','여자','남자','여자']])

 

인덱스를 2차원 리스트로 정의하면 됩니다. 결과는 아래와 같습니다. 

 

>>> sr1
서울  남자    50
    여자    50
경기  남자    30
    여자    30
제주  남자    20
    여자    20
dtype: int64
반응형

댓글