반응형
독립변수가 두개 이상인 자료를 표로 정리해야하는 경우가 있습니다. 예를들어 독립변수가 거주지, 성별이고 종속변수가 인구 수인 경우를 생각해봅시다.
독립변수 : 거주지, 성별
종속변수 : 인구 수
표로 정리하면 아래와 같습니다.
파이썬 시리즈에서 위 표를 정의해봅시다.
import pandas as pd
import numpy as np
#데이터 생성
sr1=pd.Series([50,50,30,30,20,20],
index=[['서울','서울','경기','경기','제주',"제주"],['남자','여자','남자','여자','남자','여자']])
인덱스를 2차원 리스트로 정의하면 됩니다. 결과는 아래와 같습니다.
>>> sr1
서울 남자 50
여자 50
경기 남자 30
여자 30
제주 남자 20
여자 20
dtype: int64
반응형
'5-3. Pandas 제공 자료구조 > Series' 카테고리의 다른 글
[파이썬 판다스] 시리즈에서 데이터를 분할표로 만들기 (unstack) (0) | 2022.02.24 |
---|---|
[파이썬 판다스] 시리즈의 특정 값을 na 로 바꾸기 (0) | 2022.02.07 |
[파이썬 판다스] 시리즈 원소 중 NaN 제거 (0) | 2022.01.13 |
[파이썬 판다스] 시리즈 원소 중 NaN 확인 (isnull) (0) | 2022.01.13 |
[파이썬 판다스] 시리즈 원소 개수 (0) | 2022.01.12 |
댓글