이번에는 국가별 중간 나이대를 알아보자.
1. 중간 나이대 통계량 파악하기
전세계 나이대의 평균은 30대로 보이며 대부분 24~37세 사이의 인구 연령을 보인다.
2. 젊은 층의 국가 vs 장수 국가
젊은 층의 국가들은 대다수가 아프리카 쪽에 위치하는 국가들로 나타났다.
장수 국가로 대표적으로 일본, 이탈리아, 그리스가 있으며 한국 역시 44세로 장수 국가 목록에 포함되어 있다.
3. 분포를 통해 파악하자
위 분포를 보면 정규분포 형태가 아닌 균일분포 형태에 더 가깝다는 것을 볼 수 있다. 다시 말해 국가별 혹은 문화권에 따라 연령 비중이 상이한 형태를 띤다고 볼 수 있다.
해석
1. 중간 나이대의 평균은 30대로 나타난다.
2. 젊은 층의 나이대를 가진 국가는 대다수 아프리카에 위치하며 나이대는 10대 후반인 것을 보면 의료서비스 부족 혹은 전쟁, 기아 문제 등 오랫동안 생존하기 힘든 국가일 가능성이 크다.
3. 장수 국가 나이대를 가진 국가는 유럽 국가 및 한국, 일본으로 의료서비스가 비교적 잘 되어 있는 국가이거나 출산율이 저조해 인구 연령비율이 높은 국가로 해석할 수 있다.
4. 위의 중간 나이대의 분포를 통해 국가별, 지역별, 문화권 등 다양한 환경에 따른 연령층이 다양하게 분포되어 있을 가능성이 크다. 쉽게 말해 국가별로 비슷한 형태의 연령층이 있을 경우 정규분포의 형태를 따르지만 위의 분포는 균일분포 의 형태에 더 가까운 것을 보면 문화권, 지역 환경에 따라 연령층의 변동이 크다고 볼 수 있다.
코드
분석 진행 시 분포의 특징을 확인하기 위해 누락된 값은 제외하여 진행하였습니다.
### 3.1 전체 평균 및 통계량 파악하기
data['Median Age'].describe()
### 누락된 값을 제외하고 확인하기
med_age = data2['Median Age']
#med_age
med_age = data2[['Country','Median Age']]
med_age = med_age.sort_values(by='Median Age')
count_med_age = data2['Median Age'].value_counts()
count_med_age = pd.DataFrame(count_med_age)
count_med_age.reset_index(inplace=True)
count_med_age.columns = ['Median Age', 'Counts']
count_med_age = count_med_age.sort_values(by = 'Median Age')
## 3.2 젊은 나이대의 연령층을 가지는 나라는?
med_age.head(20)
## 3.2 나이든 연령층을 가지는 나라는?
med_age = med_age.sort_values(by='Median Age', ascending=False)
med_age.head(20)
### 3.3 분포를 통해 파악하자
plt.figure(figsize = (8,5))
plt.bar(count_med_age['Median Age'], count_med_age['Counts'])
plt.xlabel('중간 나이', fontsize=15)
plt.ylabel('count')
'데이터 분석' 카테고리의 다른 글
2020년 전세계 인구 지표 (6) - 인구밀도 확인하기(P/Km²) (0) | 2021.12.13 |
---|---|
2020년 전세계 인구 지표 (5) - 인구 증감 살펴보기 (0) | 2021.12.12 |
2020년 전세계 인구 지표 (3) - 출산율 분포 파악하기 (0) | 2021.12.10 |
2020년 전세계 인구 지표 (2) - 인구 수 파악하기 (0) | 2021.12.09 |
2020년 전세계 인구 지표 (1) - 데이터 설명 및 전처리 (0) | 2021.12.08 |
댓글