월별 출생건수 (1)에 이어 한국 사례가 아닌 외국 사례를 살펴보자
(1)에서 활용한 코드를 그대로 데이터만 변경하여 진행하였으며 살펴볼 국가로는 미국, 일본, 독일, 필리핀, 남아프리카, 브라질, 호주를 선택하여 진행함. ( 중국, 인도는 UN에서 데이터를 제공하지 않으므로 제외)
- 미국
미국은 7월부터 9월에 태어나는 아이가 제일 많으며 2월, 4월이 제일 적게 태어났다. 또한 8월과 2월의 태어난 아이의 차이는 무려 30만으로 큰 차이가 보인다.
임신하는 달의 측면으로 보았을 때 11월이 제일 많았으며 특징으로 10월부터 1월 즉 연말에 많이 몰려있는 것을 볼 수 있다.
- 일본
일본도 미국과 비슷하게 7월부터 10월에 태어나는 아이가 많았으며 2월에 태어난 아이의 수가 비교적 적다는 것을 확인할 수 있다.
임신한 달의 측면으로 볼 때 10월에 임신한 경우가 제일 많았으며 미국의 사례처럼 10월 ~ 1월 즉 연말에 임신한 경우가 많은 특징이 보인다.
- 독일
독일도 미국 ,일본과 같이 태어난 달은 7월이 제일 많고 2월, 11월에 태어난 아이의 수가 제일 적다.
임신한 달의 측면으로 볼 때 10월에 임신한 경우가 제일 많으며 미국, 일본 사례와 비슷하게 10월~1월 즉 연말에 임신한 경우가 제일 많은 것으로 보인다.
- 필리핀
필리핀의 경우 위의 국가들과 다르게 9월에 태어난 아이가 제일 많았으며 이어지는 10월부터 1월까지 출생 건수가 많은 것을 볼 수 있다. 제일 적게 태어난 월은 2월로 제일 많은 달인 9월과 무려 22만이나 차이가 날 정도로 격차가 큰 것을 볼 수 있다.
임신한 달 측면으로 볼 때 12월에 임신한 경우가 많으며 그 이어 1월~3월까지 이어지는 양상을 보인다. 위의 3개의 나라와 같이 5월에 임신한 경우가 제일 적은 것으로 보인다.
- 남아프리카
남아프리카의 경우 위에서 살펴본 국가들과 큰 차이가 보이며 3월에 태어난 아이가 제일 많으며 11월에 태어난 아이가 제일 적으며 위 국가들의 출생 양상과 가장 큰 차이점으로 위 국가들에서는 출생 특징이 연속적으로 이어지는 점이 보였으나 남아프리카의 경우 이러한 양상이 적은 것을 볼 수 있다.
임신한 달 측면으로 볼 때 6월에 임신한 경우가 많고 12월이 뒤를 이었으며 연 초에 임신한 경우가 적은 양상이 보인다.
- 브라질
브라질의 경우 남아프리카와 같이 3월에 태어난 아이가 제일 많았으며 4월부터 7월까지 위 양상이 지속되었다. 태어난 아이가 제일 적은 달은 11월로 10월부터 12월에 태어난 아이가 적은 양상이 이어졌다.
임신한 달의 측면으로 볼 때 6월부터 10월까지 임신을 많이한 것으로 보이며 연 초인 1월부터 3월까지 임신을 적게 한 양상이 보인다.
- 호주
호주 역시 남아프리카, 브라질과 같이 3월에 태어난 아이가 제일 많으며 연말인 11월, 12월에 태어난 아이가 적은 것을 양상이 나타난다. 남아프리카와 비슷하게 시즌적 특징 요소가 잘 나타나지 않는 것으로 보인다.
임신한 달 측면으로 볼 때 6월, 8월에 임신한 경우가 많고 연 초인 2월, 3월에 제일 적은 것을 보인다.
가설
위의 데이터 분석 결과를 통해 아래와 같은 가설을 설정하였으며 미국, 일본, 독일의 경우 북반구에 위치한 국가이며 남아프리카, 브라질, 호주의 경우 남반구에 위치한 국가들이다. 따라서 6월부터 8월의 경우 겨울 시즌이다.
※ 가설 설정 원인은 위의 결과를 참조하여 저의 개인적인 견해로 설정하였습니다. 가설 설정과 관련된 논문 및 관련자료 등 아래의 가설의 근거가 부족함을 알립니다.
1. 겨울철에 임신한 케이스가 많다.
겨울철에 추위로 인한 유동 인구 감소가 임신 케이스를 높이는 원인이 되었다.
2. 5월에 임신한 케이스가 적다.
일 수가 제일 적은 2월보다 5월에 임신한 케이스가 제일 적다. 이와 직접적인 원인은 알 수 없으나 가설 1번과 관련하여 생각하면 5월의 활동에 적합한 날씨로 인한 유동 인구 증가로 인해 임신한 케이스가 줄어들었다.
'데이터 분석 > 머신러닝' 카테고리의 다른 글
[PySpark] 숙박업 분석 - (3) ML (0) | 2022.04.14 |
---|---|
Numpy의 함수를 사용한 서바이벌 게임 (0) | 2022.02.24 |
2020년도 GDP와 인구지표 (2) - K-means Clustering (0) | 2021.12.18 |
2020년도 GDP 와 인구 지표 (1) - 회귀 분석 (0) | 2021.12.17 |
서울 생활이동 데이터 분석(4) - 연관 분석 (0) | 2021.12.03 |
댓글