더보기
GDP Top 10의 국가 비중을 확인해보자
- 하나의 테이블로 국가 GDP 병합하기
- 전세계 GDP - Top10 GDP = others 라는 컬럼 생성하기
- 각 국가를 세계 총합으로 나눈 뒤 소수점 2자리로 반올림하여 나타내기
#-------------------------------------------------------
# step 2. GDP top10 국가의 전세계 비율을 파악해보자
#----------------------------------------------------
# 1. 국가별 GDP를 하나로 병합하기 (merge)
world_gdp= wld_gdp
world_gdp = pd.merge(wld_gdp, usa_gdp, how="left")
world_gdp = pd.merge(world_gdp, kor_gdp, how="left")
world_gdp = pd.merge(world_gdp, deu_gdp, how="left")
world_gdp = pd.merge(world_gdp, jpn_gdp, how="left")
world_gdp = pd.merge(world_gdp, gbr_gdp, how="left")
world_gdp = pd.merge(world_gdp, chn_gdp, how="left")
world_gdp = pd.merge(world_gdp, fra_gdp, how="left")
world_gdp = pd.merge(world_gdp, ita_gdp, how="left")
world_gdp = pd.merge(world_gdp, can_gdp, how="left")
world_gdp = pd.merge(world_gdp, ind_gdp, how="left")
world_gdp
# 2. 전세계 - top 10 국가를 뺀 others라는 칼럼 생성하기
world_gdp['Others'] = world_gdp['World'] - world_gdp.iloc[:, [2,3,4,5,6,7,8,9,10,11]].sum(axis=1)
# 3. 전세계의 비율을 알아보기 위해 World로 나눈 뒤 소수점 2자리로 반올림
temp = world_gdp['Year']
temp2 = world_gdp.drop(columns=['Year'])
temp3 = round(temp2.apply(lambda x: x/x.max(), axis=1),2) * 100 # apply를 활용
temp4 = temp3.drop(columns=['World'])
world_gdp_prop = pd.concat([temp, temp4], axis=1)
world_gdp_prop
위 표를 통해 확인할 수 있는 것은
1. 미국의 GDP 비율은 감소, 중국의 GDP 비율은 증가했다.
2. Others 즉 top10 국가를 제외한 비율이 1/3 가량을 계속해서 유지하고 있다는 것을 알 수 있다.
3. (미국 + 중국)은 전세계 40% GDP를 차지한다.
4. 미국, 중국을 제외한 8개의 국가가 약 25%를 차지한다.
- 2020년대 각 국가별 GDP 비율을 파이 그래프로 확인해보자
# 2020년 기준 국가별 비율을 알아보자
world_gdp_2020 = world_gdp_prop.iloc[-1,:]
world_gdp_2020 = world_gdp_2020.drop('Year')
# pie 차트 형태로 나타내기
colors = ['red', 'orange', 'yellow', 'green', 'skyblue', 'blue','purple','gray','olive','yellowgreen','lightskyblue']
world_gdp_2020.plot.pie(autopct='%.2f%%', colors=colors)
- 2018, 2019 년도 GDP 비율과 비교해보자
2020년의 경우 코로나의 영향력이 일부 반영되어 있을 가능성이 있다고 생각이 들어 2018년, 2019년도를 통해 큰 변화가 있었는지 그래프로 확인해보자.
# 2018, 2019년도의 비율을 파악해보자
world_gdp_2019 = world_gdp_prop.iloc[-2, :]
world_gdp_2018 = world_gdp_prop.iloc[-3, :]
world_gdp_2019 = world_gdp_2019.drop('Year')
world_gdp_2018 = world_gdp_2018.drop('Year')
# 년도별 파이차트 확인 2020, 2019, 2018
plt.figure(figsize=(20,10))
plt.subplot(131)
plt.title('2020')
plt.pie(world_gdp_2020, autopct='%.2f%%',colors=colors)
plt.subplot(132)
plt.title('2019')
plt.pie(world_gdp_2019, autopct='%.2f%%', colors=colors)
plt.subplot(133)
plt.title('2018')
plt.pie(world_gdp_2018, autopct='%.2f%%', colors=colors)
위 그래프를 통해 확인할 수있는 것
1. 미국, 중국은 꾸준히 증가하였다
2. others는 감소하였다.
3. 1,2를 제외한 국가는 크게 바뀌지 않았다.
'데이터 분석' 카테고리의 다른 글
서울 생활이동 데이터 분석 (2) (0) | 2021.11.17 |
---|---|
서울 생활이동 데이터 분석 (1) (0) | 2021.11.15 |
세계 GDP 분석(4) (0) | 2021.11.02 |
세계 GDP 분석 (3) (0) | 2021.11.01 |
세계 GDP 분석 (1) (0) | 2021.10.20 |
댓글