데이터 분석

세계 GDP 분석 (2)

너굴맨_ 2021. 11. 1. 10:55
더보기

GDP Top 10의 국가 비중을 확인해보자

  • 하나의 테이블로 국가 GDP 병합하기
  • 전세계 GDP - Top10 GDP = others 라는 컬럼 생성하기
  • 각 국가를 세계 총합으로 나눈 뒤 소수점 2자리로 반올림하여 나타내기
#-------------------------------------------------------
# step 2. GDP top10 국가의 전세계 비율을 파악해보자
#----------------------------------------------------

# 1. 국가별 GDP를 하나로 병합하기 (merge)
world_gdp= wld_gdp
world_gdp = pd.merge(wld_gdp, usa_gdp, how="left") 
world_gdp = pd.merge(world_gdp, kor_gdp, how="left")
world_gdp = pd.merge(world_gdp, deu_gdp, how="left")
world_gdp = pd.merge(world_gdp, jpn_gdp, how="left")
world_gdp = pd.merge(world_gdp, gbr_gdp, how="left")
world_gdp = pd.merge(world_gdp, chn_gdp, how="left")
world_gdp = pd.merge(world_gdp, fra_gdp, how="left")
world_gdp = pd.merge(world_gdp, ita_gdp, how="left")
world_gdp = pd.merge(world_gdp, can_gdp, how="left")
world_gdp = pd.merge(world_gdp, ind_gdp, how="left")

world_gdp
# 2. 전세계 - top 10 국가를 뺀 others라는 칼럼 생성하기
world_gdp['Others'] = world_gdp['World'] - world_gdp.iloc[:, [2,3,4,5,6,7,8,9,10,11]].sum(axis=1)
# 3. 전세계의 비율을 알아보기 위해 World로 나눈 뒤 소수점 2자리로 반올림
temp = world_gdp['Year']
temp2 = world_gdp.drop(columns=['Year'])
temp3 = round(temp2.apply(lambda x: x/x.max(), axis=1),2) * 100   # apply를 활용
temp4 = temp3.drop(columns=['World'])

world_gdp_prop = pd.concat([temp, temp4], axis=1)

world_gdp_prop

위 표를 통해 확인할 수 있는 것은

1. 미국의 GDP 비율은 감소, 중국의 GDP 비율은 증가했다.

2. Others 즉 top10 국가를 제외한 비율이 1/3 가량을 계속해서 유지하고 있다는 것을 알 수 있다.

3. (미국 + 중국)은 전세계 40% GDP를 차지한다. 

4. 미국, 중국을 제외한 8개의 국가가 약 25%를 차지한다.

- 2020년대 각 국가별 GDP 비율을 파이 그래프로 확인해보자

# 2020년 기준 국가별 비율을 알아보자
world_gdp_2020 = world_gdp_prop.iloc[-1,:]
world_gdp_2020 = world_gdp_2020.drop('Year')

# pie 차트 형태로 나타내기
colors = ['red', 'orange', 'yellow', 'green', 'skyblue', 'blue','purple','gray','olive','yellowgreen','lightskyblue']

world_gdp_2020.plot.pie(autopct='%.2f%%', colors=colors)

- 2018, 2019 년도 GDP 비율과 비교해보자

2020년의 경우 코로나의 영향력이 일부 반영되어 있을 가능성이 있다고 생각이 들어 2018년, 2019년도를 통해 큰 변화가 있었는지 그래프로 확인해보자.

 

# 2018, 2019년도의 비율을 파악해보자
world_gdp_2019 = world_gdp_prop.iloc[-2, :]
world_gdp_2018 = world_gdp_prop.iloc[-3, :]

world_gdp_2019 = world_gdp_2019.drop('Year')
world_gdp_2018 = world_gdp_2018.drop('Year')

# 년도별 파이차트 확인 2020, 2019, 2018
plt.figure(figsize=(20,10))
plt.subplot(131)
plt.title('2020')
plt.pie(world_gdp_2020, autopct='%.2f%%',colors=colors)
plt.subplot(132)
plt.title('2019')
plt.pie(world_gdp_2019, autopct='%.2f%%', colors=colors)
plt.subplot(133)
plt.title('2018')
plt.pie(world_gdp_2018, autopct='%.2f%%', colors=colors)

위 그래프를 통해 확인할 수있는 것

1. 미국, 중국은 꾸준히 증가하였다

2. others는 감소하였다.

3. 1,2를 제외한 국가는 크게 바뀌지 않았다.