데이터 분석20 숙박업 분석 - (4) 요약 및 정리 숙박업 분석 (1) ~ (3) 과정에서 나온 결과를 이 장에서 요약하여 설명하겠다. (데이터 시각화에는 Matplotlib과 DataStudio를 결과물을 통해 설명 진행) 주의!! 아래 과정의 데이터의 갱신일자 대다수는 아직 2018년에 머물러있는 데이터가 있습니다. 이 점 유의하여 봐주시길 바랍니다. 지역별로 영업 중인 숙박업의 수는? (세종시 및 창원시는 DataStudio 오류로 인해 미포함) 서울 - 부산 - 제주 (서귀포 포함) - 인천 순으로 나타났으며 광역시를 제외한 도시로 창원 및 여수가 눈에 띄게 많은 것을 알 수 있다. 최근 5년간 영업 개시가 많은 지역 년도 별 영업 시작 및 영업 종료의 빈도 수는? 년도 별로 숙박업이 흥행한 시기와 그렇지 못한 시기를 알아보자. (위에서 언급한 대.. 2022. 4. 20. [PySpark] 숙박업 분석 - (1) 데이터 수집 및 전처리 * 목표 Local Data 사이트에서 제공하는 숙박업 데이터를 다운 받아 데이터 분석 프레임 워크인 PySpark를 활용하여 데이터 분석을 진행하자 * 데이터 수집 분석 과정에 쓰일 데이터는 LocalDATA에서 제공하는 숙박업종 정보 데이터로 아래 사이트에서 데이터를 다운 받을 수 있습니다. https://www.localdata.go.kr/devcenter/dataDown.do?menuNo=20001 LOCALDATA - 지방행정인허가데이터개방:데이터다운로드 전체 데이터다운로드 전체 인허가 데이터에 대한 전체분,월 변동분, 일 변동분에 대한 자료를 제공받을 수 있습니다. 전체 다운로드 선택 업종다운로드 36개 그룹, 190개 업종에 대한 데이터를 업 www.localdata.go.kr * 진행 과정.. 2022. 3. 22. 일별 출생건수 분석 목차 1) 분석 목적 및 데이터 설명 2) 년도별 데이터 분석 (2000년, 2004년, 2009년, 2014년) 3) 년도를 통합하여 데이터 분석 (2000~ 2014) 1) 분석 목적 및 데이터 설명 - 분석 목적 이번 분석은 단순히 언제 생일이 제일 많고 적은 지를 파악하기 위한 분석이다. - 데이터 설명 미국의 2000년도부터 2014년까지 일별 출생건수에 대한 데이터로 미국 사회보장국(SSA)에서 제공한 데이터 - 데이터 출처 위에서 언급한대로 미국 사회보장국 (SSA)에서 제공한 데이터지만 데이터는 아래의 github에 정리한 csv 파일을 사용하여 분석을 진행하였습니다. 데이터 출처 - https://github.com/fivethirtyeight/data/tree/master/births .. 2022. 1. 13. 월별 출생건수(3) - 관련 요소 살펴보기 월별 출생건수 (1)과 (2)에서 알게된 정보를 바탕으로 월별 출생과 관련된 데이터 (월별 평균온도, 혼인신고 데이터)가 얼마나 상관이 있고 설명력을 갖고 있는 지 알아보자. - 사용 데이터 한국 월별 출생아 수 데이터 앞선 (1)에서 설명한 UN에서 제공하는 국가별 출생수 데이터로 이번 분석의 목표인 출산 시기와 관련된 요인을 알아보기 위한 분석이므로 임신한 달에 맞춰 데이터를 변환 2015년 ~ 2019년도 월별 평균 기온 기상청에서 수집한 데이터로 위 년도에 맞춘 평균 기온이 적시됨[1] 혼인 건수 데이터 월별 출생아수와 관련이 있어보이는 데이터로 아래와 같이 수집 산점도 임신한 달과의 상관 관계가 있는 지 산점도를 통해 확인하자 - 온도와 월별 임신한 수의 산점도 위 산점도를 살펴보면 큰 상관관계.. 2022. 1. 11. 월별 출생건수 (2) - 외국 사례 월별 출생건수 (1)에 이어 한국 사례가 아닌 외국 사례를 살펴보자 (1)에서 활용한 코드를 그대로 데이터만 변경하여 진행하였으며 살펴볼 국가로는 미국, 일본, 독일, 필리핀, 남아프리카, 브라질, 호주를 선택하여 진행함. ( 중국, 인도는 UN에서 데이터를 제공하지 않으므로 제외) - 미국 미국은 7월부터 9월에 태어나는 아이가 제일 많으며 2월, 4월이 제일 적게 태어났다. 또한 8월과 2월의 태어난 아이의 차이는 무려 30만으로 큰 차이가 보인다. 임신하는 달의 측면으로 보았을 때 11월이 제일 많았으며 특징으로 10월부터 1월 즉 연말에 많이 몰려있는 것을 볼 수 있다. - 일본 일본도 미국과 비슷하게 7월부터 10월에 태어나는 아이가 많았으며 2월에 태어난 아이의 수가 비교적 적다는 것을 확인할.. 2022. 1. 8. 월별 출생건수 (1) - 한국 사례 월 별 출생 수를 통해 출생과 관련된 요소가 있는지 알아보겠습니다. ■ 데이터 출처 UN에서 제공한 월별 출생 데이터를 통해 전세계의 출생 건수를 파악 http://data.un.org/Data.aspx?d=POP&f=tableCode%3A55 UNdata | record view | Live births by month of birth Demographic Statistics Database The United Nations Statistics Division collects, compiles and disseminates official demographic and social statistics on a wide range of topics. Data have been collected since .. 2022. 1. 7. 이전 1 2 3 4 다음