항해99/파이썬 데이터분석 첫걸음

[스파르톤] 파이썬 데이터 분석 - (5)상권과 유동인구 같이 분석 + 숙제

숲별 2022. 9. 19. 03:56
728x90

<상권과 유동인구 같이 분석>

pandas의 .DataFrame을 활용해서 새로운 데이터를 만듦.

새로운 데이터프레임안에는 chicken_count_gu가 들어갈 거고 index까지 싹 다시 설정

 

  • 상권데이터가져오기

참고↓

=>원래 chicken_count_gu의 데이터

 

 

  • 유동인구 데이터 가져오기

 

  • 유동인구랑 상권 데이터 합치기
gu_chicken = new_chicken_count_gu.join(new_sum_of_population_by_gu.set_index('군구'), on='구')
gu_chicken

치킨 상권 데이터에 유동인구데이터를 합친다. 유동인구의 군구를 기준으로 치킨상권 구랑 합쳐줌 .join()

 

  • 치킨집 당 유동인구수 구하기
gu_chicken['유동인구수/치킨집수'] = gu_chicken['유동인구수']/gu_chicken['상권업종소분류명']
gu_chicken = gu_chicken.sort_values(by='유동인구수/치킨집수')
gu_chicken

  • 그래프 그려서 확인하기

위 그래프만 보고 송파구가 유동인구가 많은 건지, 치킨집이 적은 건진 알 수 없다.

유동인구가 많다고 장사가 꼭 잘 된다. 꼭 진리가 되는 건 아님

그치만 통념상 치킨 집은 적고 유동인구수는 많으면 치킨집에 많이 오지 않을까 가설을 세우고 근거데이터를 이렇게 만들 수 있다.

장사가 잘 된다. 할 수는 없겠지만 잘되는 조건 중 하나이다라고 얘기할 근거가 될 수 있다.

 

 

<숙제>

Q1. 4월의 유동인구가 가장 많은 구는 어디인가요?

 

population04=pd.read_csv('./data/population04.csv')

사월유동인구=population04.groupby('군구')['유동인구수'].sum().sort_values(ascending=True)

plt.figure(figsize=(10,5))
plt.bar(사월유동인구.index,사월유동인구)
plt.title('4월 지역별 유동인구')
plt.xlabel('구')
plt.ylabel('유동인구수')
plt.xticks(rotation=45)
plt.show()

 

 

 

 

Q2. 4월과 7월의 강남구의 일별 유동인구는 어떤가요

사월강남일별유동인구=population04[population04['군구']=='강남구'].groupby('일자')['유동인구수'].sum()
사월강남일별유동인구


plt.figure(figsize=(10,5))

date04=[]
date07=[]

for day in 사월강남일별유동인구.index:
    date04.append(str(day))
    
for day in population_gangnam_daily.index:
    date07.append(str(day))

plt.plot(date04,사월강남일별유동인구)
plt.plot(date07,population_gangnam_daily)
plt.title('2020년 4월과 7월 서울 강남구 날짜별 유동인구 수')
plt.xlabel('날짜')
plt.ylabel('유동인구 수(천만명)')
plt.xticks(rotation=-90)
plt.show()