728x90
<상권과 유동인구 같이 분석>
pandas의 .DataFrame을 활용해서 새로운 데이터를 만듦.
새로운 데이터프레임안에는 chicken_count_gu가 들어갈 거고 index까지 싹 다시 설정
- 상권데이터가져오기

참고↓

=>원래 chicken_count_gu의 데이터
- 유동인구 데이터 가져오기

- 유동인구랑 상권 데이터 합치기
gu_chicken = new_chicken_count_gu.join(new_sum_of_population_by_gu.set_index('군구'), on='구')
gu_chicken
치킨 상권 데이터에 유동인구데이터를 합친다. 유동인구의 군구를 기준으로 치킨상권 구랑 합쳐줌 .join()

- 치킨집 당 유동인구수 구하기
gu_chicken['유동인구수/치킨집수'] = gu_chicken['유동인구수']/gu_chicken['상권업종소분류명']
gu_chicken = gu_chicken.sort_values(by='유동인구수/치킨집수')
gu_chicken

- 그래프 그려서 확인하기

위 그래프만 보고 송파구가 유동인구가 많은 건지, 치킨집이 적은 건진 알 수 없다.
유동인구가 많다고 장사가 꼭 잘 된다. 꼭 진리가 되는 건 아님
그치만 통념상 치킨 집은 적고 유동인구수는 많으면 치킨집에 많이 오지 않을까 가설을 세우고 근거데이터를 이렇게 만들 수 있다.
장사가 잘 된다. 할 수는 없겠지만 잘되는 조건 중 하나이다라고 얘기할 근거가 될 수 있다.
<숙제>
Q1. 4월의 유동인구가 가장 많은 구는 어디인가요?
population04=pd.read_csv('./data/population04.csv')
사월유동인구=population04.groupby('군구')['유동인구수'].sum().sort_values(ascending=True)
plt.figure(figsize=(10,5))
plt.bar(사월유동인구.index,사월유동인구)
plt.title('4월 지역별 유동인구')
plt.xlabel('구')
plt.ylabel('유동인구수')
plt.xticks(rotation=45)
plt.show()


Q2. 4월과 7월의 강남구의 일별 유동인구는 어떤가요
사월강남일별유동인구=population04[population04['군구']=='강남구'].groupby('일자')['유동인구수'].sum()
사월강남일별유동인구
plt.figure(figsize=(10,5))
date04=[]
date07=[]
for day in 사월강남일별유동인구.index:
date04.append(str(day))
for day in population_gangnam_daily.index:
date07.append(str(day))
plt.plot(date04,사월강남일별유동인구)
plt.plot(date07,population_gangnam_daily)
plt.title('2020년 4월과 7월 서울 강남구 날짜별 유동인구 수')
plt.xlabel('날짜')
plt.ylabel('유동인구 수(천만명)')
plt.xticks(rotation=-90)
plt.show()


'항해99 > 파이썬 데이터분석 첫걸음' 카테고리의 다른 글
[스파르톤] 파이썬 데이터 분석 - (4)유동인구 데이터 전처리 및 시각화 (0) | 2022.09.19 |
---|---|
[스파르톤] 파이썬 데이터 분석 - (3)상권 데이터 전처리, 시각화; 지도그래프 (0) | 2022.09.18 |
[스파르톤] 파이썬 데이터 분석 - (2)pandas, Matplotlib (1) | 2022.09.18 |
[스파르톤] 파이썬 데이터 분석 - (1)프로그램 설치와 파이썬 기초문법 (0) | 2022.09.18 |