항해99/파이썬 데이터분석 첫걸음 5

[스파르톤] 파이썬 데이터 분석 - (5)상권과 유동인구 같이 분석 + 숙제

pandas의 .DataFrame을 활용해서 새로운 데이터를 만듦. 새로운 데이터프레임안에는 chicken_count_gu가 들어갈 거고 index까지 싹 다시 설정 상권데이터가져오기 참고↓ =>원래 chicken_count_gu의 데이터 유동인구 데이터 가져오기 유동인구랑 상권 데이터 합치기 gu_chicken = new_chicken_count_gu.join(new_sum_of_population_by_gu.set_index('군구'), on='구') gu_chicken 치킨 상권 데이터에 유동인구데이터를 합친다. 유동인구의 군구를 기준으로 치킨상권 구랑 합쳐줌 .join() 치킨집 당 유동인구수 구하기 gu_chicken['유동인구수/치킨집수'] = gu_chicken['유동인구수']/gu_chic..

[스파르톤] 파이썬 데이터 분석 - (4)유동인구 데이터 전처리 및 시각화

(1)라이브러리 불러오기 import pandas as pd (2)데이터 불러오기 (3)데이터 살펴보기 (4)컬럼 살펴보기 list(population), len(list(population)) =>(['일자', '시간(1시간단위)', '연령대(10세단위)', '성별', '시', '군구', '유동인구수'], 7) (5)살펴볼 컬럼 정하기 연령대(10세 단위) set(population['연령대(10세단위)']), len(set(population['연령대(10세단위)'])) =>({20, 30, 40, 50, 60, 70}, 6) 시 set(population['시']) =>{'서울'} 군구 set(population['군구']), len(set(population['군구'])) =>({'강남구', '강..

[스파르톤] 파이썬 데이터 분석 - (3)상권 데이터 전처리, 시각화; 지도그래프

데이터 불러오기 → 데이터 살펴보기 → 데이터 가공하기 → 데이터 시각화 1.바그래프 : 각 항목들의 수치와 순위를 볼 때 좋아요 2.라인그래프 : 이전 항목들 혹은 흐름에 따라 데이터의 관계를 볼 때 좋아요 ex.시간의 흐름에 따른 수치 3.파이차트: 비율을 볼 때 좋아요 4.히트맵 : 두 개의 축의 수치를 한 눈에 보기 좋아요 5.지도 : 지리 정보를 한 눈에 보기 좋아요 import pandas as pd pandas를 pd라는 이름으로 쓸게 commercial = pd.read_csv('./data/commercial.csv') commercial 자료 불러오기 commercial.tail(5) 너무 자료가 많으니 끝에 5개만 일단 보자 list(commercial), len(list(commer..

[스파르톤] 파이썬 데이터 분석 - (2)pandas, Matplotlib

기본적인 데이터 분석은 엑셀로 가능하고 엑셀이 더 좋은 면도 있지만 엄청 많은 양의 데이터와 큰 용량의 파일을 다루는데는 너무 오래 걸린다. 반복작업이 귀찮아 질 수도 있고 비어있는 데이터 채울 때 파이썬을 쓰면 좋다. 파이썬에서 사용되는 데이터 분석 라이브러리 입니다. 관계형 데이터를 행과 열로 구성된 객체로 만들어 줍니다. 우리가 불러온 데이터를 다루기 쉽게 도와주는 도구입니다. 글로 읽어서는 잘 이해가 되지 않으니 실제로 써보면서 익혀봅시다. 파이썬에는 다양한 라이브러리들이 있습니다. 내가 원하는 기능을 구현해서 쓰기보다는, 이미 구현된 기능이 있는지 찾아보고 어떻게 쓰는 건지 공부해서 활용하는 경우가 훨씬 많을꺼에요. 판다스를 사용하려면 가장 먼저 해야할 일은 '판다스를 불러오는 것' 입니다. i..

[스파르톤] 파이썬 데이터 분석 - (1)프로그램 설치와 파이썬 기초문법

제 3회 스파르톤에 참여했다. 다같이 밤샘공부를 하는 이벤트인 것 같다. 스파르톤 기간동안은 무료 강의를 제공해주는데 데이터 분석이 끌려서 선택! 3시간 소요라고 적혀있는데 과연.. 내일 오전 6시까지 다 들을 수 있을까..? https://sparthon-free-course.oopy.io/ 스파르톤 전용 무료강의 제3회 스파르톤 수강생을 위한 스파르톤 전용 무료강의 입니다. sparthon-free-course.oopy.io pandas : 파이썬으로 데이터 분석을 하면서 가장 많이 쓰는 도구 Matplotlib 데이터를 분석하고 그 결과를 시각화 하는 도구 Anaconda 아나콘다는 분석을 도와줄 패키지매니징 플랫폼 물론 아나콘다가 없어도 분석을 할 수는 있어요. 아나콘다를 쓰는 이유는 우리가 개발..