본문 바로가기

분류 전체보기502

[Python] 지도를 이용한 시각화2 📌 # 경기도의 인구 데이터와 위치 정보를 이용하여 인구를 지도에 표시하기 import pandas as pd import folium import json # json형태의 파일을 처리하기 위한 모듈 #1 경기도 인구 데이터를 읽어 df 변수에 저장하기. 구분컬럼을 인덱스로 지정 df = pd.read_excel("data/경기도인구데이터.xlsx",index_col='구분') df.info() df.columns # 컬럼명의 자료형이 정수형 # 컬럼의 자료형을 문자열형으로 변경하기 df.columns = df.columns.map(str) df.columns # 컬럼명의 자료형이 문자열형 #2 위치정보를 가지고 잇는 경기도행정구역경계.json 파일 읽기 # 경기도행정구역경계.json 파일의 내용을 읽.. 2023. 4. 25.
[Python] 지도를 이용한 시각화1 📌 ### 지도 시각화 # folium 모듈 사용하기 # pip install folium ('a', 1, '가') ('b', 2, '나') ('c', 3, '다') listall = zip(lista, list1, list2) for d in listall : print(d) # 원형 마커 추가하기 # CircleMarker : 마커의 모양을 설정 할 수 있음. df = pd.read_excel("data/서울지역 대학교 위치.xlsx",index_col=0) seoul_map = folium.Map(location=[37.55,126.98],zoom_start=12) for name,lat,lng in zip(df.index, df.위도, df.경도) : folium.CircleMarker([lat,.. 2023. 4. 25.
[Python] 시각화 - seaborn 모듈을 이용한 그래프(distplot,kdeplot,histplot 등) ''' 2022-12-05 복습 pandas 함수 info() : 기본정보를 제공. 컬럼이 몇개고 인덱스가 몇개이며 notnull이 몇개인지 등 알 수 있다. unique() : 중복없이 한개의 데이터만 조회. value_counts() : 데이터별 등록된 건수. 건수의 내림차순으로 정렬. groupby(컬럼명) : 컬럼의 값으로 레코드를 그룹화. Oracle이랑 비슷.(컬럼을 기준으로 그룹화) 그룹별 통계자료 조회 가능. # 시각화 과정 ------------------------------- seaborn 모듈을 이용한 그래프 regplot : 산점도 + 회귀선. 선형회귀분석(머신러닝의 하나의 알고리즘으로 들어간다.) ''' 📌 import seaborn as sns import matplotlib... 2023. 4. 25.
[Python] seaborn 모듈 - 시각화 모듈 선형회귀 그래프 📌 ### seaborn 모듈 : 시각화 모듈 + 데이터셋 # matplot 모듈의 확장형. 고급시각화 # 선형회귀 그래프 : 산점도 + 회귀도 표시 # 회귀선 : 모든점에서 가장 가까운 점들을 선으로 표시 import seaborn as sns import matplotlib.pyplot as plt titanic = sns.load_dataset("titanic") titanic.info() titanic[["age","fare"]].corr() ''' regplot : 선형회귀 그래프 : 산점도 + 회귀도 표시 fit_reg=False : 회귀선 표시 안함. ''' fig = plt.figure(figsize=(15,5)) ax1 = fig.add_subplot(1,2,1) ax2 = fig.add.. 2023. 4. 25.
[Python] matplot 시각화 모듈 - 박스그래프 📌 ### 박스그래프 : 두개의 그래프 출력하기 fig = plt.figure(figsize=(15,5)) # 그래프 출력영역, 크기 지정 # 그래프 출력영역을 분리 ax1 = fig.add_subplot(1,2,1) # 1행 2열 첫번째 그래프 영역 ax2 = fig.add_subplot(1,2,2) # 1행 2열 두번째 그래프 영역 ''' boxplot : matplot 모듈 함수. 박스그래프 출력 df[df['origin'] == 'usa']['mpg'] : origin 컬럼의 값이 usa인 행만 조회. mpg 컬럼만 가지고 옴 df[df['origin'] == 'japan']['mpg'] : origin 컬럼의 값이 japan인 행만 조회. mpg 컬럼만 가지고 옴 df[df['origin'] =.. 2023. 4. 25.
[Python] matplot 시각화 모듈 - 파이그래프 📌 # 파이그래프 # origin 컬럼 : 제조국. [usa,japan,europe] df_origin = df.origin.value_counts() df_origin type(df_origin) #1 df_origin.plot(kind="pie") # 파이그래프 plt.title("자동차 생산국",size=20) plt.legend(labels=df_origin.index, loc="upper left") #2 # autopct="%.1f%%" : 파이그래프에 비율 표시 # %1.f : 소숫점 이하 1자리로 표시 # %% : %문자를 의미. # startangle=90 : 기본설정 위치에서 90도로 시작위치를 변경 df_origin.plot(kind="pie", figsize=(7,5), autopc.. 2023. 4. 25.
[Python] matplot 시각화 모듈 - 히스토그램 📌 # 자동차 연비데이터의 mpg 값을 히스토그램으로 출력하기 import seaborn as sns df = sns.load_dataset("mpg") import matplotlib.pyplot as plt plt.style.use("ggplot") # 그래프의 style 설정 plt.rc('font', family="Malgun Gothic") # 한글폰트 설정 df.info() # 히스토그램으로 출력 df["mpg"].plot(kind="hist") # 간격을 20개로 분리하여 히스토그램으로 출력 #1 (그래프에서 막대 사이 간격이 나올때) df["mpg"].plot(kind="hist",bins=20,color='coral',figsize=(10,5), edgecolor='white') plt... 2023. 4. 25.
[Python] matplot 시각화 모듈 - 연합 막대그래프 ''' 2022-12-02 복습 DataFrame.plot(kind="그래프 종류") 함수를 이용하여 그래프 작성. 기본 : 선그래프 kind="bar" : 막대그래프 kind="bath" : 수평막대그래프 kind="hist" : 히스토그램 kind="scatter" : 산점도 kind="box" : 박스그래프 matplot 시각화 모듈 rc("font", family="Malgun Gothic") : 한글폰트 설정 ''' 📌 ###### matplot 모듈을 이용한 그래프 import matplotlib.pyplot as plt # x축 데이터 내용 subject = ["Oracel", "Python", "Sklearn", "Tensorflow"] # y축 데이터 값 score = [65,90,85,.. 2023. 4. 25.