본문 바로가기
수업(국비지원)/Python

[Python] 시각화

by byeolsub 2023. 4. 25.

 📌

### 시각화
# 연비와 차량의 무게의 관계를 시각화 하기
'''
 산점도 : 두개 컬럼의 각각의 값들을 x,y 축에 점으로 표현
          값의 분포를 알 수 있다. 
          컬럼사이의 관계를 시각화 한다.
'''
mpg.plot(x="mpg",y="weight",kind="scatter")

# 히스토그램 : 데이터의 빈도수 시각화. 데이터의 분포를 시각화
#             kind="hist"
mpg.mpg.plot(kind="hist")


 📌

import pandas as pd #pd defined에러뜨면 다시 임폴트

#남북한 발전전력량.xlsx 파일을 읽어 df에 저장하기
df = pd.read_excel("data/남북한발전전력량.xlsx")
df
df.head()
df.tail()

#0,5행 데이터의 2열 이후의 정보만 ndf에 저장하기
ndf = df.iloc[[0,5],2:]
ndf

#선그래프
ndf.plot() #컬럼별 선그래프 작성
ndf.info()

#남한,북한별로 그래프 작성 필요 : 남한,북한 컬럼으로,
#행과 열을 바꿔야함.
#전치행렬 : 행과 열이 바뀌는 행렬
ndf2 = ndf.T
ndf2
#컬럼명 변경하기
ndf2.columns=["South","North"]
ndf2.info()

#선그래프로 출력하기
ndf2.plot() #범례 : 컬럼명

51,52: 전치행렬결과 53,54: 컬럼명변경
55 선그래프 출력

# 막대그래프로 출력
ndf2.plot(kind="bar") # 범례 : 컬럼명. 컬럼한개 : 막대한개
ndf2.info()

#데이터 값을 정수형(숫자형)으로 변환
ndf2 = ndf2.astype(int)
ndf2.info()

# 히스토그램. 데이터의 빈도수 
ndf2.plot(kind="hist")

55 막대그래프 출력