본문 바로가기

수업(국비지원)/Python86

[Python] drinks.csv 파일 분석하기4 ################################# # 전세계 음주 데이터 분석하기 : drinks.csv import pandas as pd drinks = pd.read_csv("data/drinks.csv") drinks.info() ''' country : 국가명 beer_servings : 맥주소비량 spirit_servings : 음료소비량 wine_servings : 와인소비량 total_litres_of_pure_alcohol : 순수 알콜량 continent : 대륙명 ''' drinks.head() 📌 ''' total_servings 전체 술소비량을 막대그래프로 작성하고, 대한민국의 위치를 빨강색으로 표시하기 1.total_serving_rank = drinks[["count.. 2023. 4. 26.
[Python] drinks.csv 파일 분석하기3 ################################# # 전세계 음주 데이터 분석하기 : drinks.csv import pandas as pd drinks = pd.read_csv("data/drinks.csv") drinks.info() ''' country : 국가명 beer_servings : 맥주소비량 spirit_servings : 음료소비량 wine_servings : 와인소비량 total_litres_of_pure_alcohol : 순수 알콜량 continent : 대륙명 ''' drinks.head() 📌 ################ import numpy as np import matplotlib.pyplot as plt #대한민국은 얼마나 술을 독하게 마시는 나라인가? #전체.. 2023. 4. 26.
[Python] drinks.csv 파일 분석하기2 - 막대그래프시각화 📌 # 대륙별 spirit_servings의 평균, 최소, 최대, 합계를 출력 #1 # 평균 drinks.groupby("continent")["spirit_servings"].mean() # 최소 drinks.groupby("continent")["spirit_servings"].min() # 최대 drinks.groupby("continent")["spirit_servings"].max() # 합계 drinks.groupby("continent")["spirit_servings"].sum() #2 drinks.groupby("continent")["spirit_servings"].agg(["mean","min","max","sum"]) # 대륙별 알콜량의 평균이 전체 알콜량 평균보다 많은 대륙을 조회.. 2023. 4. 26.
[Python] drinks.csv 파일 분석하기1 📌 ################################# # 전세계 음주 데이터 분석하기 : drinks.csv import pandas as pd drinks = pd.read_csv("data/drinks.csv") drinks.info() ''' country : 국가명 beer_servings : 맥주소비량 spirit_servings : 음료소비량 wine_servings : 와인소비량 total_litres_of_pure_alcohol : 순수 알콜량 continent : 대륙명 ''' drinks.head() # 변수 = 컬럼 = 피처 # 상관계수 : 두개의 연속적인 데이터의 상관관계를 수치로 표현 beer_wind_corr =\\ drinks[["beer_servings","wine.. 2023. 4. 26.
[Python] chipo.tsc 파일 분석하기2 📌 # item_name 별 단가를 조회하기 # item_name으로 groupby하여 최소값이 단가 price_one = chipo.groupby("item_name").min()["item_price"] price_one #단가의 분포를 히스토그램으로 출력하기 #1 import matplotlib.pyplot as plt from matplotlib import rc rc('font', family='Malgun Gothic') plt.hist(price_one) plt.ylabel("상품갯수") plt.xlabel("상품단가 분포") #2 price_one.plot(kind="hist") plt.ylabel("상품갯수") plt.xlabel("상품단가 분포") # 단가가 가장 높은 상품 10개만 조.. 2023. 4. 26.
[Python] chipo.tsc 파일 분석하기1 📌 ''' 데이터 속성 설명 order_id : 주문번호 quantity : 아이템의 주문수량 item_name : 주문한 아이템의 이름 choice_description : 주문한 아이템의 상세 선택 옵션 item_price : 주문 아이템의 가격 정보 ''' ### chipo.tsc 파일 분석하기 # 파일 읽기 import pandas as pd chipo = pd.read_csv("data/chipotle.tsv",sep="\\t") chipo.info() # chipo 데이터의 행열의 갯수 출력하기 chipo.shape # 컬럼명들 출력하기 chipo.columns # index(행)의명 출력하기 chipo.index # 결과 -> RangeIndex(start=0, stop=4622, step=.. 2023. 4. 26.
[Python] 반정형 데이터 - BeautifulSoup 모듈2 ''' 2022-12-09 복습 범주형 데이터 : 값의 범위를 가진 데이터. describe() 함수에서 조회시 제외. 날짜 데이터 : pandas.date_range() : 날짜값을 범위 지정해서 조회 df["Date"] : datetime 형 df["Date"].dt.year : 년도 df["Date"].dt.month : 월 df["Date"].dt.day : 일 형변환 : astype("자료형") : str,int,float,category.... str : DataFrame의 요소들을 문자열처럼 사용. 문자열 함수 사용가능 df["aaa"].str.startsWidth("")... === 그룹화 : DataFrame을 컬럼의 값으로 데이터 분리 groupby(컬럼명) : DataFrame 객체를.. 2023. 4. 26.
[Python] 반정형 데이터 - BeautifulSoup 모듈1 #################################### # 빅데이터의 종류 # 1. 정형 데이터 : csv, excel, db table # => pandas 사용하여 데이터 읽어 옴. # 2. 반정형 데이터 : html, xml, json,... # => 크롤링 이용. 네트워크를 이용하여 외부에서 데이터를 읽어서 가져옴. # BeautifulSoup, Selenium 모둘 사용 # 3. 비정형 데이터 : 이미지, 동영상,... ##################################### 📌 # BeautifulSoup : html,xml 파싱해주는 모듈 from bs4 import BeautifulSoup import urllib.request as req # 인터넷을 통해서 요청할 .. 2023. 4. 26.