본문 바로가기
수업(국비지원)/Python

[Python] 반 정형 데이터 - 한글 분석

by byeolsub 2023. 4. 27.
'''
 한글 분석을 위한 모듈 : konlpy
  pip install konlpy
  시스템 환경 변수 : JAVA_HOME 환경설정 필요
  
  형태소 분석 모듈
    Okt(Open Korea Text)  
    Kkma(코코마) 
    Komoran(코모란) 
    Hannanum(한나눔)
  
'''

 📌

# 반정형 데이터
from konlpy.tag import Okt, Kkma, Komoran, Hannanum
import time
okt = Okt()
kkma = Kkma()
komoran = Komoran()
han = Hannanum() 

def sample_ko_pos(text) :
    print(f"==== {text} ====")
    start = time.time()
    print("kkma:", kkma.pos(text),",실행시간:",time.time()-start)
    start = time.time()
    print("komoran:", komoran.pos(text),"실행시간:",time.time()-start)
    start = time.time()
    print("okt:", okt.pos(text),"실행시간:",time.time()-start)
    start = time.time()
    print("hannamun:", han.pos(text),"실행시간:",time.time()-start)
    print("\\n")
    
text1 = "영실아 안녕 오늘 날씨 어때"
sample_ko_pos(text1)

text2 = "영실아안녕오늘날씨어때"
sample_ko_pos(text2)

text3 = "안녕 ㅎㅏㅅㅔ 요 ㅈㅓ는 ㄷㅐ학생입니다."
sample_ko_pos(text3)