수업(국비지원)/Python
[Python] 반 정형 데이터 - 한글 분석
byeolsub
2023. 4. 27. 12:47
'''
한글 분석을 위한 모듈 : konlpy
pip install konlpy
시스템 환경 변수 : JAVA_HOME 환경설정 필요
형태소 분석 모듈
Okt(Open Korea Text)
Kkma(코코마)
Komoran(코모란)
Hannanum(한나눔)
'''
📌
# 반정형 데이터
from konlpy.tag import Okt, Kkma, Komoran, Hannanum
import time
okt = Okt()
kkma = Kkma()
komoran = Komoran()
han = Hannanum()
def sample_ko_pos(text) :
print(f"==== {text} ====")
start = time.time()
print("kkma:", kkma.pos(text),",실행시간:",time.time()-start)
start = time.time()
print("komoran:", komoran.pos(text),"실행시간:",time.time()-start)
start = time.time()
print("okt:", okt.pos(text),"실행시간:",time.time()-start)
start = time.time()
print("hannamun:", han.pos(text),"실행시간:",time.time()-start)
print("\\n")
text1 = "영실아 안녕 오늘 날씨 어때"
sample_ko_pos(text1)

text2 = "영실아안녕오늘날씨어때"
sample_ko_pos(text2)

text3 = "안녕 ㅎㅏㅅㅔ 요 ㅈㅓ는 ㄷㅐ학생입니다."
sample_ko_pos(text3)
