Programming/AI
KoNLPy(코넬파이) 설치 및 트위터 형태소 분석기 api 예제
제타
2018. 7. 1. 10:31
반응형
출처 - 코넬파이 홈페이지
파이썬을 활용하여 트위터 형태소를 분석해보자.
먼저 g++ jdk8 python-dev 등을 설치한다.
(base) root@91fd4687e0df:/ai# apt-get install g++ openjdk-8-jdk python-dev python3-dev
그리고 코넬파이(konlpy)를 설치한다.
(base) root@91fd4687e0df:/ai# pip install konlpy
그리고 예제를 돌려보기 위해 jpype1을 모듈을 설치한다.
(base) root@91fd4687e0df:/ai# pip install jpype1
그럼 예제를 돌려보자.
from konlpy.tag import Twitter
twitter = Twitter()
print(twitter.morphs(u'단독입찰보다 복수입찰의 경우'))
print(twitter.nouns(u'유일하게 항공기 체계 종합개발 경험을 갖고 있는 KAI는'))
print(twitter.phrases(u'날카로운 분석과 신뢰감 있는 진행으로'))
print(twitter.pos(u'이것도 되나욬ㅋㅋ'))
print(twitter.pos(u'이것도 되나욬ㅋㅋ', norm=True))
print(twitter.pos(u'이것도 되나욬ㅋㅋ', norm=True, stem=True))
이 코드를 실행하면 다음과 같은 결과가 나온다.
맨 위에 morphs의 경우 단독, 입찰, 보다 등으로 모두 잘라서 보여준다.
nouns의 경우 유일하, 항공기, 체계, 종합, 개발 등 명사만 추출해주는 것으로 보인다.
그리고 phrases와 pos 등도 결과를 보고 어떤 식으로 사용하면 좋을지 공부해봐야겠다.
반응형