본문 바로가기
Programming/AI

KoNLPy(코넬파이) 설치 및 트위터 형태소 분석기 api 예제

by 제타 2018. 7. 1.
반응형

출처 - 코넬파이 홈페이지


파이썬을 활용하여 트위터 형태소를 분석해보자.


먼저 g++ jdk8 python-dev 등을 설치한다.


(base) root@91fd4687e0df:/ai# apt-get install g++ openjdk-8-jdk python-dev python3-dev



그리고 코넬파이(konlpy)를 설치한다.

(base) root@91fd4687e0df:/ai# pip install konlpy



> 코넬파이 홈페이지 바로가기 참조 <


그리고 예제를 돌려보기 위해 jpype1을 모듈을 설치한다.


(base) root@91fd4687e0df:/ai# pip install jpype1



그럼 예제를 돌려보자.


from konlpy.tag import Twitter
twitter = Twitter()
print(twitter.morphs(u'단독입찰보다 복수입찰의 경우'))

print(twitter.nouns(u'유일하게 항공기 체계 종합개발 경험을 갖고 있는 KAI는'))

print(twitter.phrases(u'날카로운 분석과 신뢰감 있는 진행으로'))

print(twitter.pos(u'이것도 되나욬ㅋㅋ'))

print(twitter.pos(u'이것도 되나욬ㅋㅋ', norm=True))

print(twitter.pos(u'이것도 되나욬ㅋㅋ', norm=True, stem=True))


이 코드를 실행하면 다음과 같은 결과가 나온다.



맨 위에 morphs의 경우 단독, 입찰, 보다 등으로 모두 잘라서 보여준다.

nouns의 경우 유일하, 항공기, 체계, 종합, 개발 등 명사만 추출해주는 것으로 보인다.

그리고 phrases와 pos 등도 결과를 보고 어떤 식으로 사용하면 좋을지 공부해봐야겠다.

반응형