반응형
출처 - 코넬파이 홈페이지
파이썬을 활용하여 트위터 형태소를 분석해보자.
먼저 g++ jdk8 python-dev 등을 설치한다.
(base) root@91fd4687e0df:/ai# apt-get install g++ openjdk-8-jdk python-dev python3-dev
그리고 코넬파이(konlpy)를 설치한다.
(base) root@91fd4687e0df:/ai# pip install konlpy
그리고 예제를 돌려보기 위해 jpype1을 모듈을 설치한다.
(base) root@91fd4687e0df:/ai# pip install jpype1
그럼 예제를 돌려보자.
from konlpy.tag import Twitter
twitter = Twitter()
print(twitter.morphs(u'단독입찰보다 복수입찰의 경우'))
print(twitter.nouns(u'유일하게 항공기 체계 종합개발 경험을 갖고 있는 KAI는'))
print(twitter.phrases(u'날카로운 분석과 신뢰감 있는 진행으로'))
print(twitter.pos(u'이것도 되나욬ㅋㅋ'))
print(twitter.pos(u'이것도 되나욬ㅋㅋ', norm=True))
print(twitter.pos(u'이것도 되나욬ㅋㅋ', norm=True, stem=True))
이 코드를 실행하면 다음과 같은 결과가 나온다.
맨 위에 morphs의 경우 단독, 입찰, 보다 등으로 모두 잘라서 보여준다.
nouns의 경우 유일하, 항공기, 체계, 종합, 개발 등 명사만 추출해주는 것으로 보인다.
그리고 phrases와 pos 등도 결과를 보고 어떤 식으로 사용하면 좋을지 공부해봐야겠다.
반응형
'Programming > AI' 카테고리의 다른 글
[머신러닝/딥러닝] opencv로 얼굴 인식하기 (0) | 2018.07.09 |
---|---|
[머신러닝/딥러닝] 이미지 검색 - 유사한 이미지 찾기 (3) | 2018.07.08 |
[머신러닝/딥러닝] tensorflow + keras + nano 에디터 설치하기 (0) | 2018.07.01 |
머신러닝이란? 머신러닝 개요 (교사학습, 비교사학습, 강화학습, 머신러닝 플로우 차트) (0) | 2018.06.30 |
머신러닝 - 붓꽃 데이터로 어떤 붓꽃인지 예측하기 (0) | 2018.06.26 |