이전에 학교 수업때 사용했던 Konlpy 형태소 분석기는 Java기반이라 설치 과정에서 고생을 했던 기억이 있다.
Kiwi 형태소 분석기는 이와 달리 설치가 용이하다.
설치
형태소 분석 : tokenize( )
normalize_coda 옵션: 덧붙은 받침 때문에 분석이 깨지는 경우를 방지
stopwords 옵션 : Stopwords 클래스도 제공하여 불용어 관리가 가능하다.
불용어 클래스에 add, remove 메소드를 이용해 불용어 목록에 단어를 추가하거나 삭제할 수 있다.
각 토큰은 여러 정보를 담고 있으며 각각 호출할 수 있다.
문장 분리 : split_into_sents( )
reference : https://github.com/bab2min/kiwipiepy