기능
- 고유 명사를 고려한 토큰화
기존의 라이브러리가 인식하지 못하는 고유 명사를 쉽게 지정하여 토큰화 결과에 반영할 수 있도록 합니다.
여러 개의 고유 명사가 존재하는 경우 명사별로 점수를 지정하여 우선순위를 결정할 수 있습니다.
- 중복 명사 제거
사용자의 필요에 따라 중복되는 명사를 제거하여 결과를 보여줍니다.
- 명사 개수 카운팅
특정 명사의 빈도수를 빠르게 확인할 수 있습니다.
- [진행중] 시각화
토큰화 된 결과를 빈도수 등에 따라 워드클라우드,막대그래프로 나타내어 텍스트의 탐색을 도와줍니다.