기능

  • 고유 명사를 고려한 토큰화
    • 기존의 라이브러리가 인식하지 못하는 고유 명사를 쉽게 지정하여 토큰화 결과에 반영할 수 있도록 합니다.

    • 여러 개의 고유 명사가 존재하는 경우 명사별로 점수를 지정하여 우선순위를 결정할 수 있습니다.

  • 중복 명사 제거
    • 사용자의 필요에 따라 중복되는 명사를 제거하여 결과를 보여줍니다.

  • 명사 개수 카운팅
    • 특정 명사의 빈도수를 빠르게 확인할 수 있습니다.

  • [진행중] 시각화
    • 토큰화 된 결과를 빈도수 등에 따라 워드클라우드,막대그래프로 나타내어 텍스트의 탐색을 도와줍니다.