파이썬 텍스트 마이닝 라이브러리 - NLTK(Natural Language Toolkit)
NLTK(Natural Language Toolkit) NLTK(Natural Language Toolkit)는 파이썬에서 자연어 처리를 위한 라이브러리로, 다양한 자연어 처리 작업을 수행할 수 있도록 도와줍니다. NLTK는 영어 자연어 처리를 중심으로 개발되었으며, 문서 분류, 정보 추출, 단어 토큰화, 형태소 분석, 구문 분석, 개체명 인식, 감성 분석 등 다양한 자연어 처리 작업을 지원합니다. NLTK에서 제공하는 주요 기능 말뭉치(Corpus) 및 언어 자원 관리 영어 텍스트 말뭉치를 제공하며, 텍스트 말뭉치를 쉽게 다룰 수 있는 인터페이스를 제공합니다. 말뭉치를 이용해 단어 빈도, 어휘 다양성 등의 통계 정보를 계산할 수 있습니다. 텍스트 전처리(Text Preprocessing) 텍스트 데이터..
2023. 2. 27.