파이썬 텍스트 마이닝 라이브러리 - NLTK(Natural Language Toolkit)
NLTK(Natural Language Toolkit) NLTK(Natural Language Toolkit)는 파이썬에서 자연어 처리를 위한 라이브러리로, 다양한 자연어 처리 작업을 수행할 수 있도록 도와줍니다. NLTK는 영어 자연어 처리를 중심으로 개발되었으며, 문서 분류, 정보 추출, 단어 토큰화, 형태소 분석, 구문 분석, 개체명 인식, 감성 분석 등 다양한 자연어 처리 작업을 지원합니다. NLTK에서 제공하는 주요 기능 말뭉치(Corpus) 및 언어 자원 관리 영어 텍스트 말뭉치를 제공하며, 텍스트 말뭉치를 쉽게 다룰 수 있는 인터페이스를 제공합니다. 말뭉치를 이용해 단어 빈도, 어휘 다양성 등의 통계 정보를 계산할 수 있습니다. 텍스트 전처리(Text Preprocessing) 텍스트 데이터..
2023. 2. 27.
구글 지메일로 관심 키워드 뉴스 자동 이메일 받는 방법과 주의사항
구글 이메일로 관심 키워드에 대한 뉴스를 자동으로 받아보고 싶어 방법을 찾아보았다. 키워드 설정하는 방법, 설정 해제하는 방법, 그리고 주의사항에 대해 알아본다. Google 알리미가 알려준다. 구글 이메일 자동설정, 지메일 자동받기, 키워드 뉴스 받기 뭐 이런 용어라고 생각했지만 아주 단순하게 구글 알리미였다. 아래 주소의 링크로 가면 신청할 수 있다. 구글 알리미 바로가기 링크 https://www.google.co.kr/alerts Google 알리미 신청방법 받고자 하는 지메일 계정으로 로그인한 상태에서 신청하면 된다. 로그인을 안한 상태에서도 이메일을 입력하면 알림을 만들 수 있다. 수신빈도는 하루 한번, 일주일 한번, 또는 수시로 받을 수 있다. 출처는 자동, 뉴스, 블로그, 웹, 비디오, 도..
2023. 2. 16.
🗄️ 프로그래밍 C 언어 vs. Python 파이썬 차이점
프로그래밍할 때 파이썬과 C언어 두 가지를 왔다갔다 사용하다보면 자꾸 실수할때가 있다. 오늘은 두 언어의 차이점을 정리해본다. 파이썬과 C언어 차이점 📝 출력할 때, 프린트 Py - 프린트 함수 사용, 한줄로 표현할 때 %(변수) 사용, 줄바꿈 안하려면 , end="" 사용 print(”출력할 내용”) print(”%d는 %s이다” % (숫자, 문자), end="") C - 프린트f 함수 사용, 코드 뒤에 반드시 세미콜론(;), \n 나올때까지 줄바꿈 없음 printf(”출력할 내용”); printf(”%d는 %s이다”, 숫자, 문자) ⌨️ 사용자에게 입력받기 Py - 입력 요청과 변수 저장을 input 함수로 한번에 변수명 = input(”입력 요청: “) C - 입력 요청은 프린트f로, 변수 저장은 ..
2023. 2. 12.