본문 바로가기
반응형

모두보기89

파이썬 텍스트 마이닝 라이브러리 - NLTK(Natural Language Toolkit) NLTK(Natural Language Toolkit) NLTK(Natural Language Toolkit)는 파이썬에서 자연어 처리를 위한 라이브러리로, 다양한 자연어 처리 작업을 수행할 수 있도록 도와줍니다. NLTK는 영어 자연어 처리를 중심으로 개발되었으며, 문서 분류, 정보 추출, 단어 토큰화, 형태소 분석, 구문 분석, 개체명 인식, 감성 분석 등 다양한 자연어 처리 작업을 지원합니다. NLTK에서 제공하는 주요 기능 말뭉치(Corpus) 및 언어 자원 관리 영어 텍스트 말뭉치를 제공하며, 텍스트 말뭉치를 쉽게 다룰 수 있는 인터페이스를 제공합니다. 말뭉치를 이용해 단어 빈도, 어휘 다양성 등의 통계 정보를 계산할 수 있습니다. 텍스트 전처리(Text Preprocessing) 텍스트 데이터.. 2023. 2. 27.
자료구조 - 스택, 후위표기법, 큐를 사용하여 덱을 구현하는 방법 자료구조 - 스택, 후위표기법, 큐를 사용하여 덱을 구현하는 방법 자료구조와 관련된 스택(Stack), 후입선출 스택(Stack)은 후입선출(Last-In-First-Out, LIFO) 방식으로 동작하는 자료구조입니다. 새로운 요소는 스택의 상단에 삽입되며, 가장 최근에 삽입된 요소가 가장 먼저 제거됩니다. 이것은 스택의 작동 방식으로 "Last-In-First-Out" 이라고 불리는 이유입니다. 스택은 일반적으로 스택 상단(top)으로만 접근할 수 있습니다. 요소를 추가하는 작업은 스택의 상단에 새로운 요소를 삽입하는 작업이며, 요소를 제거하는 작업은 스택의 상단에서 요소를 꺼내는 작업입니다. 스택은 주로 함수 호출 스택(function call stack)이나 뒤로 가기 버튼 등에 사용됩니다. 함수 .. 2023. 2. 24.
텍스트 마이닝 4단계와 유용한 파이썬 라이브러리 6가지 텍스트 마이닝 단계와 유용한 파이썬 라이브러리 모음 텍스트 마이닝 4단계 프로세스 텍스트 마이닝은 대량의 텍스트 데이터를 분석하여 유용한 정보를 추출하는 기술입니다. 이를 위해서는 다음과 같은 기본적인 단계가 필요합니다. 데이터 수집 분석하려는 데이터를 수집합니다. 이는 인터넷 상의 웹페이지, 뉴스 기사, 소셜 미디어 게시글, 이메일 등 다양한 소스에서 수집할 수 있습니다. 데이터 전처리 수집한 데이터를 분석하기 적합한 형태로 가공합니다. 이는 불필요한 문자나 기호 제거, 대소문자 통일, 토큰화 등의 작업을 포함합니다. 데이터 분석 전처리된 데이터를 분석하여 원하는 정보를 추출합니다. 이는 주요 단어나 구, 토픽 모델링, 감성 분석, 네트워크 분석 등의 기술을 사용할 수 있습니다. 결과 시각화 추출한 정.. 2023. 2. 24.
자료구조 기본 개념 정리 - 배열, 리스트, 스택, 큐, 해시테이블 자료구조에 대해 알아봅니다. 컴퓨터 자료구조란, 데이터를 조직화하고 저장하는 방법에 대한 학문입니다. 즉, 어떻게 데이터를 구성하고 저장할 것인지, 그리고 어떻게 그 데이터를 처리할 것인지에 대한 이론적인 고찰입니다. 배열과 리스트 예를 들어, 배열(array)은 동일한 유형의 데이터 요소를 일렬로 저장하는 방법입니다. 이와 달리 연결된 리스트(linked list)는 서로 다른 유형의 데이터 요소를 연결(link)하여 구성합니다. 이러한 자료구조들은 데이터를 저장하는 방식이 다르기 때문에 각각의 장단점이 있습니다. 배열은 데이터에 빠르게 접근할 수 있지만, 크기가 고정되어 있기 때문에 요소를 추가하거나 제거하는 데 제약이 있습니다. 반면에 연결된 리스트는 크기가 동적으로 조절될 수 있기 때문에 요소를 .. 2023. 2. 23.
C언어를 공부하는 이유: C프로그래밍이 활용되는 분야 C언어를 공부하는 이유 - C프로그래밍이 활용되는 분야 C언어는 다양한 분야에서 널리 활용되는 프로그래밍 언어입니다. 몇 가지 대표적인 예는 다음과 같습니다. 운영 체제 C언어는 운영 체제의 핵심 기능을 구현하는 데 많이 사용됩니다. 운영 체제는 하드웨어 자원(메모리, 디스크, CPU 등)을 효율적으로 관리하고, 응용 프로그램이 하드웨어와 상호작용할 수 있도록 하는 소프트웨어입니다. 대표적으로 유닉스(UNIX)와 리눅스(Linux) 운영 체제가 C언어로 개발되었습니다. 대부분의 운영 체제는 C언어로 작성되어 있습니다. 운영 체제는 하드웨어를 관리하고 응용 프로그램이 하드웨어와 상호 작용할 수 있도록 인터페이스를 제공합니다. C언어는 하드웨어와 직접 상호 작용하는 데에 적합한 언어이기 때문에 운영 체제 개.. 2023. 2. 21.
💻 C언어와 C++의 차이, C언어를 잘 하기위한 방법 C/C++, C언어를 잘 하기위한 기본 팁 C언어와 C++언어는 무엇이 다른가 C언어와 C++언어는 둘 다 프로그래밍 언어이지만, 몇 가지 차이점이 있습니다. 🧤객체 지향 프로그래밍 C++은 객체 지향 프로그래밍(OOP) 언어입니다. 객체 지향 프로그래밍은 데이터와 이를 처리하는 함수(메소드)를 하나의 단위로 묶어서 사용합니다. 이러한 개념을 이용하여 C++은 클래스(class)를 사용하여 객체(object)를 생성할 수 있습니다. 반면, C언어는 객체 지향 프로그래밍을 지원하지 않습니다. 🧶 네임스페이스 C++은 네임스페이스(namespace) 개념을 도입하여 변수와 함수의 이름 충돌을 방지할 수 있습니다. 반면, C언어는 네임스페이스를 지원하지 않습니다. 🥽 함수 오버로딩 C++은 함수 오버로딩(fu.. 2023. 2. 21.
📙 역행자 - 돈, 시간, 운명으로부터 완전한 자유를 얻는 7단계 인생 공략집 역행자. 돈, 시간, 운명으로부터 완전한 자유를 얻는 7단계 인생 공략집 2022 | 자청 | 웅진지식하우스 📚 책, 책, 책을 읽자. 25. 2달에 200권의 자기계발서, 심리학책으로 독서 시작 30. 하루 2시간 책 읽기와 글쓰기 습관 지속 중 36. 사업과 마케팅 분야는 전혀 몰랐기 때문에 30권 정도의 책으로 시작 모르는 분야를 진입할때 20권 정도의 책을 읽으면 남들보다 훨씬 빨리 목표에 도달할 수 있다는 확신 43. 세계사, 과학, 문학 관련 책을 읽으면서 지금까지와 다른 방향의 뇌를 발달시키려 노력했고 경영에 대해 본격적으로 공부하기 시작 82. 작가가 되고 싶다면 작가 되는 법에 대해 10여 년간 나온 책을 모두 훑어본다. 저자들이 시행착오를 겪은 이야기를 통해 나도 할 수 있다는 생각이 .. 2023. 2. 19.
티스토리 블로그 애드센스 승인 합격후기 애드센스 계정이 활성화되었습니다 이제 사이트에 애드센스 광고를 게재할 수 있습니다 반가운 메일이 왔다. 구글 애드센스 승인 합격 이메일을 드디어 받았다. 블로그에도 여러 번 포스팅 했지만 수십번 거절을 받으면서도 다시 승인을 올릴 때 꽤 기대를 했다. 그러다가 몇 개월은 아예 블로그를 안보게 되었다. 바쁘기도 했지만 재미도 없고 다른 일들에 우선 순위를 밀렸다. 그리고 오랜만에 다시 들어와서 글을 쓰려고 보니 임시저장 해 둔 글들이 다 없어졌더라 ;; 아무튼 다시 들어온 김에 애드센스 승인도 오랜만에 다시 올려보았는데, 이번엔 기대가 진짜 예전보다 현저히 낮았다. 그런데 갑자기 오늘 승인 메일을 받았다. 🙀 놀라움. HTML 삽입 미리보기할 수 없는 소스 자동으로 설정해 두었는지 이런저런 설정들 확인하고.. 2023. 2. 19.
구글 지메일로 관심 키워드 뉴스 자동 이메일 받는 방법과 주의사항 구글 이메일로 관심 키워드에 대한 뉴스를 자동으로 받아보고 싶어 방법을 찾아보았다. 키워드 설정하는 방법, 설정 해제하는 방법, 그리고 주의사항에 대해 알아본다. Google 알리미가 알려준다. 구글 이메일 자동설정, 지메일 자동받기, 키워드 뉴스 받기 뭐 이런 용어라고 생각했지만 아주 단순하게 구글 알리미였다. 아래 주소의 링크로 가면 신청할 수 있다. 구글 알리미 바로가기 링크 https://www.google.co.kr/alerts Google 알리미 신청방법 받고자 하는 지메일 계정으로 로그인한 상태에서 신청하면 된다. 로그인을 안한 상태에서도 이메일을 입력하면 알림을 만들 수 있다. 수신빈도는 하루 한번, 일주일 한번, 또는 수시로 받을 수 있다. 출처는 자동, 뉴스, 블로그, 웹, 비디오, 도.. 2023. 2. 16.
🦾 GPT AI 파워 - 콘텐츠 작성 및 이미지 생성까지 자동화하는 워드프레스 무료 플러그인 텍스트를 입력하면 관련된 콘텐츠를 작성해주고 이미지 생성을 자동으로 할 수 있는 워드프레스 무료 플러그인이 있어 소개한다. 현재 기준으로는 5천건 이상 설치되어서 워드프레스 AI 플러그인 중 가장 대중적인데 얼마나 검증이 된 플러그인인지는 잘 모르겠다. GPT AI 파워 - 콘텐츠 작성 및 이미지 생성 해주는 워드프레스 무료 플러그인 GPT AI 파워란 GPT AI Power는 OpenAI의 GPT-3 기술을 사용하여 콘텐츠와 이미지를 생성하는 워드프레스 플러그인이다. GPT AI Power의 핵심 기능 핵심 기능에는 38개 언어를 지원하는 Content Writer, Auto Content Writer, Bulk Content Writer, Image Generator, ChatGPT, WooComme.. 2023. 2. 15.
📖 오직 스스로의 힘으로 백만장자가 된 사람들의 52가지 공통점 백만장자가 된 사람들의 52가지 공통점 오직 스스로의 힘으로 백만장자가 된 사람들의 52가지 공통점 2018 | 앤마리사바스 | 스노우폭스북스 21. 그들은 평범한 사람들과 무엇이 다른가? 자신의 운명을 만들어간다. 시간을 지혜롭게 쓴다. 감성지수가 높다. 자신감이 있다. 신뢰할 수 있다. 고정관념에서 벗어난 새로운 사고를 한다. 소박함의 가치를 인식한다. 창의적이다. 성공할때까지 계속한다. 성공에 자만하지 않는다. 자신의 몸을 소중히 여긴다. 정신을 풍요롭게 가꾼다. 자신이 주변 사람보다 잘난 게 없다는 것을 안다. 올바른 우선순위를 갖고 있다. 받기보다 베푼다. 미래를 계획한다. 돈을 소중히 다룬다. 지략이 있다. 42. 에머슨의 시 당신이 무너진다고 생각하면, 당신은 무너진다. 당신이 용기가 없다고.. 2023. 2. 13.
🗄️ 프로그래밍 C 언어 vs. Python 파이썬 차이점 프로그래밍할 때 파이썬과 C언어 두 가지를 왔다갔다 사용하다보면 자꾸 실수할때가 있다. 오늘은 두 언어의 차이점을 정리해본다. 파이썬과 C언어 차이점 📝 출력할 때, 프린트 Py - 프린트 함수 사용, 한줄로 표현할 때 %(변수) 사용, 줄바꿈 안하려면 , end="" 사용 print(”출력할 내용”) print(”%d는 %s이다” % (숫자, 문자), end="") C - 프린트f 함수 사용, 코드 뒤에 반드시 세미콜론(;), \n 나올때까지 줄바꿈 없음 printf(”출력할 내용”); printf(”%d는 %s이다”, 숫자, 문자) ⌨️ 사용자에게 입력받기 Py - 입력 요청과 변수 저장을 input 함수로 한번에 변수명 = input(”입력 요청: “) C - 입력 요청은 프린트f로, 변수 저장은 .. 2023. 2. 12.
🗄️ C 프로그래밍 언어 - 주의사항 & ; f { } && || 어렵게 배운 C 언어를 잊어버리지 않기 위해 다시 한번 정리해본다. C 프로그래밍 언어란 1972년 만들어진 범용 컴퓨터 프로그래밍 언어로 당시 프로그래밍 언어 B의 후속이자 유닉스 운영체제에서 실행되는 유틸리티를 구현하기 위해 처음 개발되었다. 그렇다면 D도 나올 수 있다는? 구조화된 프로그래밍을 지원하고 런타임을 최소화하며 효율적으로 기계에 명령을 전달하는 메모리와 언어 구성에 대한 액세스를 제공하는 컴파일이 가능하도록 설계되었다. 2000년부터 프로그래밍 언어의 인기도를 측정하는 인덱스에서 상위 2개 언어에 꾸준히 선정되었다. C 언어 특징 #include int main(void) { printf("hello, world\n"); } 프로그램 첫 번째 줄에 #include 를 넣어줘야 한다. C .. 2023. 2. 10.
📚 나는 어제보다 오늘이 좋다 ​- 옥스퍼드 지식 전도사 써니가 전하는 삶의 지혜 ​나는 어제보다 오늘이 좋다, 옥스퍼드 지식 전도사 써니가 전하는 삶의 지혜 2015 | 저자 김성희 | 쌤앤파커스 인생은 살만한 것이다. 노상 버킷리스트만 찾기보다 지금 내가 하는 일을 버킷리스트로 만든다면 더더욱 인생을 살 만해진다. 처음부터 자기가 좋아하는 일을 하는 사람이 과연 몇이나 될까? 어떤 상황이든 내 선택이 최고라고 믿어야, 그 일을 즐기게 되고 잘하게 되는 법. 지금 주어진 순간에 최선을 다하다 보면, 어느덧 한 발짝 나아가 있는 것이 인생이다. 많은 이들이 가지 못한 길을 동경하고, 가려하는 길 앞에서는 망설인다. 나는 이 책을 통해 내가 택한 길이 최고라는 믿음만 잃지 않는다면, 몇 배는 더 멋지고 신나게 살 수 있음을 보여주고 싶다. (p.13) ​ ​ 나에게는 항상 오늘만 있었다.. 2023. 2. 10.
⏰ 파이썬으로 실시간 인기 검색어 확인하고 스크린샷 자동 저장 | 2023년 2월 9일 오후 3:30 기준 파이썬 업무 자동화 프로젝트 인공지능 공부와 함께 파이썬으로 업무 자동화하기를 실습중이다. 시중에 좋은 책들이 많고 훌륭한 분들이 올려주신 블로그와 깃 소스 등 활용할 것들이 참으로 많아 또 뭐부터 해야할 지 모르는 와중에 신기한 작업이 한번에 완료되어서 포스팅으로 남긴다. 아무래도 실시간 인기 검색어이다보니 실시간으로 올려주는게 맞기도 하고 보통은 따라하다보면 70-80% 지점에서 에러를 잡지 못해 지치는데 이 코드의 경우 진짜 한 5분만에 다 완료가 되었다. 실시간 인기 검색어 TOP10 확인하기 작업 환경은 주피터 노트북이고 셀레니움 라이브러리로 크롬 웹브라우저를 컨트롤하는 것이 주요 내용이다. 셀레니움(Selenium)은 주로 테스트 목적으로 브라우저를 자동화하는 도구인데 웹 기반 프로세스 자동화.. 2023. 2. 9.
🤓 인공지능을 위한 수학 공부 시작 | 주요 토픽들 🧮 인공지능을 위한 수학 공부를 시작하다. 인공지능에 관심이 있고 인공지능을 다뤄서 무엇인가를 해보려고 기웃거리다보니 자꾸 이상한 공식과 숫자들이 난무하다. 😭 애증의 수학, 고등학교 졸업 이후 다시 볼 일이 0.0000001도 없었는데 아무래도 계속 발목을 잡을거 같아 수학 공부를 시작한다. 📖 책으로 시작하는 인공지능 수학 공부 생각해보면 수학을 아예 싫어하거나 못하지는 않았던 것으로.. 애써 기억하는데 어디서부터 뭘 해야할지 몰랐다. 찾아보니 '인공지능을 위한 수학', '딥러닝을 위한 선형대수' 이런 종류의 언급이 꽤 보여서 먼저 관련 책을 찾아보았다. 행렬부터 시작하는걸 보니 파이썬에서 넘파이와 판다스 같은 라이브러리랑 관련이 있어보였다. 와 근데 정말 진도가 안나간다. 그리고 아직 인공지능에 대.. 2023. 2. 9.
[ML/DL] 머신러닝/딥러닝 모델 트랜스포머(Transformer) Transformer, deap learning model 트랜스포머, 영화제목 아님 인공지능 머신러닝 모델 중 하나인 트랜스포머에 대해 알아본다. 2017년 구글 브레인이 논문을 통해 발표 논문제목: Attention is all you need (https://arxiv.org/abs/1706.03762) 의역: 어텐션만 있으면 된다, 어텐션이 다했다 아직 안 읽어봤음, 엄청 길 줄 알았는데 그림 빼고 본문 8장 정도에 신개념을 발표함.. 🥶 제목처럼 순차적 프로세스로 처리하는 기존 RNN(순환신경망)의 한계를 어텐션이라는 메커니즘을 도입해서 해결할 수 있다는 것 2017년 이후에는 딥러닝 하면 거의 트랜스포머가 대세, 경쟁적으로 많은 관련 연구 논문이 발표되고 있음 기존의 RNN(Recurrent .. 2022. 10. 13.
구글 애드센스 10번째 거절사유 - 오늘도 역시 사이트가 다운되었거나 사용할 수 없음 9월 초 신청한 후부터 계속 동일한 사유로 구글 애드센스 승인을 못 받고 있다. 거절 사유는 다른 것도 아니고 언제나 '사이트가 다운되었거나 사용할 수 없음'이다. 사이트 정말 잘 사용하고 있고 다운된 적도 없는데 말이다. 한동안은 이 문제를 해결해보려고 이것저것 조치해보고 검색도 무지하게 해 보았는데 확실한 방법을 아직 찾지 못했다. 결론적으로 많은 블로거들이 같은 문제로 고민하고 있다는 것과 그럼에도 불구하고 승인을 받는 블로그도 있다는 사실을 알게 되었다. 오늘 포스팅은 이 문제를 해결하는 특정한 방법이 아니고 단지 마인드 컨트롤 목적이다. 구글 애드센스 거절 이메일 목록을 보니 한 달 동안 거의 10번 거절을 받았다. 지금도 거절을 기다리는 중이다. 자꾸 승인을 올리면 너무 자주 검토했다는 사유로.. 2022. 10. 13.
MS워드, 구글 닥스에서 문서에 전체 페이지 수 표시하는 방법 (페이지 번호 / 총 페이지수) 보고서나 문서 작성할 때 보통 바닥글에 페이지 번호를 넣고 페이지 수가 조금 많아지면 페이지 번호 옆에 전체 총 페이지 수를 표시한다. 구글 닥스에서는 이 기능을 꽤 쉽게 설정할 수 있는데 워드는 좀 까다로워서 매번 검색이 필요했다. 그래서 마이크로소프트 워드에서 페이지 번호를 삽입할 때 전체 페이지까지 보이게 하는 방법을 정리한다. 보너스로 구글 닥스에서는 얼마나 쉽게 되는지도 마지막에 추가했으니 참고하자. MS워드에서 전체 페이지수 보여주는 방법 1. [ 필드 ] 메뉴를 찾아야 한다. 필드 메뉴를 찾는 방법은 세 가지가 있다. A. 머리글 및 바닥글 영역을 더블클릭 > [필드]를 선택한다. 워드는 일단 [머리글 및 바닥글] 탭으로 가야한다. 이 탭이 보이려면 머리글이나 바닥글 영역에서 더블클릭을 하면.. 2022. 10. 12.
구글 지메일을 다른 이메일로 자동으로 전달하는 방법 (Email forwarding) 여러 개의 구글 지메일 계정을 사용하다가 회사나 학교에서 또 구글 이메일 계정이 생기면 전부다 로그인을 해놓고 자주 체크하기가 어렵다. 이럴때 유용한 것이 자주 사용하는 이메일로 받은 메일을 그대로 전달하는 것이다. 오늘은 구글 지메일을 다른 이메일로 자동 포워딩하는 방법을 알아본다. 구글 지메일로 받은 이메일 전달하기 1. PC에서 전달하고자 하는 지메일 로그인 후 설정 화면으로 이동한다. ⚙️ PC나 노트북(랩탑)에서 자주 로그인하지 않아 다른 메일로 보내고자하는 지메일 계정에 로그인한다. 이메일 자동 전달 설정은 PC 화면에서만 가능하고 지메일 앱으로는 설정할 수 없다. 로그인 후 오른쪽 상단에 톱니바퀴 아이콘을 누르면 [모든 설정 보기/See all settings] 버튼이 보인다. 이 버튼을 클.. 2022. 10. 12.
반응형