자연어처리/실습12 Topic Modeling 및 Crawling 실습 (뉴스 데이터) 구름 저작권 관련 문제가 생길 수 있어 코드를 제거한 후 수정 업로드 진행 구름 AI 자연어처리 과정에서 실습한 내용을 정리하며 복습해보려한다. (모든 과정은 구글 Colab에서 진행) 1학기 전공 수업에서 다뤘던 토픽 모델링과는 많이 상이한 내용이었다. 1 2 !pip install newspaper3k !pip install konlpy cs 1 2 3 4 5 6 7 8 9 10 11 from bs4 import BeautifulSoup from newspaper import Article from time import sleep from time import time from dateutil.relativedelta import relativedelta from datetime import date.. 2022. 9. 9. NaiveBayes Classifier (나이브베이즈 분류기) 실습 구름 저작권 관련 문제가 생길 수 있어 코드를 가리고 재 업로드 함 앞서 이론으로 알아본 (나이브베이즈 관련 개념 포스팅을 했었나?) NaiveBayes 개념 관련 구름 AI 자연어처리 과정에서 제공한 Classifier 실습을 같이 해보려고한다. 1) 먼저 한국어 토크나이징 패키지인 konlpy를 비롯한 패키지들을 설치한다. 1 2 3 4 5 6 7 8 !pip install konlpy from tqdm import tqdm from collections import defaultdict import math # POS(Part of Speech) tagger from konlpy import tag cs 2) 그다음 Train data와 test data를 준비한다. 그리고 데이터 각각에 긍정과 부.. 2022. 9. 8. 이전 1 2 3 다음