728x90

KNN 3

[문서 제목 자동 분류 작업 | Classification] 2. 모델 별 실행 결과 | 인턴

0. Data train : 80% test : 20% 1. K-NN neighbor == 3 import pandas as pd from konlpy.tag import Kkma import string from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsClassifier from sklearn.metrics import accuracy_score, confusion_matrix csv_file_path = '../../data/spv/spv_data.csv' try: df = pd..

[문서 제목 자동 분류 작업 | Clustering] 1. CSV 파일 읽어오기 | 인턴

+) 분류에 사용하는 데이터는 sql 쿼리문으로 출력되어 csv 형태로 저장되어있는 파일을 불러와 사용한다. 코드 import pandas as pd csv_file_path = '../sql_result.csv' # 'utf-8'로 읽어보기 try: df = pd.read_csv(csv_file_path, encoding='utf-8') print('성공적으로 읽었습니다.') except UnicodeDecodeError: print('utf-8으로 디코딩하는 중 오류 발생. 다른 인코딩 시도 필요.') print(df) utf-8로 읽어오지 않으면 글자가 깨지기 때문에 예외처리를 해주었다. 결과 성공적으로 읽었습니다. CONTENT_CODE ... DEPARTMENT_NM 0 C000000000000..

[Clustering | Classification] K-NN VS K-Means | 인턴

K-NN K-Means 공통점 K개의 점을 지정하여 거리를 기반으로 구현되는 거리 기반 분석 알고리즘 차이점 지도학습 비지도 학습 목적 : Classification 목적 : Clustering 이미지 출처 : https://opentutorials.org/course/4548/28942 회귀 VS 분류 - 생활코딩 지도학습은 크게 ‘회귀’와 ‘분류’로 나뉩니다. 회귀는 영어로 Regression이고, 분류는 Classification입니다. 와!! 말이 정말 어렵죠. 걱정 마세요. 알고 보면 하나도 안 어렵습니다. 그전에 아래 그 opentutorials.org

728x90