😒 저 저 저 개념없는 나/⛓️ DL & ML

[문서 제목 자동 분류 작업 | Classification] 3. 최종 실행 | 인턴

우주수첩 2024. 1. 29. 14:31
728x90

 

2024.01.29 - [😒 저 저 저 개념없는 나/⛓️ DL & ML] - [문서 제목 자동 분류 작업 | Classification] 2. 모델 별 실행 결과 | 인턴

 

[문서 제목 자동 분류 작업 | Classification] 2. 모델 별 실행 결과 | 인턴

0. Data train : 80% test : 20% 1. K-NN neighbor == 3 import pandas as pd from konlpy.tag import Kkma import string from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.model_selection import train_test_split from sklearn.neighbors impor

dusty-wznt.tistory.com

 

이전 글에서 최종 모델을 SVM으로 진행하기로 결정

 

전체 데이터 중 20% 를 모델 학습 및  test로 사용

 

 

1. 데이터 분할

20% training
(1912, 4313)
(1912,)
(7648, 4313)
(7648,)

 

 

2. 모델 학습

train : 80% | test : 20%

(1529, 4313)
(1529,)
(383, 4313)
(383,)

 

 

3. model_prediction

  • Accuracy: 0.9686
  • Confusion Matrix:

 

 

4. 전체 데이터 prediction

  • Accuracy: 0.9838
  • Confusion Matrix:

[[ 27 3 41]

[ 0 1446 105]

[ 0 5 7933]]

        

 

728x90