728x90

😒 저 저 저 개념없는 나 61

[Clustering | Classification] K-NN VS K-Means | 인턴

K-NN K-Means 공통점 K개의 점을 지정하여 거리를 기반으로 구현되는 거리 기반 분석 알고리즘 차이점 지도학습 비지도 학습 목적 : Classification 목적 : Clustering 이미지 출처 : https://opentutorials.org/course/4548/28942 회귀 VS 분류 - 생활코딩 지도학습은 크게 ‘회귀’와 ‘분류’로 나뉩니다. 회귀는 영어로 Regression이고, 분류는 Classification입니다. 와!! 말이 정말 어렵죠. 걱정 마세요. 알고 보면 하나도 안 어렵습니다. 그전에 아래 그 opentutorials.org

[Clustering] K-means 알고리즘 | 인턴

종류 비지도 학습 머신 러닝 의미 데이터를 K개의 군집으로 묶는 알고리즘 k-means 알고리즘의 K는 군집의 개수를 의미하고 means는 평균을 의미한다. 즉, 각 군집의 평균(mean)을 활용하여 K개의 군집으로 묶는다는 의미 여기서의 평균은 각 클러스터의 중심과 데이터들의 평균거리를 의미한다. 원리 1. 몇 개의 군집으로 군집화 할 것인지는 사람이 정한다. 군집의 개수를 설정하는 방법론 3가지 Rule of thumb Elbow Method 정보 기준 접근법 (Information Criterion Approach) +) 현재 진행하고자 하는 프로젝트에서는 3가지로 추리고자 한다. 2. 초기 중심점 설정 무게중심을 설정한다. 초기 중심점으로 어떤 값을 선택하는가에 따라 성능이 크게 달라지는 성질을 ..

[NLP] Bow에 기반한 Tf-idf | 인턴

BOW (Bag of Words) 텍스트 데이터를 처리하는 기본적인 방법 중 하나 문서 내의 단어들의 등장 순서를 무시하고, 각 단어의 등장 빈도를 기반으로 문서를 표현 Tf-idf BOW의 확장된 형태로, 각 단어의 중요도를 나타내는 수치 Term Frequency-Inverse Document Frequency의 약자로, 각 단어의 TF와 IDF를 조합하여 계산 주로 텍스트 마이닝, 정보 검색, 문서 분류 등에서 활용 문서 간 단어의 중요도를 고려하여 효과적으로 텍스트를 표현하는 데 사용 Term Frequency (TF, 단어 빈도) 특정 단어가 문서 내에서 얼마나 자주 등장하는지를 표현 일반적으로는 해당 단어가 문서 내에서 등장한 횟수를 전체 단어 수로 나눈 값으로 계산 Inverse Docume..

[WSL] WSL 1 사용을 추천하는 경우 | 인턴

1. 프로젝트 파일 저장 위치 선택: WSL 1을 사용하면 Windows 파일 시스템에 프로젝트 파일을 저장하면 Windows에서 빠르게 액세스 가능. WSL 2에서는 Windows 파일 시스템의 프로젝트 파일에 더 빠르게 액세스할 수 없으며, Linux 파일 시스템에 저장해야 할 경우, WSL 1을 사용하여 OS 파일 시스템에서 더 빠른 성능을 얻을 수 있음. 2. 프로젝트 크로스 컴파일: Windows 및 Linux 도구를 모두 사용하여 동일한 파일에 대해 크로스 컴파일이 필요한 프로젝트. 현재는 WSL 1에서 Windows 애플리케이션을 사용하여 Linux 파일에 액세스할 때 더 빠른 성능을 얻을 수 있음. 3. 직렬 포트 및 USB 디바이스 액세스: USB 디바이스 지원은 USBIPD-WIN 프로..

[WSL] WSL 1 VS WSL 2 차이점 알아보기 | 인턴

WSL 1 WSL 2 가상화 방식 windows 시스템과 Linux 시스템 간의 번역 레이어를 통해 Linux 바이너리를 실행. 가상 머신 없이 동작하며 windows 커널에서 Linux 시스템 호출을 해석하여 처리 hyper-v를 기반으로 하는 가상머신을 사용하여 Linux 커널을 실행. wls2는 전체 linux 커널을 가상 환경에서 독립적으로 실행할 수 있으며 성능이 향상됨. 성능 가상화의 부족으로 인해 I/O 및 네트워크 성능에서 한계 존재 가능. 파일시스템 성능 제한 가상머신을 사용하므로 I/O 및 네트워크 성능이 향상. 파일시스템 성능이 크게 향상 커널 호환성 windows커널과 linux 커널 사이의 호환성이 제한되어 있어 몇가지 기능이나 성능 향상을 지원하지 않을 수 있음. linux 커널..

[WSL] Linux용 Windows 하위 시스템 : Windows Subsystem for Linux | 인턴

WSL WSL(Linux용 Windows 하위 시스템) 별도의 가상 머신 또는 이중 부팅 없이 Windows 컴퓨터에서 Linux 환경을 실행할 수 있는 Windows의 기능 wsl 은 윈도우와 리눅스를 동시에 사용하려는 개발자에게 원활하고 생산적인 환경을 제공하도록 설계 WSL2 Linux 배포를 설치할 때 기본 배포판 유형. wsl2가 리눅스 배포판을 실행하는 방식 가상화 기술 사용 경량 가상화 기술을 사용하여 가상머신 내에서 리눅스 커널을 실행. 윈도우와 리눅스 간의 인터페이스 역할을 하는 가상 레이어 윈도우 시스템과 몇가지 핵심 자원을 공유 wl2를 통해 실행되는 리눅스 배포판은 네트워크 네임스페이스, 디바이스 트리, cpu/커널/메모리/스왑이라는 몇가지 핵심 자원을 윈도우 시스템과 공유 윈도우의..

[OpenSearch / Docker] "Custom Analyzer [custom_analyzer] failed to find tokenizer under name [nori_tokenizer]" | 인턴

2023.11.28 - [😒 저 저 저 개념없는 나] - [OpenSearch / Docker] 한국어 형태소 분석기 Nori 설치 [OpenSearch / Docker] 한국어 형태소 분석기 Nori 설치 WZNT> docker container ls CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES container_id opensearchproject/opensearch:latest "./opensearch-docker…" 10 days ago Up 6 seconds 0.0.0.0:9200->9200/tcp, 9300/tcp, 0.0.0.0:9600->9600/tcp, 9650/tcp opensearch dusty-wznt.tistory.com 이전에 ..

[Docker] Docker을 깔끔하게 밀어버리자 (feat. COM Surrogate) | 인턴

제가 인턴을 하고있는 사내 컴퓨터의 용량이 아주 카와이하고 소중한 관계로 여러가지 이것저것 하다보니 업무에 필요한 도커 컨테이너들이 날라가버렸습니다. ㅋ 정신을 차리고 다시 yaml 파일을 올려보려고 해도 미동도 없는 관계로 도커를 밀어봅시다. 복잡할 줄 알고 겁 왕창 먹었는데 생각보다 많이 간단합니다. 1. 제어판에서 야무지게 도커 desk top을 지운다. 이제 지우지도 못하게 한다. 작업 관리자 > backgrouopd process에 COM Surrogate라고 있을겁니다 고것을 모두 삭삭긁어서 지워주시면 대여 편-안 2. docker 관련 파일 삭제 C:\Program Files\Docker 요놈과 -> C:\Users\[사용자계정폴더]\.doker 요놈 -> C:\Users\[사용자계정폴더]\..

728x90