728x90

aws 26

[AWS SageMaker / HuggingFace] 허깅페이스와 LoRA를 사용하여 단일 Amazon SageMaker GPU에서 대규모 언어 모델(LLM) 훈련하기 | 인턴

어짜피 이렇게 팽 당한 과제 아까우니까 공부한거라도 적어두려고 합니당 모르면 이전 포스트 슝: 2023.11.09 - [🏝️ 멋찐넘 AWS/🚨 ERR] - [슬기로운 인턴생활 | AWS SageMaker & HuggingFace] The requested resource studio ... is not available in this region 정확하게는 어떤걸 하고 싶었냐면 Fine tunning을 함으로써 모델의 성능과 정확도를 더 올리고 싶었다죠 그래서 AWS 기술 블로그에 나와있는 허깅페이스와 LoRA를 사용하여 단일 Amazon SageMaker GPU에서 대규모 언어 모델(LLM) 훈련하기 를 진행하였답니당 허깅페이스가 저는 좀 생소했는데 이 칭구가 말이죠 사람들이 만든 모델들을 올려서 무료..

[ AWS SageMaker & HuggingFace] The requested resource studio ... is not available in this region | 인턴

언제 또 이렇게 AWS를 마음대로 써 보겠는가!!! 기업체 최고다!!! 학생 신분에서 해 볼 수 없었던 마음 놓고 AWS 기능 쓰기를 진행하다 보면 **Failed to start kernel** Failed to launch app [sagemaker-data-scien-ml-g5-2xlarge-788bb6348367982dd036e22a2f37]. ResourceLimitExceeded: The requested resource studio/KernelGateway-ml.g5.2xlarge is not available in this region (Context: RequestId: 8c72bfde-4a66-44b2-9fd8-e05e5af45114, TimeStamp: 1698803755.498822..

[AWS SageMaker / HuggingFace] Training an 8-bit model is not supported yet. | 인턴

UnexpectedStatusException: Error for Training job huggingface-peft-2023-11-07-00-53-07-2023-11-07-02-17-27-231: Failed. Reason: AlgorithmError: ExecuteUserScriptError: ExitCode 1 ErrorMessage "raise ValueError( ValueError: The model you want to train is loaded in 8-bit precision. Training an 8-bit model is not supported yet." Command "/opt/conda/bin/python3.9 run_clm.py --dataset_path /opt/ml/in..

[AWS SageMaker / HuggingFace] NotImplementedError: Cannot copy out of meta tensor; no data! | 인턴

AWS SageMaker에서 모델을 돌리던 도중에 오류가 발생했다. MarkAny Document Safer Warning! : The Contents copied from encrypted document can not be pasted to non-encrypted one! Reason : AlorithmError: excuatreUserScriptError ExitCode 1 ErroeMessage "NotImplementedError: Cannot copy out of meta tensor; no data!" Command "\opt/conda/bin/python3.9 run_clm.py --dataset_path /opt/ml/input/data/training --epochs 3 --lr 0...

[LLM] LLM Fine Tuning 공부 | 인턴

허깅페이스와 LoRA를 사용하여 단일 Amazon SageMaker GPU에서 대규모 언어 모델(LLM) 훈련하기 : aws 기술 블로그 파운데이션 모델 (foundation model) : 대규모 데이터셋과 여러 작업을 통해 훈련된 대규모 모델은 훈련되지 않은 특정 작업에도 일반화 성능이 높게 나타나는 모델. 파인 튜닝(Fine-Tunning) : 특정 도메인이나 작업에 대한 대규모 모델의 성능을 개선하기 위해 더 작은 작업별 데이터 셋으로 모델을 추가로 훈련하는 것. 단점 LLM의 정확도를 성공적으로 개선, 원본 모델의 모든 가중치 수정 필요 → 비용 부담 원본 모델과 동일한 크기의 모델을 생성 → 저장소 용량 부담 요약 파인 튜닝 데이터셋 크기가 훨씬 작기 때문에 사전 훈련 보다 빠르지만 여전히 상..

[AWS] Lambda

어우씨 AWS 리소스 바로 삭제 안하고 정지 안해서 프리티어 범위 초과됐어여... 눈물 콸콸 오션뷰... 마이 공차 블랙 펄 밀크티 값이 날라가써... 돈 없는 대학생은 웁니다 엉엉 광광.... 여튼 고... # AWS Lambda 이벤트에 대한 응답으로 코드를 실행하고 자동으로 기본 컴퓨팅 리소스를 관리하는 서버리스 컴퓨팅 서비스 AWS Lambda를 사용하면 사용자 지정 로직을 통해 다른 AWS 서비스를 확장하거나, AWS 규모, 성능 및 보안으로 작동하는 자체 백엔드 서비스를 만들 수 있습니다 Serverless의 주축을 담당 serverless : 서버리스는 클라우드가 직접 서버를 생성하고 실행시키며 리소스를 서버의 사용량에 따라 직접 할당해줌을 의미한다. (사람의 간섭이 거의 없는 거라고 보면 ..

[AWS] 와장창쿵챵 ec2 파일 전송 및 오류 해결

윈도우 사용자 여러분. powershell 쓰세요. scp 깔려있는 PowerShell 쓰세요. 알니아러니아치나덕치ㅏㄴㄴㄻ아ㅣㄻ팡ㄹ;ㅁ아ㅓㅣ러뮤저로먁횜어ㅣ나ㅓㅇ류ㅣㅁㄷ쟈나ㅓㅇ룸ㅇ롷머ㅏㅠㅣㅑ쥼ㄷㄴㄹ어모ㅕ야ㅓㅏㅇ노ㅠㅇ려ㅑ머ㅏㅜ로ㅠ혀ㅑㅓ잔머ㅜ초ㅓ펴ㅑㅓㅇㄴ마ㅡ방ㅈㄴㄹ펴ㅑㅓ두즈ㅏㅣㅇ렆ㅇ룬ㄴ 하. 자. CloudWatch를 사용하여 EC2 인스턴스의 리소스 사용 내력을 보려면 EC2에 파일이 들어와야지 저장공간이 사용되면서 변경된 것이 감지가 될 것 아니옵니까. 그리하여 제가 https://ict-nroo.tistory.com/40 이 분의 도움을 받아 파일을 전송하려고 했어여!!!!!!! 어디에서? Git bash에서!!!! # EC2 접속 ssh -i [pem파일경로] [ec2-user계정명]@[ec2 inst..

[AWS] Cloudwatch EC2 리소스 사용 모니터링

오늘 랩실을 갔는데여 제 옆자리 분께서 햇반 컵밥 2개를 주셔써여. 아주 에인절이 따로 없지 뭐에여. 그래서 오늘은 Cloudwatch로 EC2 리소스 사용 모니터링을 해 볼거에여. EC2 인스턴스를 사용하여 가상 서버에서 사용 하는 메모리, 디스크 사용 량을 실시간으로 확인 해 보고자 합니다. # EC2 인스턴스 생성 인스턴스 생성 시 고급 세부 정보에 있는 세부 Cloudwatch 모니터링을 활성화 하면 추가 요금이 발생함을 참고하자. 외의 설정들은 모두 디폴트로 진행하였.땨. 아! 키페어는 하나 새로 만들어서 진행했댜!!! 실행되고 있는 인스턴스 아래에서 모니터링을 클릭 해 보자 EC2 생성 이후 아무것도 하지 않았기 때문에 텅텅 비어있다 ㅎ > EC2 연결을 시작하게따. 원하는 인스턴스를 클릭 후..

[AWS] CloudWatch_Alarm

공부 권태기? 와 줄게. 밤낮? 뒤집혀줄게. 시작? 해줄게. # Alarm 알람 설정을 통하여 개발자가 지정한 특정 값에 도달 시 개발자에게 상황을 보고함으로써 서버 매니지먼트가 가능하게 해준다. 알람이 울릴 시 특정 이벤트들을 작동시킬 수 있다. ex) 저녁 7시에 친구를 만나기로 약속. Alarm | 5시반(threshold) 알람 설정 Event | 침대와 작별 -> 씻기, 옷 고르기, 화장 칭구 만나기 # Alarm State 1. Alarm 알람이 링딩동디기디기딩딩 어떤 matrix가, 임의로 정해놓은 threshold 값을 벗어났을 때 발생하는 state 2. Insufficient 불충분한 상태 ex) EC2 인스턴스에 메모리 사용 용량을 알아볼 수 있는 알람을 생성 후에 이를 적용할 EC2..

[AWS] CloudWatch

으르렁. 요번에는 CloudWatch에 대해서 간단하게 정리 해 보려고 한다. 빌드업을 잠깐 하자면 우리가 사용하는 수많은 AWS 서비스들을 사용 할 때 생각 해 봐야 하는 정보들이 몇 가지 있다. 얼마나 많은 공간을 사용하는가? 어떤 이벤트들을 사용하는가? 서비스의 상태는 어떠한가? 얼마나 많은 에러가 발생하였는가? 등등 이런 정보를 알면서 서비스를 사용하면 더 효율적인 방법으로 사용할 수 있지 않을까? 에서 시작된 것이 바로 CloudWatch이다. # CloudWatch의 기능 1. AWS 리소스 사용의 실시간 모니터링 기능 지원 2. 다양한 이벤트들을 수집하여 로그 파일로 저장 이벤트 : 특정한 상황이 발생하는 것 ex 1) S3 Bucket에 파일을 업로드 하거나 삭제하는 것. ex 2) S3 ..

728x90