Table of Contents
DeepLearning/NLP
[LLM] 모델이 학습하는 방법: fine-tuning/in-context learning/pre-training
꼬꼬마코더 2024. 9. 19. 09:43728x90
세 가지 방법인 파인튜닝(fine-tuning), 인컨텍스트 러닝(in-context learning), 그리고 프리트레이닝(pre-training)의 차이를 한국어로 설명드리겠습니다.
1. 프리트레이닝 (Pre-training)
- 정의: 프리트레이닝은 모델이 처음에 일반적인 패턴과 언어 구조, 그리고 다양한 지식을 대규모 데이터셋을 통해 학습하는 단계입니다.
- 목표: 모델이 기본적인 언어 이해 능력과 일반적인 특징을 학습해, 이후에 더 구체적인 작업에 적용할 수 있도록 준비시키는 것입니다.
- 과정: 자가 지도 학습(self-supervised learning) 방식으로, 예를 들어 다음 단어를 예측하거나(BERT의 경우 일부 단어 마스킹 후 예측), GPT처럼 주어진 문맥에서 다음 단어를 생성하는 방식으로 학습됩니다.
- 예시: GPT 모델이 위키백과나 웹에서 수집된 텍스트 데이터를 학습해 일반적인 언어 패턴을 이해하는 것.
- 결과: 특정 작업에 맞춰진 건 아니지만 다양한 작업을 수행할 수 있는 일반적인 지식을 가진 모델이 나옵니다.
2. 파인튜닝 (Fine-tuning)
- 정의: 파인튜닝은 프리트레이닝된 모델을 특정 작업이나 데이터셋에 맞게 추가로 학습시키는 과정입니다.
- 목표: 프리트레이닝 과정에서 학습한 일반적인 지식을 특정한 작업에 맞게 조정하고 최적화하는 것입니다.
- 과정: 특정 작업에 필요한 레이블이 있는 데이터를 사용해 모델의 가중치를 추가로 조정하여, 그 작업에 적합한 성능을 발휘하도록 만듭니다.
- 예시: GPT-3 모델을 대화 요약 데이터셋으로 파인튜닝하여, 대화를 요약하는 작업에 최적화된 모델을 만드는 것.
- 결과: 특정 작업에 특화된 성능을 발휘하는 모델이 나오며, 이 모델은 해당 작업에서는 좋은 성능을 보이지만 다른 작업에서는 성능이 떨어질 수 있습니다.
3. 인컨텍스트 러닝 (In-context Learning)
- 정의: 인컨텍스트 러닝은 모델이 추가적인 학습(가중치 업데이트) 없이도 몇 가지 예시나 지시를 입력받아 바로 작업을 수행할 수 있는 능력을 말합니다.
- 목표: 프리트레이닝된 지식을 바탕으로 입력 시 제공된 예시나 지시를 통해 작업을 이해하고 수행하는 것입니다.
- 과정: 모델은 입력 내에 주어진 몇 가지 예시나 설명을 바탕으로 작업을 처리합니다. 이 과정에서 모델의 가중치가 업데이트되지는 않습니다.
- 예시: GPT-3에게 몇 개의 번역 예시를 제공한 뒤, 새로운 문장을 번역하도록 요청하는 것. 모델은 그 예시를 바탕으로 번역 작업을 수행합니다.
- 결과: 모델은 특정 작업에 맞춰지지 않았지만, 주어진 예시나 지시에 따라 유연하게 작업을 수행할 수 있습니다. 그러나 파인튜닝된 모델만큼 최적화된 결과를 제공하지는 않을 수 있습니다.
주요 차이점:
- 프리트레이닝은 모델이 다양한 텍스트 데이터로 일반적인 언어 지식을 학습하는 초기 단계입니다.
- 파인튜닝은 모델을 특정 작업에 맞게 추가로 학습시키는 과정입니다.
- 인컨텍스트 러닝은 모델이 주어진 예시나 설명만으로 작업을 수행할 수 있는 능력을 의미하며, 추가 학습이 필요하지 않습니다.
'DeepLearning > NLP' 카테고리의 다른 글
[논문 리뷰] Pre-train, Prompt, and Predict: A Systematic Survey ofPrompting Methods in Natural Language Processing (0) | 2024.09.19 |
---|---|
[LLM] 모델이 학습하는 Fine-tuning의 다양한 방법 (0) | 2024.09.19 |
gpt 너는 내가 하는 말의 핵심을 어떻게 파악하는거야? (1) | 2024.09.17 |
[LLM] 모델의 핵심요소, 가중치weight (0) | 2024.09.16 |
[LLM] Transformer 모델에서 선형 변환(linear transformation)을 사용하는 이유 (1) | 2024.09.16 |
250x250
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- Python
- #패스트캠퍼스 #패스트캠퍼스ai부트캠프 #업스테이지패스트캠퍼스 #upstageailab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
- 리스트
- LLM
- Numpy
- 티스토리챌린지
- 오블완
- RAG
- t5
- English
- classification
- #패스트캠퍼스 #UpstageAILab #Upstage #부트캠프 #AI #데이터분석 #데이터사이언스 #무료교육 #국비지원 #국비지원취업 #데이터분석취업 등
- 코딩테스트
- Transformer
- LIST
- recursion #재귀 #자료구조 # 알고리즘
- Github
- Lora
- Hugging Face
- 파이썬
- #패스트캠퍼스 #패스트캠퍼스AI부트캠프 #업스테이지패스트캠퍼스 #UpstageAILab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
- 해시
- 손실함수
- Array
- cnn
- PEFT
- clustering
- git
- speaking
- nlp
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
글 보관함