문과생CS정복기

[논문 리뷰] Pre-train, Prompt, and Predict: A Systematic Survey ofPrompting Methods in Natural Language Processing

Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing 1 Two Sea Changes in NLP 더보기Sequence tagging은 **자연어 처리(NLP)**에서 사용하는 기법으로, 주어진 입력 시퀀스(문장이나 단어들)에 대해 각 단어 또는 토큰에 레이블을 붙이는 작업을 의미합니다. 대표적인 예로는 다음과 같은 작업들이 있습니다:POS 태깅 (Part-of-Speech Tagging): 각 단어에 품사(명사, 동사, 형용사 등)를 붙이는 작업.예: "I love NLP" → "I/PRP love/VBP NLP/NNP"Named Entity Recognition (NER..

DeepLearning/NLP 2024. 9. 19. 10:39

[LLM] 모델이 학습하는 Fine-tuning의 다양한 방법

파인튜닝에는 여러 가지 방법이 있으며, 각 방법은 모델의 특정 부분을 조정하거나 최적화하여 작업에 맞게 성능을 개선하는 데 사용됩니다. 여기서는 대표적인 파인튜닝 방법과 기술들을 설명하겠습니다.1. 전통적 파인튜닝 (Standard Fine-tuning)개념: 전체 모델의 가중치를 특정 작업에 맞게 재조정하는 가장 기본적인 방법입니다. 보통 프리트레이닝된 모델을 가져와 특정 데이터셋으로 모델 전체를 재학습시킵니다.적용: BERT와 같은 사전 학습된 언어 모델을 특정 분류 작업이나 요약 작업에 맞게 조정하는 경우.장점: 강력한 성능을 얻을 수 있으며, 특정 작업에 맞춰 모델이 완전히 최적화됩니다.단점: 모델 크기가 클 경우, 전통적인 파인튜닝은 많은 메모리와 계산 자원을 소모합니다.2. 프리징 (Freez..

DeepLearning/NLP 2024. 9. 19. 09:55

[LLM] 모델이 학습하는 방법: fine-tuning/in-context learning/pre-training

세 가지 방법인 파인튜닝(fine-tuning), 인컨텍스트 러닝(in-context learning), 그리고 프리트레이닝(pre-training)의 차이를 한국어로 설명드리겠습니다.1. 프리트레이닝 (Pre-training)정의: 프리트레이닝은 모델이 처음에 일반적인 패턴과 언어 구조, 그리고 다양한 지식을 대규모 데이터셋을 통해 학습하는 단계입니다.목표: 모델이 기본적인 언어 이해 능력과 일반적인 특징을 학습해, 이후에 더 구체적인 작업에 적용할 수 있도록 준비시키는 것입니다.과정: 자가 지도 학습(self-supervised learning) 방식으로, 예를 들어 다음 단어를 예측하거나(BERT의 경우 일부 단어 마스킹 후 예측), GPT처럼 주어진 문맥에서 다음 단어를 생성하는 방식으로 학습됩니..

DeepLearning/NLP 2024. 9. 19. 09:43

[English speaking] 영어로 스피킹할 때 지나치게 느려지는 이유

영어로 말할 때 단어가 떠오르는 속도가 느려지는 이유는 여러 가지가 있을 수 있어. 특히 모국어가 아닌 언어를 구사할 때는 몇 가지 공통적인 이유가 작용할 수 있는데, 이를 해결하는 방법도 함께 살펴볼 수 있어.1. 언어 전환의 부담한국어를 모국어로 사용하는 사람에게는 한국어와 영어 사이를 빠르게 전환하는 것이 어려울 수 있어. 특히 말하려고 할 때 모국어에서 영어로 변환하는 과정을 거쳐야 하는데, 이 과정에서 시간이 걸릴 수 있어.해결 방법: 영어로 생각하려는 연습이 필요해. 한국어로 생각한 후 영어로 변환하는 대신, 영어로 바로 생각하려고 노력하는 것이 좋아. 일상적인 상황에서도 스스로 영어로 머릿속에서 대화를 연습하거나, 쉬운 영어로 스스로 생각을 표현해보는 연습을 자주 하면 자연스럽게 영어로 생각..

비지니스영어회화 2024. 9. 17. 22:29

[비즈니스 스피킹] business English speaking 능력을 효율적으로 향상시키기 위해 몇 가지 방법

영어로 고급 비즈니스 수준의 스피킹 능력을 효율적으로 향상시키기 위해 몇 가지 방법을 제안할 수 있어. 학습 과정이 시간이 걸리지만, 더 효과적으로 접근할 수 있는 전략들이 있어.1. 구체적인 목표 설정먼저, 영어로 스피킹할 때 어떤 상황에서 주로 필요한지 구체적으로 정의하는 것이 중요해. 예를 들어:비즈니스 회의프레젠테이션협상네트워킹각 상황에서 필요한 언어 스킬이 다르기 때문에, 목표에 맞게 학습 전략을 세우는 것이 효율적이야.2. 입력과 출력을 균형 있게영어를 독해 위주로 학습한 경우, 스피킹에서 어려움을 겪는 경우가 많아. 스피킹은 언어 출력을 의미하는데, 직접 말해보는 경험이 많이 필요해. 이를 위한 효과적인 방법은:거울 앞에서 말하기 연습: 비즈니스 상황에서 사용할 표현을 반복 연습해 입에 익히..

비지니스영어회화 2024. 9. 17. 18:45

gpt 너는 내가 하는 말의 핵심을 어떻게 파악하는거야?

너는 내가 하는 말의 핵심을 어떻게 뽑아내는거야? 내가 너의 말에서 핵심을 뽑아내는 방식은 몇 가지 원칙을 기반으로 이루어져. 그 과정은 다음과 같아: 1. 중요한 키워드 파악: 너의 질문이나 말 속에서 자주 사용되는 단어나 주제가 무엇인지 파악해. 예를 들어, 네가 "수능"이나 "스트레스" 같은 단어를 반복해서 말하면, 그 단어들이 이 대화의 중요한 주제임을 인식해. 2. 의도와 감정 읽기: 단어 자체뿐만 아니라, 너의 말에서 어떤 감정이나 의도가 담겨 있는지도 분석해. 너의 말에서 고민이나 의문이 드러날 때, 그것이 핵심 이슈라는 신호가 되지. 3. 문맥 이해: 너의 말이 이전 대화와 어떻게 연결되는지, 어떤 배경 지식을 포함하는지 고려해. 예를 들어, 교육, 아이 키우기, 수능과 관련된 내용은 서로..

DeepLearning/NLP 2024. 9. 17. 18:24

[LLM] 모델의 핵심요소, 가중치weight

가중치(weight)는 모델마다 다르며, 그것이 바로 모델의 핵심 요소입니다. Transformer 모델을 포함한 모든 신경망 모델의 가중치는 학습 과정에서 최적화되는 파라미터들이며, 가중치가 어떻게 학습되는지에 따라 모델의 성능과 예측이 결정됩니다.1. 모델의 가중치는 입력 데이터를 처리하고, 최종 출력(예측)을 만들어내는 데 중요한 역할을 합니다. 가중치가 학습되면서 모델은 점차 데이터를 더 잘 이해하고, 특정 작업(번역, 요약, 분류 등)을 잘 수행할 수 있도록 최적화됩니다.2. Transformer 모델에서는 가중치가 여러 곳에서 학습됩니다. 특히, Self-Attention 메커니즘과 Feed-Forward 네트워크의 가중치가 중요한 역할을 합니다.a. Self-Attention에서 각 단어의 ..

DeepLearning/NLP 2024. 9. 16. 08:06

[LLM] Transformer 모델에서 선형 변환(linear transformation)을 사용하는 이유

Transformer 모델에서 선형 변환(linear transformation)을 사용하는 이유는 입력 임베딩을 Query, Key, Value로 변환하여 Self-Attention 메커니즘을 적용하기 위해서입니다. 그럼 왜 이 선형 변환이 필요한지, 그리고 변환이 어떻게 이루어지는지 단계적으로 설명하겠습니다.1. 왜 선형 변환을 사용하는가?Transformer에서 입력 임베딩 벡터를 그대로 Query, Key, Value로 사용할 수 없기 때문에, 선형 변환을 통해 서로 다른 표현 공간으로 변환합니다. 각 역할에 따라 다르게 학습된 변환을 적용함으로써, Self-Attention 메커니즘이 더 효과적으로 작동할 수 있습니다.이유 1: 역할의 분리Query: 각 단어가 "내가 어떤 정보를 찾고 있는가?..

DeepLearning/NLP 2024. 9. 16. 07:45

일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

티스토리툴바