IV: Information ValueClassification에서 "IV"는 일반적으로 Information Value를 의미합니다. Information Value는 변수와 목표 변수(종속 변수) 간의 관계를 평가하는 데 사용되는 통계적 측정치입니다. 이는 주로 신용 점수 모델링이나 이진 분류 문제에서 변수 선택 및 모델의 예측력을 평가하는 데 사용됩니다.Information Value는 주어진 변수의 각 범주에 대해 좋은 사건(good)과 나쁜 사건(bad)의 비율 차이를 계산하여 그 변수의 예측력을 나타냅니다. IV 값이 높을수록 그 변수는 목표 변수를 잘 설명할 수 있음을 의미합니다.IV 값의 해석은 다음과 같습니다:IV 0.02 ≤ IV 0.1 ≤ IV 0.3 ≤ IV IV ≥ 0.5: 매우 ..
다중 클래스 문제는 이진 분류가 아닌 다중 분류 문제를 의미합니다. 이를 조금 더 자세히 설명하면 다음과 같습니다:이진 분류 (Binary Classification)이진 분류는 두 개의 클래스(또는 범주) 중 하나로 데이터를 분류하는 문제를 말합니다. 예를 들어:이메일이 스팸인지 아닌지를 분류 (스팸 vs. 정상 메일)환자가 특정 질병이 있는지 없는지를 분류 (질병 있음 vs. 없음)이진 분류 문제에서는 일반적으로 두 개의 레이블을 사용하며, Gini Index나 이진 크로스 엔트로피 손실 함수를 사용하여 모델을 학습시킵니다.다중 클래스 분류 (Multiclass Classification)다중 클래스 분류는 두 개 이상의 클래스 중 하나로 데이터를 분류하는 문제를 말합니다. 예를 들어:손글씨 숫자 인..
Classification에서의 "Measuring Impurity for Split"는 결정 트리와 같은 분류 알고리즘에서 사용되는 개념으로, 데이터를 어떻게 나눌지 결정하는 기준입니다. 이를 통해 분할된 데이터의 순도(Homogeneity)를 최대화하고, 불순도(Impurity)나 불확실성(Uncertainty)을 최소화하려고 합니다.여기서 중요한 개념을 쉽게 설명하면 다음과 같습니다:순도(Homogeneity)와 불순도(Impurity)순도(Homogeneity): 데이터가 얼마나 잘 모여 있는지, 즉 같은 클래스에 속하는 데이터가 얼마나 많은지를 나타냅니다. 순도가 높을수록 같은 클래스의 데이터가 많이 모여 있다는 의미입니다.불순도(Impurity): 데이터가 얼마나 섞여 있는지, 즉 서로 다른 ..
Classification에서 Loss Function(손실 함수)은 모델이 예측한 값과 실제 값 사이의 차이를 측정하는 함수로, 모델을 학습시키는 데 중요한 역할을 합니다. 손실 함수는 모델의 예측 성능을 평가하고, 최적화 과정에서 이를 최소화함으로써 모델의 성능을 향상시킵니다. 다양한 분류 문제에 맞춰 여러 종류의 손실 함수가 사용되며, 대표적인 예로는 다음과 같습니다.1. 크로스 엔트로피 손실 (Cross-Entropy Loss)크로스 엔트로피 손실 함수는 분류 문제에서 가장 많이 사용되는 손실 함수 중 하나입니다. 특히, 다중 클래스 분류 문제에서 소프트맥스 활성화 함수와 함께 사용됩니다. 크로스 엔트로피 손실 함수는 주로 로지스틱 회귀(logistic regression)나 신경망(neural ..
회귀(Regression)와 분류(Classification)는 머신 러닝의 두 가지 주요 문제 유형입니다. 이 두 가지 문제는 데이터의 특성과 목표에 따라 모델을 학습시키는 방식이 다릅니다. 다음은 회귀와 분류의 주요 차이점을 설명한 내용입니다.회귀 (Regression)정의회귀는 연속적인 숫자 값을 예측하는 문제입니다. 목표 변수(종속 변수)는 연속적이며, 모델의 출력도 연속적인 값입니다.예시주택 가격 예측주식 시장 예측날씨 예측 (온도, 강수량 등)특정 시간 동안의 매출 예측알고리즘 예시선형 회귀 (Linear Regression)다항 회귀 (Polynomial Regression)릿지 회귀 (Ridge Regression)라쏘 회귀 (Lasso Regression)서포트 벡터 회귀 (Support..
- Total
- Today
- Yesterday
- RAG
- Hugging Face
- English
- #패스트캠퍼스 #패스트캠퍼스ai부트캠프 #업스테이지패스트캠퍼스 #upstageailab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
- Lora
- PEFT
- 손실함수
- 티스토리챌린지
- 파이썬
- speaking
- 코딩테스트
- recursion #재귀 #자료구조 # 알고리즘
- Transformer
- #패스트캠퍼스 #UpstageAILab #Upstage #부트캠프 #AI #데이터분석 #데이터사이언스 #무료교육 #국비지원 #국비지원취업 #데이터분석취업 등
- Python
- t5
- git
- 리스트
- clustering
- Github
- Array
- nlp
- LLM
- cnn
- 해시
- LIST
- classification
- #패스트캠퍼스 #패스트캠퍼스AI부트캠프 #업스테이지패스트캠퍼스 #UpstageAILab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
- Numpy
- 오블완
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |