만약 sales를 X 변수에 포함하여 sales y를 예측하려고 한다면 ml돌릴 때 어떤 결과가 나올까?만약 sales 컬럼을 독립 변수(X)에 포함하여 sales를 종속 변수(y)로 예측하려고 한다면, 모델이 미래의 매출을 예측하기 위해 현재의 매출을 사용하게 되므로 데이터 누수(data leakage) 문제가 발생합니다. 이는 모델이 훈련 데이터에서 너무 많은 정보를 얻어 과적합(overfitting)하게 되어 테스트 데이터에서의 성능이 크게 떨어지는 원인이 됩니다.데이터 누수란?데이터 누수는 모델이 훈련 중에 예측하고자 하는 대상 변수와 관련된 정보를 부적절하게 사용하게 되는 상황을 말합니다. 이는 모델의 성능을 과대평가하게 만들며, 실제 예측 성능이 저하됩니다. 그러면 2주 간격의 요일별 평균 매..
라쏘(Lasso)와 리지(Ridge)는 회귀 분석에서 자주 사용되는 두 가지 규제(regularization) 기법입니다만 다른 머신러닝모델에서도 활용될 수 있습니다. 이들은 모델의 복잡도를 조절하여 과적합(overfitting)을 방지하고, 예측 성능을 향상시키는 데 도움을 줍니다. 간단히 설명하면 다음과 같습니다.라쏘 회귀란 무엇인가요?라쏘 회귀는 데이터 분석에서 예측 모델을 만드는 방법 중 하나입니다. 특히, 데이터에 많은 특성(변수)이 있을 때 중요한 특성만을 선택해 주는 방법입니다.라쏘 회귀의 기본 개념Least Absolute Shrinkage and Selection Operator (Lasso):이름의 의미: '최소 절대 축소 및 선택 연산자'라는 뜻입니다.목표: 중요한 특성만 남기고 불필..
- Total
- Today
- Yesterday
- cnn
- 코딩테스트
- 손실함수
- Python
- classification
- 오블완
- git
- 파이썬
- LIST
- Transformer
- #패스트캠퍼스 #UpstageAILab #Upstage #부트캠프 #AI #데이터분석 #데이터사이언스 #무료교육 #국비지원 #국비지원취업 #데이터분석취업 등
- English
- 해시
- Array
- PEFT
- LLM
- Lora
- recursion #재귀 #자료구조 # 알고리즘
- clustering
- #패스트캠퍼스 #패스트캠퍼스AI부트캠프 #업스테이지패스트캠퍼스 #UpstageAILab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
- #패스트캠퍼스 #패스트캠퍼스ai부트캠프 #업스테이지패스트캠퍼스 #upstageailab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
- 티스토리챌린지
- RAG
- Github
- t5
- Numpy
- Hugging Face
- 리스트
- nlp
- speaking
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |