data leakage 데이터 누수, overfitting 과적합
만약 sales를 X 변수에 포함하여 sales y를 예측하려고 한다면 ml돌릴 때 어떤 결과가 나올까?만약 sales 컬럼을 독립 변수(X)에 포함하여 sales를 종속 변수(y)로 예측하려고 한다면, 모델이 미래의 매출을 예측하기 위해 현재의 매출을 사용하게 되므로 데이터 누수(data leakage) 문제가 발생합니다. 이는 모델이 훈련 데이터에서 너무 많은 정보를 얻어 과적합(overfitting)하게 되어 테스트 데이터에서의 성능이 크게 떨어지는 원인이 됩니다.데이터 누수란?데이터 누수는 모델이 훈련 중에 예측하고자 하는 대상 변수와 관련된 정보를 부적절하게 사용하게 되는 상황을 말합니다. 이는 모델의 성능을 과대평가하게 만들며, 실제 예측 성능이 저하됩니다. 그러면 2주 간격의 요일별 평균 매..
ML
2024. 6. 11. 14:45
250x250
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- recursion #재귀 #자료구조 # 알고리즘
- Github
- Python
- English
- Array
- 리스트
- Transformer
- 오블완
- PEFT
- clustering
- 코딩테스트
- git
- Hugging Face
- t5
- Lora
- 해시
- #패스트캠퍼스 #패스트캠퍼스ai부트캠프 #업스테이지패스트캠퍼스 #upstageailab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
- 파이썬
- classification
- LIST
- cnn
- speaking
- 손실함수
- nlp
- #패스트캠퍼스 #UpstageAILab #Upstage #부트캠프 #AI #데이터분석 #데이터사이언스 #무료교육 #국비지원 #국비지원취업 #데이터분석취업 등
- RAG
- #패스트캠퍼스 #패스트캠퍼스AI부트캠프 #업스테이지패스트캠퍼스 #UpstageAILab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
- LLM
- 티스토리챌린지
- Numpy
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
글 보관함