Table of Contents
728x90
Model Driven
- Weight Initialization: 모델의 가중치 초기화 방법으로, 학습의 시작점과 효율성에 영향을 줍니다. tahn, sigmoid, relu
- Drop out: 과적합을 방지하기 위해 학습 중 일부 뉴런을 무작위로 활성화하지 않는 방법입니다. 0.2~0.3
- Batch Normalization: 배치 단위로 입력 데이터의 분포가 평균이 0, 분산이 1이 되도록 정규화하여 학습을 안정화하고 가속화(빠른 학습 가능)합니다.
- Early Stop: 과적합을 방지하기 위해 검증 데이터(valid set)의 성능이 향상되지 않을 때 학습을 조기에 중단합니다.
- Transfer Learning: 사전에 학습된 모델을 새로운 작업에 적용하여 학습 시간을 단축하고 성능을 개선합니다.
- End to End vs Part: 모델이 전체 과정을 한 번에 처리하는 방식과 부분적으로 처리하는 방식의 차이입니다. 고도화할 경우 Part만 적용할 수 있습니다.
- ML vs DL: 기계 학습(ML)과 딥러닝(DL)의 차이점을 나타냅니다. 내가 가지고 있는 데이터셋이 적은 경우 ML을 사용하는 것이 좋을 수 있습니다. 설명력이 충분해야하는 경우 ML을 사용해야 할 수 있습니다.
이러한 요소들은 데이터를 기반으로 한 의사결정 프로세스에서 중요한 역할을 하며, 효과적인 모델 구축과 정확한 예측을 위해 필수적입니다.
Data Driven
- Data Distribution: 데이터의 분포를 이해하고, 이를 통해 모델이 데이터를 어떻게 해석해야 하는지 판단합니다. log normal distribution 을 적용할 수 있습니다.
- Data Scale: 데이터의 크기와 복잡성을 고려하여 처리 방법과 모델 선택을 결정합니다. train, test셋을 모두 StandardScaler 또는 MinMaxScaler를 적용하여 데이터를 통합시킬 수 있습니다. 새로운 데이터가 scale에서 벗어날 가능성이 있는 경우 MinMax는 적용하지 않는 것이 좋습니다.
- Binning: Domain Knowledge 특정 분야의 지식을 활용하여 데이터를 구간별로 나누어 분석의 효율성을 높이고, 범주형 변수 처리에 활용합니다.
- Feature Engineering: 데이터로부터 유용한 특징을 추출하거나 생성하여 target값과 더 관련있게 만드는 작업입니다.
- Dimension Reduction: 고차원의 데이터를 저차원으로 축소하여 분석의 복잡성을 줄이고 계산 효율성을 높입니다. feature selection: 특정 feature에 종속성이 강한 불필요한 feature는 제거하고 데이터의 특징을 잘 나타내는 주요 feature만 선택, feture extraction: feature를 함축적으로 잘 설명할 수 있는 또 다른 공간으로 매핑해서 추론
- Train Set vs Test Set vs Real Data: 모델을 만들고 배포하는 단계에서 생각할 수 있는 문제, 실제 데이터가 훈련 데이터와 테스트 데이터와의 차이가 있을 경우 데이터의 수집 자체에 문제가 있을 수 있습니다.
이러한 기법들은 모델의 성능과 학습 속도에 중대한 영향을 미칠 수 있습니다.
'DeepLearning' 카테고리의 다른 글
원격 서버 계속 돌아가게 만들기 tmux활용 (0) | 2024.09.02 |
---|---|
epoch 에포크? (0) | 2024.09.02 |
XAI, Explainable Artificial Intelligence (1) | 2024.08.16 |
Transfer Learning / Meta Learning / Few-Shot Learning (0) | 2024.08.16 |
MLE 최대가능추정법과 Generative Model 생성모델 (0) | 2024.08.13 |
250x250
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- recursion #재귀 #자료구조 # 알고리즘
- Transformer
- 오블완
- Github
- 리스트
- Numpy
- 코딩테스트
- Array
- RAG
- nlp
- 파이썬
- Lora
- classification
- LIST
- Python
- 손실함수
- cnn
- #패스트캠퍼스 #패스트캠퍼스AI부트캠프 #업스테이지패스트캠퍼스 #UpstageAILab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
- t5
- clustering
- PEFT
- LLM
- English
- #패스트캠퍼스 #UpstageAILab #Upstage #부트캠프 #AI #데이터분석 #데이터사이언스 #무료교육 #국비지원 #국비지원취업 #데이터분석취업 등
- speaking
- #패스트캠퍼스 #패스트캠퍼스ai부트캠프 #업스테이지패스트캠퍼스 #upstageailab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
- Hugging Face
- 티스토리챌린지
- git
- 해시
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
글 보관함