'ML' 카테고리의 글 목록 (2 Page)

prophet 모델 예측 이후 성능 높이는 방법

1. 추가 데이터 통합외부 데이터: 공휴일, 기후 조건, 경제 지표 등 외부 데이터를 모델에 포함시키면 예측의 정확도를 높일 수 있습니다. Prophet은 공휴일과 특별 이벤트를 모델에 포함시키는 기능을 제공합니다.프로모션 데이터: 판매 촉진 행사 정보가 있다면, 이를 모델에 포함시켜 판매량 증가 예측을 개선할 수 있습니다.2. 하이퍼파라미터 조정계절성 조정: 주간, 연간 계절성의 파라미터를 조정하거나, 데이터에 맞는 새로운 계절성을 정의할 수 있습니다.변경점(changepoint) 조정: Prophet 모델의 변경점 감도를 조정하여 모델이 추세의 변화를 더 잘 감지하도록 할 수 있습니다. changepoint_prior_scale의 값을 조정해 보세요.3. 피쳐 엔지니어링라그 변수: 과거 판매 데이터의..

ML 2024. 7. 3. 23:34

시계열 데이터 예측 - Facebook의 Prophet

Facebook의 Prophet은 시계열 데이터를 예측하기 위해 개발된 모델로, 특히 계절성을 갖는 데이터에 대한 예측에 강점을 보입니다. Prophet은 비교적 이해하기 쉽고 사용하기 편리하며, 자동화된 추세 및 계절성 구성 요소의 조정을 통해 높은 성능의 예측을 제공합니다. 이 모델은 특히 비선형 추세가 시간에 따라 변하는 시계열 데이터에 적합하도록 설계되었습니다.Prophet 모델의 주요 구성 요소추세(Trend) 모델링:Prophet은 시계열 데이터의 추세를 모델링하기 위해 두 가지 방법을 제공합니다: 비선형 로지스틱 성장 모델과 선형 성장 모델.사용자는 성장의 한계나 포화 최대점을 설정할 수 있으며, 이는 주로 시장 포화 상태나 상한/하한이 예측되는 경우에 유용합니다.계절성(Seasonality..

ML 2024. 7. 3. 17:07

머신러닝 함수 정의의 수학적 표현

*패스트캠퍼스 UPSTAGE AI 박선규 강사 강의에서 발췌

ML 2024. 7. 2. 02:34

data leakage 데이터 누수, overfitting 과적합

만약 sales를 X 변수에 포함하여 sales y를 예측하려고 한다면 ml돌릴 때 어떤 결과가 나올까?만약 sales 컬럼을 독립 변수(X)에 포함하여 sales를 종속 변수(y)로 예측하려고 한다면, 모델이 미래의 매출을 예측하기 위해 현재의 매출을 사용하게 되므로 데이터 누수(data leakage) 문제가 발생합니다. 이는 모델이 훈련 데이터에서 너무 많은 정보를 얻어 과적합(overfitting)하게 되어 테스트 데이터에서의 성능이 크게 떨어지는 원인이 됩니다.데이터 누수란?데이터 누수는 모델이 훈련 중에 예측하고자 하는 대상 변수와 관련된 정보를 부적절하게 사용하게 되는 상황을 말합니다. 이는 모델의 성능을 과대평가하게 만들며, 실제 예측 성능이 저하됩니다. 그러면 2주 간격의 요일별 평균 매..

ML 2024. 6. 11. 14:45

Why does GluonTS perform well?

GluonTS achieves high accuracy in time series forecasting for several reasons:1. Probabilistic Forecasting:Uncertainty Quantification: GluonTS provides probabilistic forecasts, which means it not only predicts the future values but also provides confidence intervals. This helps in understanding the range within which the actual values might fall.Advanced Probabilistic Models: GluonTS includes mo..

ML 2024. 6. 9. 21:50

tsfresh, sktime, darts, gluonts, prophet: which is the best performance?

When it comes to time series forecasting, the performance of a model can be highly dependent on the specific characteristics of the data and the problem at hand. However, here is an overview of each of the mentioned libraries, along with their strengths and common use cases:blue-yonder/tsfresh:Strengths: tsfresh is a feature extraction library for time series data. It automatically extracts hund..

ML 2024. 6. 9. 21:46

Feature Selection

특성의 수를 줄이는 방법에는 여러 가지가 있습니다. 특성 선택(feature selection)과 차원 축소(dimensionality reduction)를 통해 불필요한 특성을 제거하거나 변환할 수 있습니다. 아래에 몇 가지 방법을 소개합니다.1. 특성 선택 (Feature Selection)1.1. 필터 방식 (Filter Method)통계적 방법을 사용하여 각 특성의 중요도를 평가하고, 중요도가 낮은 특성을 제거합니다.분산 임계값 (Variance Threshold): 분산이 낮은 특성을 제거합니다. from sklearn.feature_selection import VarianceThreshold selector = VarianceThreshold(threshold=0.1) X_reduced..

ML 2024. 6. 8. 16:16

t-SNE(t-Distributed Stochastic Neighbor Embedding)

t-SNE(t-Distributed Stochastic Neighbor Embedding)은 고차원 데이터의 시각화를 위해 사용되는 차원 축소 기법입니다. 특히 데이터의 복잡한 구조와 클러스터를 저차원(주로 2차원 또는 3차원)으로 시각화하는 데 매우 효과적입니다.t-SNE의 주요 개념지역적 구조 보존:t-SNE는 고차원 데이터의 지역적 구조를 저차원 공간에서도 보존하려고 합니다. 즉, 고차원 공간에서 가까운 데이터 포인트들이 저차원 공간에서도 가깝게 유지되도록 합니다.확률 분포:고차원 공간에서 데이터 포인트 쌍 간의 유사도를 확률 분포로 변환합니다. 저차원 공간에서도 동일한 방식으로 확률 분포를 생성하여 두 분포 간의 차이를 최소화하는 방식으로 차원을 축소합니다.쿨백-라이블러 발산 (KL Diverge..

ML 2024. 6. 2. 14:15

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

문과생CS정복기

티스토리툴바