ML
베타𝛽계수 추정, 손실함수lossfunction, 편미분partial derivative, 폐쇄형 해Closed Form Solution
꼬꼬마코더
2024. 5. 28. 18:03
728x90
베타 계수(𝛽) 추정 방법
회귀 분석에서 우리는 데이터의 패턴을 찾기 위해 베타 계수(𝛽)를 추정합니다. 베타 계수는 각 독립 변수(특성)가 종속 변수(결과)에 얼마나 영향을 미치는지를 나타냅니다.
기본 개념
- 목표: 우리가 찾고자 하는 것은 회귀 계수인 베타(𝛽)입니다. 이 값들을 알아내면, 모델이 주어진 독립 변수들을 사용하여 결과를 예측할 수 있습니다.
- 편미분: 수학적으로 베타 계수를 찾기 위해, 우리는 손실 함수(Loss Function)를 사용합니다. 손실 함수는 모델의 예측값과 실제값 간의 차이를 측정하는 함수입니다. 이 손실 함수를 최소화하려면, 각 베타(𝛽)에 대해 편미분을 사용하여 최소값을 찾습니다.
손실 함수
선형 회귀의 손실 함수는 일반적으로 잔차 제곱합(Residual Sum of Squares, RSS)입니다:
RSS=∑𝑖=1𝑛(𝑦𝑖−𝑦^𝑖)2
여기서:
- 𝑦𝑖는 실제값
- 𝑦^𝑖는 예측값
- 𝑛은 데이터 포인트의 수
편미분을 사용한 베타 계수 추정
- 손실 함수를 미분: 손실 함수는 베타(𝛽)들의 함수입니다. 우리는 이 함수를 각 베타(𝛽)에 대해 편미분하여 최소값을 찾습니다. 미분을 통해 손실 함수가 최소가 되는 지점을 찾는 것입니다.
- 편미분이란 여러 변수 중 하나에 대해 미분을 하는 것입니다.
- 각 베타에 대해 미분: 만약 베타 계수가 여러 개라면, 각 베타에 대해 손실 함수를 미분합니다. 예를 들어, 베타가 두 개라면 𝛽1과 𝛽2에 대해 각각 미분합니다.
- 해를 구함: 미분한 후, 각 미분 값이 0이 되는 지점을 찾아서 베타 값을 구합니다. 이 값이 우리가 찾는 베타 계수입니다.
선형 회귀에서의 폐쇄형 해(Closed Form Solution)
선형 회귀에서는 손실 함수가 2차 함수(Quadratic Function)이기 때문에, 미분을 통해 쉽게 베타 계수를 구할 수 있습니다. 이를 폐쇄형 해(Closed Form Solution)라고 합니다. 수식으로 나타내면 다음과 같습니다:
𝛽^=(𝑋𝑇𝑋)−1𝑋𝑇𝑦
여기서:
- 𝑋는 독립 변수의 행렬
- 𝑋𝑇는 𝑋의 전치 행렬
- 𝑦는 종속 변수의 벡터
요약
- 목표: 베타(𝛽) 계수를 추정하여 모델이 주어진 데이터로부터 예측할 수 있도록 합니다.
- 손실 함수: 모델의 예측값과 실제값 간의 차이를 나타내는 함수입니다.
- 편미분: 각 베타에 대해 손실 함수를 미분하여 최소값을 찾습니다.
- 폐쇄형 해: 선형 회귀에서는 손실 함수가 2차 함수이기 때문에, 미분을 통해 베타 계수를 쉽게 구할 수 있습니다.
이 과정을 통해 우리는 회귀 모델의 베타 계수를 추정하고, 이를 사용하여 데이터를 기반으로 예측할 수 있습니다.