Linear Regression
어떠한 Regreassion 모델이 어떠한 트레이닝 데이터를 통해서 학습을 했을때 해당 regression은 어떠한 예측을 실행할때 학습된데이터를 토대로 결과를 도출해 냅니다. 이러한 백터데이터를 통해 학습을 할때는 어떠한 하나의 가설을 새울 필요가 있습니다. 해당 가설을통해서 데이터를 평가하는 것이 Linear Regression입니다. 이 가설에 대한 예를 들자면 어떠한 운동선수가 훈련시간이 길수록 결과가 좋아진다. 혹은 공부한 시간이 길수록 성적이 좋다. 등이 있겠습니다.
백터에서 선을 그으면서 데이터에 가장 근접한 값을 찾는 것입니다.
이를 수학적인 수식이
H(x) = Wx + b 입니다.
H(x)는 우리가 설정한 가설이 되는 것이고, W와 b에 따라서 백터위에 여러가지 형태의 선(가설)이 나타나게 되겠죠.
그럼 어떤 선이 우리가 원하는 가설과 가장 근접할까? 이를 알아내기 위해서는 실제데이터와 가설이 나타내는 선에대한 백터위에 점간에 거리를 계산하여서 평가를 하게 됩니다.
이를 표한한 수학적인 수식이 (H(x) - y)**2 가 됩니다. 이 (H(x) - y)**2 수식을 Cost function 이라고합니다.
m : 트레이닝데이터 갯수
1부터 m개 까지 더하는데 (H(x)(가설된 값) - 실제의값) 제곱 을 한 값에대한 m개만큼의 평균을 구하는 것입니다.
그렇다면 cost function은 실제적으로 cost(W,b)에 대한 function을 취하게 되는것입니다.
최종적으로 Linear Regression의 목적은 cost function의 값이 가장 작은 수를 도출해 내는 W와 b의 값을 구하는것이 되겠습니다.
'머신러닝' 카테고리의 다른 글
Machine Learning 기본적인 용어와 개념 (0) | 2023.04.16 |
---|