ML(머신러닝)?
머신러닝은 일종에 소프트웨어 입니다. 이 소프트웨어를 개발자들이 만들때 경우에따라선 엄청나게 많은 경우의수를 요구하는 경우가 존재합니다. 예를 들자면 스펨메일 필터같은 것이지요. 어떤 메일이 스펨인지 유효한 메일인지 컴퓨터가 가려내기위해서 개발자가 전부 분기처리하기엔 무리가 있기때문이죠. 그래서 탄생한것이 머신러닝입니다. 이러한 분기처리를 프로그렘자체가 데이터를 보고 학습하는 능력을 같게 하자는 취지에서 시작됐습니다. 무려 1950년도에 Arther라는 사람이 생각해 낸 이론입니다.
Supervised learning
어떠한 이미 정해져 있는 데이터를 토대로 학습을 시키는 것입니다. 예를 들자면 어떠한 이미지를통해 이 이미지에 고양이가 있는지 없는지 고양이라는 테그가 달려있는 이미지를 보고 학습을 하는것입니다. 이런 학습방식이 Supervised leaning입니다.
- 가장 일반적인 문제입니다.
- 이미지 레이블링, 이메일 스펨필터 등등에 이미 정해진 데이터셋이 있는경우 사용
Training data set이 있는 경우에 supervised learning을 사용하는데 기본적인 메커니즘은 다음과 같습니다.
머신러닝이라는 어떠한 모델이 존재하고 값의 특징 데이터인x와 값이 정해진 데이터 y축(레이블)이 있을때 y에 대한 x축의 데이터를 학습을 하게 되고 이때 만약 새로운 x가 등장했을때 지금 껏 학습했던 y(레이블)에 대한 학습된 데이터를 통해 x에대해 y라고 추론하는 행위를 실행합니다.
- Traning : 어떠한 데이터를통해 학습하는 행위
- Traning data : 학습시에 사용된 데이터
- regression
- 점수의 높고낮음을 통해 평가하는것
- binary classification (Pass/non-pass)
- true /false와 같이 두가지경우로 나누는 메커니즘을 통해 평가하는것
- multi-label classification
- 어떠한 조건에따라서 등급을 나누는 메커니즘을 통해 평가하는것
Unsupervised learning
Supervised leaning과 다르게 레이블이 정해져 있는것이 아니라 유동적인 데이터를보고 스스로 학습한다라는 개념입니다.
'머신러닝' 카테고리의 다른 글
Linear Regression 개념 (0) | 2023.04.16 |
---|