반응형

📝머신러닝 (훈련 / 학습)

사진이란 건 사진을 보는 각도, 조명, 타겟의 변형(고양이의 자세)에 따라서 너무나 천차만별이라 사진으로부터 공통된 명확한 특징을 잡아내는 것이 쉽지 않습니다. 사실, 결론을 미리 말씀드리면 해당 프로그램은 숫자를 정렬하는 것과 같은 명확한 알고리즘이 애초에 존재하지 않습니다. 머신 러닝은 데이터가 주어지면, 기계가 스스로 데이터로부터 규칙성을 찾는 것에 집중합니다. 주어진 데이터로부터 규칙성을 찾는 과정을 우리는 훈련(training) 또는 학습(learning)이라고 합니다.

 

📝하이퍼파라미터 (초매개변수) vs 매개변수

  • 하이퍼파라미터(초매개변수)
    • 사람이 값을 지정하는 변수모델의 성능에 영향을 준다. 학습 전에 미리 설정되며 학습률, 배치 크기, 에포크, 레이어수 등이 있다.
  • 매개변수
    • 가중치와 편향과 같은 매개변수는 사용자가 결정해주는 값이 아니라 모델이 학습하는 과정에서 얻어지는 값입니다. 즉, 학습을 하는 동안 값이 계속해서 변하는 수입니다.

 

 

📝분류(Classification)와 회귀(Regression)

전부는 아니지만 머신 러닝의 많은 문제는 분류 또는 회귀 문제에 속합니다.

 

이진 분류 문제

  • 두개의 선택지 중 하나의 답을 선택해야하는 경우를 말합니다.
  • 예) 어떤 학생이 과학, 수학 중에 어떤 걸 좋아할까?

 

다중 클래스 분류

  • 세개 이상의 선택지중에서 답을 선택하는 경우를 말합니다.
  • 예) 어떤 학생이 과학, 수학, 영어 중에 어떤 걸 좋아할까?

 

회귀 문제

  • 둘중에 하나를 선택하는 것이 아닌 예측값을 찾아내는 역할을 합니다.
  • 예) 사람이 190cm이면서 다른 여러 조건이 주어졌을 때 이 사람의 몸무게는 얼마일까?

 

 

📝지도 학습, 비지도 학습, 자기지도 학습

지도 학습

  • 레이블과 정답을 이용해 학습하는 걸 의미합니다.

 

비지도 학습

  • 별도의 레이블 없이 학습하는 걸 의미합니다.

 

자기지도 학습

  • 모델이 학습하기 위해 스스로 데이터로부터 레이블을 만들어서 학습하는 경우를 의미합니다.

 

📝샘플, 특성

샘플과 특성이라는 말을 많이 사용하는데 샘플이란 하나의 시험체를 의미한다. 예를 들면 A라는 생선이 있으면 A라는 생선은 Sample1이 되는 것이고 눈이 2개이다. 입이 1개이다. 코가 없다. 이런 것들이 각각 특성이 되는 것이다.

 

 

📝과적합(Overfitting), 과소 적합 (Underfitting)

과적합

  • 과적합의 경우 훈련 데이터를 너무 과하게 학습해서 실제 그 외 데이터에 대해서는 맞추지 못합니다.

 

과소적합

  • 과소 적합의 경우 그 반대로 너무 훈련 데이터를 제대로 학습 안 해서 훈련 자체가 부족한 상황을 의미합니다.

 


🔗 참고 및 출처

https://wikidocs.net/21669

https://wikidocs.net/21679

https://wikidocs.net/32012

 

반응형