반응형
블로그 목적
- 머신러닝에서 학습에 대한 정의를 알아본다.
학습(Learning) 이란?
- 현재까지 축적한 데이터(historical data)를 실행 가능한 태스크를 예측하고 도출하는 데 사용하는 것을 말함.
- 즉, 학습할 수 있어야 지능형 시스템이 될 수 있음.
- 학습을 정의하기 위한 고려사항 정리
- 하나, 학습모델 및 필요한 것이 무엇인지 정의함.
- 둘, 데이터관련 요구 사항 / 데이터셋 확인.
- 셋, 학습 모델의 대상 데이터셋의 전체 / 일부 에 대해 정의함.
- 모델이란?
- 데이터 셋에 알고리즘을 적용해 얻은 결과를 말하고, 패턴형태로 나타나게됨.
그럼, 머신러닝에서 사용되는 2가지 데이터 셋(dataset)에 대해서 알아보자.
- 하나, 입력 데이터 / 예상결과데이터가 모두 포함된 데이터 셋
- 수작업을 통해서 마련됨.
- 입력 데이터와 예상결과 데이터가 있다는 것은,
- 패턴 or 규칙을 생성하기 위해 지도학습(supervised learning)을 활용하는데 매우 중요한 요소.
- 둘, 입력데이터만 있는 데이터 셋
- 예측이 필요한 경우.
- 즉, 결과가 없기때문에 예상되는 결과를 얻으려면, 예측이 필요함.
- 예측이 필요한 경우.
그럼, 데이터 분류의 3가지에 대해서 알아보자.
- 학습용
- training 을 위한 데이터
- 검증용
- validation 을 위한 데이터
- 테스트용
- testing 을 위한 데이터
- 여기서 우리가 알아야 할것은,
- 데이터를 어떤 비율로 나눌지에 대해서 정하면됨.
- ex) 70(학습용) + 20(검증용) + 10(테스트용) = 100%(총 데이터)
- 데이터를 어떤 비율로 나눌지에 대해서 정하면됨.
그럼, 머신러닝 구성의 3단계를 알아보자.
- 1단계
- 학습 단계
- 학습 모델을 만들기 위해 학습 데이터 셋이 사용됨.
- 학습 데이터 셋은 입력값과 출력값이 잘 매핑되어 있는 것.
- 결과물
- 학습 단계를 거치면 학습모델이 생성됨.
- 학습 모델을 만들기 위해 학습 데이터 셋이 사용됨.
- 학습 단계
- 2단계
- 검증 및 테스트 단계
- 생성된 학습 모델의 성능을 검토하는 과정이고, 검증 데이터셋이 사용됨.
- 모델의 속성을 측정하는 기준
- 오차측정(error measure)
- 재현율(recall)
- 정밀도(precision)
- 모델의 속성을 측정하는 기준
- 결과물
- 성능이 향상된 학습모델
- 생성된 학습 모델의 성능을 검토하는 과정이고, 검증 데이터셋이 사용됨.
- 검증 및 테스트 단계
- 3단계
- 적용 단계
- 실제 데이터를 대상으로 분석결과를 만들어 내게 됨.
- 적용 단계
- 모델 액션 예측에 대한 학습의 적용
-
-
주요사항
-
원본데이터에서 3가지 데이터 셋을 추려내고 정제해서 그룹화함.
-
학습 데이터 / 평가 데이터 / 테스트 데이터 셋
-
-
학습데이터셋과 머신러닝 알고리즘 활용
-
해당과정에서는 모델을 만들고 다듬는 과정이 필수임.
-
-
테스트데이터 셋을 통한 모델의 검증도 필수요소임
-
-
-
결론
- 학습(Learning) 이란, 현재까지 축적한 데이터(historical data)를 실행 가능한 태스크를 예측하고 도출하는 데 사용하는 것을 말함.
오늘도 머신러닝에서 학습에 대한 지식 한가지 획득완료! 감사합니다.
300x250
'좋아하는 것_매직IT > 24.tensorflow' 카테고리의 다른 글
5.tensorflow, 머신러닝에서 학습관련 세부 분야에 대해서 알아보자. (0) | 2020.12.31 |
---|---|
4.tensorflow, 머신러닝에서 데이터관련 비일관성문제에 대해서 알아보자. (0) | 2020.12.31 |
3.tensorflow, 머신러닝에서 태스크, 알고리즘,모델에 대해서 간단하게 정리하고 알아보자. (0) | 2020.12.31 |
2.tensorflow, 머신러닝에서 데이터(data)에 대한 의미란? (0) | 2020.12.31 |
0.tensorflow, 머신러닝(machine learning)이란? (0) | 2020.09.27 |