본문 바로가기

좋아하는 것_매직IT/24.tensorflow

1.tensorflow, 학습(Learning)에 대해서 알아보자.

부자되는매직TV 2020. 12. 31. 14:13

728x90

블로그 목적

머신러닝에서 학습에 대한 정의를 알아본다.

학습(Learning) 이란?

현재까지 축적한 데이터(historical data)를 실행 가능한 태스크를 예측하고 도출하는 데 사용하는 것을 말함.
- 즉, 학습할 수 있어야 지능형 시스템이 될 수 있음.
학습을 정의하기 위한 고려사항 정리
- 하나, 학습모델 및 필요한 것이 무엇인지 정의함.
- 둘, 데이터관련 요구 사항 / 데이터셋 확인.
- 셋, 학습 모델의 대상 데이터셋의 전체 / 일부 에 대해 정의함.
모델이란?
- 데이터 셋에 알고리즘을 적용해 얻은 결과를 말하고, 패턴형태로 나타나게됨.

그럼, 머신러닝에서 사용되는 2가지 데이터 셋(dataset)에 대해서 알아보자.

하나, 입력 데이터 / 예상결과데이터가 모두 포함된 데이터 셋
- 수작업을 통해서 마련됨.
- 입력 데이터와 예상결과 데이터가 있다는 것은,
  - 패턴 or 규칙을 생성하기 위해 지도학습(supervised learning)을 활용하는데 매우 중요한 요소.
둘, 입력데이터만 있는 데이터 셋
- 예측이 필요한 경우.
  - 즉, 결과가 없기때문에 예상되는 결과를 얻으려면, 예측이 필요함.

그럼, 데이터 분류의 3가지에 대해서 알아보자.

학습용
- training 을 위한 데이터
검증용
- validation 을 위한 데이터
테스트용
- testing 을 위한 데이터
여기서 우리가 알아야 할것은,
- 데이터를 어떤 비율로 나눌지에 대해서 정하면됨.
  - ex) 70(학습용) + 20(검증용) + 10(테스트용) = 100%(총 데이터)

그럼, 머신러닝 구성의 3단계를 알아보자.

1단계
- 학습 단계
  - 학습 모델을 만들기 위해 학습 데이터 셋이 사용됨.
    - 학습 데이터 셋은 입력값과 출력값이 잘 매핑되어 있는 것.
  - 결과물
    - 학습 단계를 거치면 학습모델이 생성됨.
2단계
- 검증 및 테스트 단계
  - 생성된 학습 모델의 성능을 검토하는 과정이고, 검증 데이터셋이 사용됨.
    - 모델의 속성을 측정하는 기준
      - 오차측정(error measure)
      - 재현율(recall)
      - 정밀도(precision)
  - 결과물
    - 성능이 향상된 학습모델
3단계
- 적용 단계
  - 실제 데이터를 대상으로 분석결과를 만들어 내게 됨.
모델 액션 예측에 대한 학습의 적용
- - 주요사항
    - 원본데이터에서 3가지 데이터 셋을 추려내고 정제해서 그룹화함.
      - 학습 데이터 / 평가 데이터 / 테스트 데이터 셋
    - 학습데이터셋과 머신러닝 알고리즘 활용
      - 해당과정에서는 모델을 만들고 다듬는 과정이 필수임.
    - 테스트데이터 셋을 통한 모델의 검증도 필수요소임

결론

학습(Learning) 이란, 현재까지 축적한 데이터(historical data)를 실행 가능한 태스크를 예측하고 도출하는 데 사용하는 것을 말함.

오늘도 머신러닝에서 학습에 대한 지식 한가지 획득완료! 감사합니다.

728x90

저작자표시 비영리 변경금지 (새창열림)

'좋아하는 것_매직IT > 24.tensorflow' 카테고리의 다른 글

5.tensorflow, 머신러닝에서 학습관련 세부 분야에 대해서 알아보자. (0)	2020.12.31
4.tensorflow, 머신러닝에서 데이터관련 비일관성문제에 대해서 알아보자. (0)	2020.12.31
3.tensorflow, 머신러닝에서 태스크, 알고리즘,모델에 대해서 간단하게 정리하고 알아보자. (0)	2020.12.31
2.tensorflow, 머신러닝에서 데이터(data)에 대한 의미란? (0)	2020.12.31
0.tensorflow, 머신러닝(machine learning)이란? (0)	2020.09.27

티스토리툴바