본문 바로가기

좋아하는 것_매직IT/24.tensorflow

1.tensorflow, 학습(Learning)에 대해서 알아보자.

반응형

블로그 목적

  • 머신러닝에서 학습에 대한 정의를 알아본다.

학습(Learning) 이란?

  • 현재까지 축적한 데이터(historical data)를 실행 가능한 태스크를 예측하고 도출하는 데 사용하는 것을 말함.
    • 즉, 학습할 수 있어야 지능형 시스템이 될 수 있음.
  • 학습을 정의하기 위한 고려사항 정리
    • 하나, 학습모델 및 필요한 것이 무엇인지 정의함.
    • 둘, 데이터관련 요구 사항 / 데이터셋 확인.
    • 셋, 학습 모델의 대상 데이터셋의 전체 / 일부 에 대해 정의함.
  • 모델이란?
    • 데이터 셋에 알고리즘을 적용해 얻은 결과를 말하고, 패턴형태로 나타나게됨.

그럼, 머신러닝에서 사용되는 2가지 데이터 셋(dataset)에 대해서 알아보자.

  • 하나, 입력 데이터 / 예상결과데이터가 모두 포함된 데이터 셋
    • 수작업을 통해서 마련됨.
    • 입력 데이터와 예상결과 데이터가 있다는 것은, 
      • 패턴 or 규칙을 생성하기 위해 지도학습(supervised learning)을 활용하는데 매우 중요한 요소.
  • 둘, 입력데이터만 있는 데이터 셋
    • 예측이 필요한 경우.
      • 즉, 결과가 없기때문에 예상되는 결과를 얻으려면, 예측이 필요함.

그럼, 데이터 분류의 3가지에 대해서 알아보자.

  • 학습용
    • training 을 위한 데이터
  • 검증용
    • validation 을 위한 데이터
  • 테스트용
    • testing 을 위한 데이터
  • 여기서 우리가 알아야 할것은,
    • 데이터를 어떤 비율로 나눌지에 대해서 정하면됨.
      • ex) 70(학습용) + 20(검증용) + 10(테스트용) =  100%(총 데이터)

그럼, 머신러닝 구성의 3단계를 알아보자.

  • 1단계
    • 학습 단계
      • 학습 모델을 만들기 위해 학습 데이터 셋이 사용됨.
        • 학습 데이터 셋은 입력값과 출력값이 잘 매핑되어 있는 것.
      • 결과물
        • 학습 단계를 거치면 학습모델이 생성됨.
  • 2단계
    • 검증 및 테스트 단계
      • 생성된 학습 모델의 성능을 검토하는 과정이고, 검증 데이터셋이 사용됨.
        • 모델의 속성을 측정하는 기준
          • 오차측정(error measure)
          • 재현율(recall)
          • 정밀도(precision)
      • 결과물
        • 성능이 향상된 학습모델
  • 3단계
    • 적용 단계
      • 실제 데이터를 대상으로 분석결과를 만들어 내게 됨.
  • 모델 액션 예측에 대한 학습의 적용  
      • 주요사항

        • 원본데이터에서 3가지 데이터 셋을 추려내고 정제해서 그룹화함.

          • 학습 데이터 / 평가 데이터 / 테스트 데이터 셋

        • 학습데이터셋과  머신러닝 알고리즘 활용

          • 해당과정에서는 모델을 만들고 다듬는 과정이 필수임.

        • 테스트데이터 셋을 통한 모델의 검증도 필수요소임

결론 

  • 학습(Learning) 이란, 현재까지 축적한 데이터(historical data)를 실행 가능한 태스크를 예측하고 도출하는 데 사용하는 것을 말함.

오늘도 머신러닝에서 학습에 대한 지식 한가지 획득완료! 감사합니다.

300x250