본문 바로가기

반응형

머신러닝

DVC - 머신러닝 프로젝트를 위한 오픈소스 버전 관리 시스템을 소개합니다. (dvc.org) DVC - 머신러닝 프로젝트를 위한 오픈소스 버전 관리 시스템을 소개합니다. 홈페이지에서는 아래와 같이 설명하고 있고요.. DVC tracks ML models and data sets DVC is built to make ML models shareable and reproducible. It is designed to handle large files, data sets, machine learning models, and metrics as well as code. 한마디로, DVC는 머신러닝 프로젝트를 위한 오픈소스 버전 관리 시스템이라고 머릿속에 넣어두시면 될것 같네요.. 그리고 주요내용을 정리하면 아래와 같고요.. "Data Version Control" : Git for Data & Mode.. 더보기
언어별로 구현해본 알고리듬 모음 (the-algorithms.com) 언어별로 구현해본 알고리듬 모음을 소개합니다. 해당 페이지에서는 아래와 같이 설명하고 있군요.. Welcome to GitHub's largest open-source algorithm library 한마디로, 해당 웹페이지는 언어별로 구현해본 알고리듬 모음을 볼 수 있는 사이트로 머릿속에 넣어두시면 될것 같네요.. 참고로, 알고리즘에 대한 설명도 아래와 같이 하고 있었습니다. What is an Algorithm? An algorithm is a set of rules that takes in one or more inputs, then performs inner calculations and data manipulations and returns an output or a set of outputs... 더보기
9.tensorflow, 텐서플로우(TensorFlow) 환경을 구축해보자. 블로그 목적 텐서플로우관련 환경을 어떻게 구축하는지에 대해서 알아본다. 본격적으로, 텐서플로우를 설치 해보자. 설치 환경 텐서플로우는 PC 환경에 따라 아래와 같이 설치 가능함. CPU(Central Processing Unit) 버전 복잡한 계산을 빠르게 처리 할 수 있으나, 직렬처리 방법임. GPU(Graphics Processing Unit) 버전 간단한 계산을 빠르게 처리 할 수 있고, 병렬처리 방법을 사용하여 동시에 여러 계산이 가능함. 단, NVIDIA 사의 그래픽 드라이버만을 지원한다고 함. 참고) CPU 와 GPU 에 대해서 좀 더 알아보자. CPU 우선, CPU는 컴퓨터의 두뇌를 담당함. 즉, 다양한 환경에서의 작업을 빠르게 수행하기 위해 ALU의 구조가 복잡하고 명령어 하나로 처리할 수.. 더보기
8.tensorflow, 텐서플로우(TensorFlow) 란 무엇인가? 블로그 목적 TensorFlow 가 무엇인지에 대해서 알아본다. TensorFlow에서 알아야할 기본지식을 간단하게 머리에 쏙! 정리해본다. 텐서플로우(TensorFlow) 란 무엇일까? 한마디로, 구글(Google)에서 만든 딥러닝을 쉽게 구동할 수 있게 하는 라이브러리라고 알고있으면 됨. 그리고, TensorFlow는 머신러닝을 위한 엔드 투 엔드 오픈소스 플랫폼 기본적으로 C++ 로 구현 되어 있고, Python / Java / Go 등등의 다양한 언어를 지원함. 하지만, Python 을 최우선으로 지원하고 있고, 대부분의 편의 기능이 Python 라이브러리로 구성됨. 텐서 플로우 참고페이지 https://www.tensorflow.org/ 그럼, 딥러닝(Deep Learning) 프레임워크는 무엇.. 더보기
7.tensorflow, 머신러닝관련 알고리즘을 정리해보자. 블로깅 목적 머신러닝관련 알고리즘에 대해서 정리해본다. 우선, 머신러닝 알고리즘을 분류해보자. 기준 학습모델 우선, 의사결정 트리 기반 알고리즘에 대해서 알아보자 의사결정 트리 기반 알고리즘(decision tree based algorithms)이란? 제공된 데이터를 이용해 반복적 or 재귀적인 방법을 통해 모델을 정의하는 것. 목표 주어진 입력변수에 대한 데이터를 기반으로 타켓 변수를 예측하는 것. 트리 기반의 기법을 사용해 분류(classification) / 회귀(regression) 문제를 해결함. 주요 알고리즘 랜덤 포레스트(Random Forest) CART(Classification And Regression Tree) C4.5 및 C5.0 카이제곱(Chi-square) GBM(Gradie.. 더보기
6.tensorflow, 머신러닝의 주요 분야에 대해서 알아보고 정리해보자. 블로그 목적 머신러닝과 밀접하게 관련된 분야에 대해서 알아본다. 머신러닝과 밀접하게 관련된 분야는 무엇이있을까? 하나, 데이터마이닝(Data Mining) 둘, 통계학(Statistical Learning) 셋, 데이터과학(Data Science) 넷, 인공지능(Artificial Intelligence, AI) 그럼, 데이터 마이닝과 비교해보자. 데이터 마이닝이란? 데이터를 분석하고 대규모 데이터에 비즈니스 규칙을 적용해 가치 있는 정보를 얻는 과정 머신러닝과 데이터 마이닝 비교 유사한점 데이터에서 의미있는 정보를 찾는 것이 목적. 차이점 머신러닝 이미 알고 있는 지식/경험을 이용하는 것에 초점 분석을 통해 얻은 지능 정보를 컴퓨터 머신에서 사용. 데이터마이닝 이제까지 알지 못한 지식을 찾아내는 것에 .. 더보기
5.tensorflow, 머신러닝에서 학습관련 세부 분야에 대해서 알아보자. 블로그 목적 머신러닝에서 학습관련 세부 분야가 무엇이 있는지 알아보자. 머신러닝에서 학습과정 분류 학습과정은 아래와 같이 크게 5가지로 나눌 수 있음. 지도학습(supervised learning) 비지도 학습(unsupervised learning) 준지도 학습(semi-supervised learning) 강화 학습(reinforcement learning) 딥러닝(deep learning) 그럼, 지도 학습에 대해서 알아보자 지도학습이란? 이미 알고 있는 예상 결과를 다루는 것을 말함. 즉, 이미 정의되어 있는 데이터에서 무엇을 분석해야 하는지에 중점을 둠. 지도학습 알고리즘의 핵심 입력데이터 / 결과 데이터를 모두 알고 있을 경우, 이를 서로 매핑시키는 것. 다시말해서, 주어진 데이터에 대해서 연.. 더보기
4.tensorflow, 머신러닝에서 데이터관련 비일관성문제에 대해서 알아보자. 블로그의 목적 머신러닝에서 데이터 관련 비일관성 문제에 대해서 정리해본다. 데이터 관련 비일관성 문제 언더피팅(under-fitting) 오버피팅(over-fitting) 데이터 불안정성(data instability) 예측 불가한 미래(unpredictable future) 그럼, 언더피팅에 대해서 알아보자. 언더피팅이란? 실제 데이터를 정확하게 모델링하기 위해 충분한 정보를 고려하지 못한 경우을 말함. 즉, 오차가 늘고, 모델의 정확도도 저하됨. 주로, 언더피팅은 아래의 경우에 잘 발생함. 분류기(classifier)가 특정 데이터에만 적용 가능한 상태이거나 수준 미달일 정도로 단순한 경우 즉,데이터가 충분하지 않고, 모델링이 제대로 이뤄지지 않아서... 다시말해서, 데이터셋 크기가 너무 작으면 최적.. 더보기

반응형