반응형
빅데이터의 개념을 한번 알아보자.
-
위키페이지에서는 아래와 같이 빅데이터를 정의하고 있음.
-
참고페이지
- 한개의 뉴스를 예를 들어 설명하면, 아래 뉴스에는 빅데이터가 존재했음.
- AI 알파고가 이세돌 9단과의 바둑 대국에서 이김.
- 이면에는, 알파고가 이세돌9단과의 경기를 위해서 4주동안 딥러닝으로 400만번의 경기를 반복했다고 함. -_-;
- AI 알파고가 이세돌 9단과의 바둑 대국에서 이김.
- 그리고, 요즘 빅데이터는 사회적 현상을 이야기할때 빠지지 않고 등장하는 이야기임.
- 스마트폰과 같은 스마트 기기, facebook 과 같은 SNS, 그리고, SKT과 같은 통신사를 통한 사물인터넷의 확산이 직간접적으로 큰 영향을 주고 있음.
- 그래서, 이미 빅데이터의 시대는 도래했다고 보면 됨.
- 2010년, 인터넷/모바일 시대를 기점으로 데이터의 양이 폭발적으로 증가함.
- 2016년, 사람/사물/정보가 하나로 연결되는 초연결의 시대, 즉 4차산업혁명이 시작됨.
- 인공지능, 사물인터넷, 무인자동차, 로봇산업등등 메인스트림으로 만들어짐.
- 즉, 이때 필요한 핵심 기반의 기술은 빅데이터.
- 1차~4차 산업혁명
- 최근2년동안 발생한 데이터가 전 세계 데이터의 80%를 차지한다고 함.
빅데이터 시대의 정보의 의미는 ?
- 데이터를 단순 정보로만 보지 않음.
- 과거로부터 현재까지 쌓인 데이터를 분석해 현재를 이해하고 이 정보에서 만들어지는 다양한 패턴들을 해석하며 미래를 예측하기 시작한 것.
- 요즘 빅데이터는, 단순히 대규모의 데이터 집합이 아니라, 기술/분석/통찰까지 총칭하는 용어로 사용되고 있음.
그럼, 빅데이터에 대한 여러가지 정의에 대해서 알아볼까요?
- 맥킨지
- "일반적인 데이터베이스 소프트웨어로 저장/관리/분석할 수 있는 범위를 초과하는 규모의 데이터"
- 국가정보화전략위원회
- "대용량 데이터를 활용/분석해서 가치 있는 정보르를 추출하고, 생성된 지식을 바탕으로 능동적으로 대응하거나 변화를 예측하기 위한 정보화 기술"
- ITWorld
- "단순한 데이터의 크기가 아니라 데이터의 형식과 처리속드등을 함께 어우리는 개념으로, 기존 방법으로는 데이터의 수집, 저장, 검색, 분석등이 어려운 데이터를 총칭해서 일컫는 용어"
3V,4V,5V,6V,7V,8V..(앞으로계속 진행형^^;) 으로 보는 빅데이터의 정의..
-
- 1V~3V
- 2011년 메타그룹(현 가트너)의 애널리스트인 더그 레이니(Doug Laney)는 다소 혼란스러운 빅데이터의 정의를 3V라는 표현으로 매우 명확하게 정리함.
- Volume
- 데이터의 크기
- 방대한 양의 데이터(테라, 페타바이트 이상의 크기)
- 데이터의 크기
- Velocity
- 데이터 입출력 속도
- 실시간으로 생성, 빠른 속도로 데이터를 처리및 분석
- 데이터 입출력 속도
- Variety
- 데이터 종류의 다양성
- 정형(DBMS,전문등등) + 비정형(SNS, 동영상, 사진, 음성등등)
- 데이터 종류의 다양성
- Volume
- 2011년 메타그룹(현 가트너)의 애널리스트인 더그 레이니(Doug Laney)는 다소 혼란스러운 빅데이터의 정의를 3V라는 표현으로 매우 명확하게 정리함.
- 4V
- IBM 에서 아래 요소를 추가함.
- Veracity
- 진실성
- 주요 의사결정을 위해 데이터의 품질과 신뢰성 확보
- 진실성
- Veracity
- IBM 에서 아래 요소를 추가함.
- 5V~8V
- 그 이후, 아래 요소까지 추가되므으로써 8V까지 확장됨.
- Variability
- 가변성
- 동일한 데이터가 서로 다른 컨텍스트에서 다른 의미를 가질 수 있음.
- 가변성
- Visualization
- 시각화
- 복잡한 대규모 데이터를 시각적으로 표현
- 시각화
- Volatility
- 휘발성
- 현재 생성되는 모든 데이터를 저장하기 위한 비용이 매우 크기 때문에 대부분의 데이터는 버려짐.
- 휘발성
- Value
- 가치
- 비즈니스 효익을 실현하기 위해 궁극적인 가치를 창출.
- 가치
- Variability
- 그 이후, 아래 요소까지 추가되므으로써 8V까지 확장됨.
- 1V~3V
결론
- 빅데이터란, 위에서 알아본 8V을 아우르는, 기존 데이터베이스 관리도구의 능력을 넘어서는 대량(수십 테라바이트)의 정형 또는 심지어 데이터베이스 형태가 아닌 비정형의 데이터 집합조차 포함한 데이터로부터 가치를 추출하고 결과를 분석하는 기술이라고 정의하면 될것 같음.
- 빅데이터의 정의는 보는 사람의 시각에 따라 매년 달라지고 추가되고 있음.
- 오늘도 빅데이터관련 정의에 대한 마술(?) 한가지 획득 완료. 감사합니다. ^^
300x250