반응형
블로그 목적
- 데이터에 대해서 머리속에 일목요연하게 정리하기 위해서 블로그를 작성한다.
- IT업계에 종사하면서, 데이터에 대해서 많이 들어봤지만,
- 누군가가 나에게 데이터가 무엇인가요? 라고 물어봤을때....
- 어떻게 대답할것인가? 에 대한 고민을 가지고 블로그를 작성해본다.
- 누가 물어봤을 경우, 아래의 내용을 일목요연하게 정리해서 대답한다면..
- 질문했던 사람은 속으로 아래와 같이 판단하지 않을까?
- "오호! 이사람은...데이터에 대해서 어느정도 개념이 잡혀있는데...놀라울정도로..^^;"
우선, 데이터에 대해서 정의해보자.
- 옥스포드 대사전에서 말하는 데이터
- "데이터는 추론과 추정의 근거를 이루는 사실" 이라고 정의하고 있음.
- 1940년대 이후 컴퓨터시대가 시작되면서 자연과학뿐만 아니라, 경영학/통계학등등 다양한 사회과학이 진일보 하며, 데이터의 의미는 달라지고 있음.
- 관념적/추상적인 개념 -> 기술적/사실적인 의미로....
- 그리고, 데이터는 추론/예측/전망/추정을 위한 근거가 됨.
- 데이터 -> 정보 -> 지식 -> 지혜로 발전됨으로써...
- 그럼, 데이터를 정의 해본다면,
- 데이터(data) 라는 용어의 첫등장은 ?
- 1646년 영국문헌에서 처음 등장하였음.
- 라틴어인 dare(주다)의 과거 분사형으로 "주어진 것"이라는 의미로 최초 사용되었다고 함.
- 그리고, 데이터는 단순한 객체로서의 가치뿐만 아니라 다른 객체와의 상호관계 속에서 가치를 갖는 것으로 설명될 수 있음.
- 데이터(data) 라는 용어의 첫등장은 ?
그럼, 데이터의 특성에 대해서 정리해보자.
- 데이터의 특성은 크게 아래 2가지로 나눠진다.
- 하나, 존재적 특성
- 객관적 사실
- fact
- raw material
- 객관적 사실
- 둘, 당위적 특성
- 추론/예측/전망/추정을 위한 근거
- basis
- 추론/예측/전망/추정을 위한 근거
- 하나, 존재적 특성
그럼, 데이터의 유형에 대해서 정리해 보자.
- 데이터의 유형은 크게 아래 2가지로 나눠진다.
- 하나, 정량적 데이터
- 데이터의 양이 크게 증가하더라도 저장/검색/분석하여 활용하기 용이함.
- 수치/도형/기호등등
- ex) SK텔레콤 주가
- 둘, 정성적 데이터
- 형태와 형식이 정해져 있지 않아서 저장/검색/분석하는데 많은 비용과 기술적 투자가 수반됨.
- 언어/문자 등등
- ex) SNS에 올린글
- 하나, 정량적 데이터
그럼, 데이터와 정보의 관계에 대해서 정리해 보자
- DIKW 피라미드
-
- A. 지혜(Wisdom)
- B. 지식(Knowledge)
- C. 정보(Information)
- D. 데이터(Data)
-
- DIKW 정의
- Data(데이터)
- 개별 데이터 자체로는 의미가 중요하지 않은 객관적인 사실을 말함.
- ex) A 문방구의 지우개가 1000원이고 B 문방구의 지우개가 2000원이다.
- 개별 데이터 자체로는 의미가 중요하지 않은 객관적인 사실을 말함.
- Information(정보)
- 데이터의 가공/처리와 데이터간 연관관계속에서 의미가 도출된것을 말함.
- ex) A 문방구의 지우개가 1000원 더 저렴하다.
- 데이터의 가공/처리와 데이터간 연관관계속에서 의미가 도출된것을 말함.
- Knowledge(지식)
- 데이터를 통해 도출된 다양한 정보를 구조화하여 유의미한 정보를 분류하고 개인적인 경험을 결합시켜 고유의 지식으로 내재화 된것을 말함.
- ex) A 문방구의 지우개가 더 저렴하므로, A 문방구에서 지우개를 구입해야겠다.
- 데이터를 통해 도출된 다양한 정보를 구조화하여 유의미한 정보를 분류하고 개인적인 경험을 결합시켜 고유의 지식으로 내재화 된것을 말함.
- Wisdom(지혜)
- 지식의 축적과 아이디어가 결합된 창의적인 산물을 말함.
- ex) A 문방구의 다른 학용품들도, B 문방구의 학용품보다 저렴할것이라고 판단된다.
- 지식의 축적과 아이디어가 결합된 창의적인 산물을 말함.
- Data(데이터)
결론
- 데이터란?
- 옥스포트 대사전에서는 "데이터는 추론과 추정의 근거를 이루는 사실" 이라고 정의함.
- 데이터(data) 라는 용어의 첫등장은, 1646년 영국문헌에서 처음 등장.
- 라틴어인 dare(주다)의 과거 분사형으로 "주어진 것"이라는 의미로 최초 사용됨.
- 그리고, 데이터는 단순한 객체로서의 가치뿐만 아니라 다른 객체와의 상호관계 속에서 가치를 갖는 것으로 설명될 수 있음.
- 오늘도 데이터에 대한 지식한가지 정리및 획득완료! 감사합니다.
- 오늘의 나눔 한마디
- 오늘은, 강민구 지음, "인생의 밀도" 을 읽고 짧은 나눔을 하려고 합니다.
- 인생의 밀도라는 책을 읽어보면, 감수성에 대한 정의가 나오는데요.
- 간단하게 말해서 감수성이란, 외부의 결을 진지하게 관찰함으로써 이해하고 수용하고자 하는 태도라고 정의하고 있습니다.
- 즉, 감수성은 우리의 삶과 업무에서 반드시 필요하고 갖춰야 하는 안목이기에, 감수성이 높으면, 공감능력과 소통능력이 높아진다라고 말할 수 있습니다.
- 요즘들어 책을 읽으면서 생각하는 것이 있다면, 내가 알고있는 단어 또는 지식에 대해서 정말 잘 알고 있는지 다시 한번 고민하고 깨닫게 되는 한구절 이였습니다.
- 오늘 정리한 데이터도 그렇고 감수성도 그렇고, 조금씩 내가 알고있다라는 것에 대해서 선입견을 버리고 더욱 적극적이고 능동적으로 배움의 호기심을 가지고 지식을 넓혀나아가야 겠다고 다짐해봄니다.
- 인생의 밀도라는 책을 읽어보면, 감수성에 대한 정의가 나오는데요.
- 암튼 제가 제글을 읽으시는 구독자 여러분께 말씀드리고 나누고자하는 결론은,
- 내가 알고 있는 지식이라도 다시한번 정확하게 알고있는것인지에 대해서 분별할 줄 아는 제가 되길 바라며, 오늘도 즐겁고 행복한 저와 구독자여러분들 되시길 기원합니다.
- 오늘도 제 글이 유익한 글이라고 생각하시면, 팔로우와 좋아요 그리고 북마크 부탁드려요^^
- 그리고, 더욱 발전하는 컨텐츠를 만들 수 있도록 노력하겠습니다. 감사합니다.
- 오늘은, 강민구 지음, "인생의 밀도" 을 읽고 짧은 나눔을 하려고 합니다.
나의 목표 및 다짐을 항상 내곁에 두기.
- 목표
- 나의 강점을 바탕으로 나의 일을 잘해냄으로써 타인과 사회를 아릅답게 만든다.
- 현재 내가 가진 능력으로 누군가에 도움이 될 수 있을까? 에 대해서 항상 생각하기
- 나의 강점을 바탕으로 나의 일을 잘해냄으로써 타인과 사회를 아릅답게 만든다.
- 목표를 이루기 위한 실천방안
- 꾸준한 블로깅/기록법/독서법으로 넘버원이 아닌 온리원이 되보자.
- 천사불여일행(千思不如一行)을 항상생각하며 체화 및 각인시키자.
- "천번 생각하는것보다 한번 행동하는 것이 더 중요하다."
- 기기일약 불능십보(騏驥一躍 不能十步) / 노마십가 공재불사(駑馬十駕 功在不舍)
- 천리마도 한번에 열걸음을 뛸 수 없고, 느리고 둔한말이라도 열흘이면 하룻길을 간다.
- 모든 실수에는 마술이 숨어 있다. 따라서 나는 실수하면 실수할수록, 그런 실수에서 더 많이 배울수록 삶에서 더 많은 마술을 갖는다.
300x250
'좋아하는 것_매직IT > 2.hadoop' 카테고리의 다른 글
5.hadoop, 하둡의 핵심 기술관련 리소스관리자 및 스케줄러 에 대해서 정리해보자. (0) | 2021.01.27 |
---|---|
4.hadoop, 하둡의 핵심 기술관련 분산파일 시스템에 대해서 정리해보자. (0) | 2021.01.27 |
2.hadoop, 데이터 과학(data science)에 대해서 알아보자. (0) | 2021.01.05 |
1.hadoop, 하둡을 손쉽게 시작할 수 있는 호튼웍스 샌드박스를 소개합니다. (0) | 2021.01.04 |
0.hadoop, 아파치 하둡(Apache Hadoop) 이란 무엇인가? (0) | 2020.10.05 |