본문 바로가기

좋아하는 것_매직IT/2.hadoop

3.hadoop, 데이터(data)의 정의와 특성에 대해서 머리속에 일목요연하게 정리해 보자.

반응형

블로그 목적

  • 데이터에 대해서 머리속에 일목요연하게 정리하기 위해서 블로그를 작성한다.
  • IT업계에 종사하면서, 데이터에 대해서 많이 들어봤지만,
  • 누군가가 나에게 데이터가 무엇인가요? 라고 물어봤을때....
  • 어떻게 대답할것인가? 에 대한 고민을 가지고 블로그를 작성해본다.
  • 누가 물어봤을 경우, 아래의 내용을 일목요연하게 정리해서 대답한다면..
  • 질문했던 사람은 속으로 아래와 같이 판단하지 않을까?
    • "오호! 이사람은...데이터에 대해서 어느정도 개념이 잡혀있는데...놀라울정도로..^^;"

우선, 데이터에 대해서 정의해보자.

  • 옥스포드 대사전에서 말하는 데이터
    • "데이터는 추론과 추정의 근거를 이루는 사실" 이라고 정의하고 있음.
  • 1940년대 이후 컴퓨터시대가 시작되면서 자연과학뿐만 아니라, 경영학/통계학등등 다양한 사회과학이 진일보 하며, 데이터의 의미는 달라지고 있음.
    • 관념적/추상적인 개념 -> 기술적/사실적인 의미로....
    • 그리고, 데이터는 추론/예측/전망/추정을 위한 근거가 됨.
      • 데이터 -> 정보 -> 지식 -> 지혜로 발전됨으로써...
  • 그럼, 데이터를 정의 해본다면,
    • 데이터(data) 라는 용어의 첫등장은 ?
      • 1646년 영국문헌에서 처음 등장하였음.
      • 라틴어인 dare(주다)의 과거 분사형으로 "주어진 것"이라는 의미로 최초 사용되었다고 함.
    • 그리고, 데이터는 단순한 객체로서의 가치뿐만 아니라 다른 객체와의 상호관계 속에서 가치를 갖는 것으로 설명될 수 있음.

그럼, 데이터의 특성에 대해서 정리해보자.

  • 데이터의 특성은 크게 아래 2가지로 나눠진다.
    • 하나, 존재적 특성
      • 객관적 사실
        • fact 
        • raw material
    • 둘, 당위적 특성
      • 추론/예측/전망/추정을 위한 근거
        • basis

그럼, 데이터의 유형에 대해서 정리해 보자.

  • 데이터의 유형은 크게 아래 2가지로 나눠진다.
    • 하나, 정량적 데이터
      • 데이터의 양이 크게 증가하더라도 저장/검색/분석하여 활용하기 용이함.
      • 수치/도형/기호등등
        • ex) SK텔레콤 주가
    • 둘, 정성적 데이터
      • 형태와 형식이 정해져 있지 않아서 저장/검색/분석하는데 많은 비용과 기술적 투자가 수반됨.
      • 언어/문자 등등
        • ex) SNS에 올린글

그럼, 데이터와 정보의 관계에 대해서 정리해 보자

  • DIKW 피라미드
      • A. 지혜(Wisdom)
      • B. 지식(Knowledge)
      • C. 정보(Information)
      • D. 데이터(Data)
  • DIKW 정의
    • Data(데이터)
      • 개별 데이터 자체로는 의미가 중요하지 않은 객관적인 사실을 말함.
        • ex) A 문방구의 지우개가 1000원이고 B 문방구의 지우개가 2000원이다.
    • Information(정보)
      • 데이터의 가공/처리와 데이터간 연관관계속에서 의미가 도출된것을 말함.
        • ex) A 문방구의 지우개가 1000원 더 저렴하다.
    • Knowledge(지식)
      • 데이터를 통해 도출된 다양한 정보를 구조화하여 유의미한 정보를 분류하고 개인적인 경험을 결합시켜 고유의 지식으로 내재화 된것을 말함.
        • ex) A 문방구의 지우개가 더 저렴하므로, A 문방구에서 지우개를 구입해야겠다.
    • Wisdom(지혜)
      • 지식의 축적과 아이디어가 결합된 창의적인 산물을 말함.
        • ex) A 문방구의 다른 학용품들도, B 문방구의 학용품보다 저렴할것이라고 판단된다.

결론

  • 데이터란?
    • 옥스포트 대사전에서는 "데이터는 추론과 추정의 근거를 이루는 사실" 이라고 정의함.
  • 데이터(data) 라는 용어의 첫등장은, 1646년 영국문헌에서 처음 등장.
    • 라틴어인 dare(주다)의 과거 분사형으로 "주어진 것"이라는 의미로 최초 사용됨.
  • 그리고, 데이터는 단순한 객체로서의 가치뿐만 아니라 다른 객체와의 상호관계 속에서 가치를 갖는 것으로 설명될 수 있음.
  • 오늘도 데이터에 대한 지식한가지 정리및 획득완료! 감사합니다.

  • 오늘의 나눔 한마디
    • 오늘은, 강민구 지음, "인생의 밀도" 을 읽고 짧은 나눔을 하려고 합니다.
      • 인생의 밀도라는 책을 읽어보면, 감수성에 대한 정의가 나오는데요.
        • 간단하게 말해서 감수성이란, 외부의 결을 진지하게 관찰함으로써 이해하고 수용하고자 하는 태도라고 정의하고 있습니다.
        • 즉, 감수성은 우리의 삶과 업무에서 반드시 필요하고 갖춰야 하는 안목이기에, 감수성이 높으면, 공감능력과 소통능력이 높아진다라고 말할 수 있습니다.
      • 요즘들어 책을 읽으면서 생각하는 것이 있다면, 내가 알고있는 단어 또는 지식에 대해서 정말 잘 알고 있는지 다시 한번 고민하고 깨닫게 되는 한구절 이였습니다.
      • 오늘 정리한 데이터도 그렇고 감수성도 그렇고, 조금씩 내가 알고있다라는 것에 대해서 선입견을 버리고 더욱 적극적이고 능동적으로 배움의 호기심을 가지고 지식을 넓혀나아가야 겠다고 다짐해봄니다.
    • 암튼 제가 제글을 읽으시는 구독자 여러분께 말씀드리고 나누고자하는 결론은,
      • 내가 알고 있는 지식이라도 다시한번 정확하게 알고있는것인지에 대해서 분별할 줄 아는 제가 되길 바라며, 오늘도 즐겁고 행복한 저와 구독자여러분들 되시길 기원합니다.
      • 오늘도 제 글이 유익한 글이라고 생각하시면, 팔로우와 좋아요 그리고 북마크 부탁드려요^^
      • 그리고, 더욱 발전하는 컨텐츠를 만들 수 있도록 노력하겠습니다. 감사합니다.

나의 목표 및 다짐을 항상 내곁에 두기.

  • 목표
    • 나의 강점을 바탕으로 나의 일을 잘해냄으로써 타인과 사회를 아릅답게 만든다.
      • 현재 내가 가진 능력으로 누군가에 도움이 될 수 있을까? 에 대해서 항상 생각하기
  • 목표를 이루기 위한 실천방안
    • 꾸준한 블로깅/기록법/독서법으로 넘버원이 아닌 온리원이 되보자.
    • 천사불여일행(千思不如一行)을 항상생각하며 체화 및 각인시키자.
      • "천번 생각하는것보다 한번 행동하는 것이 더 중요하다."
    • 기기일약 불능십보(騏驥一躍 不能十步) / 노마십가 공재불사(駑馬十駕 功在不舍)
      • 천리마도 한번에 열걸음을 뛸 수 없고, 느리고 둔한말이라도 열흘이면 하룻길을 간다.
    • 모든 실수에는 마술이 숨어 있다. 따라서 나는 실수하면 실수할수록, 그런 실수에서 더 많이 배울수록 삶에서 더 많은 마술을 갖는다.
728x90
300x250