빅데이터
빅데이터
  • 황인술
  • 승인 2013.12.05 09:52
  • 댓글 0
이 기사를 공유합니다

황선생 와이드 철학논술
▲ 황인술 논설위원     © 독서신문
[독서신문] Ⅰ. 생각해보기 

- 데이터는 정보를 얻기 위한 기본 자료이며 모아진 유용한 정보들은 지식이 된다.
 
정보의 상대적 가치
 
  사회가 복잡해지고 다양해질수록 정보의 가치는 달라진다. 농업사회에서는 땅과 노동력이 최고의 가치였다면 산업사회에서는 에너지에 대한 가치가 중심이었다. 디지털 시대인 현대사회는 정보의 가치가 제일 중요하다. 때문에 정보를 상품화하여 거래하고 있다.
  정보기술(IT: Information Technology)은 1970년대 초 컴퓨터와 정보통신 기술이 대중화되면서 시작된다. IT는 정보수집, 축적, 처리, 검색, 전송 등 정보유통의 모든 과정에서 사용되는 기술을 말한다. IT는 ‘인간두뇌’를 확장시켰으며, 이에 의한 지식과 정보는 인류에게 커다란 영향력을 행사하며 중요한 위치를 차지하고 있다.
  또한 정보양이 많은 국가일수록 국가 경쟁력도 높아지고 있다. 정보의 바다인 인터넷을 이용하면 다양한 정보에 쉽게 접근할 수 있으며, 정보를 다른 사용자에게 전송(제공)을 할 수 있다. 이와 같은 이유로 인터넷(Internet)은 정보통신기술에 있어 절대적인 우치를 차지하고 있다.
  정보기술 발달과 정보량이 폭발적으로 증가하면서 빅데이터(Big data) 중요성 또한 커지고 있다. 빅데이터란 디지털 환경에서 만들어지는 방대한 규모의 데이터를 말한다. 만들어지는 기간은 아주 짧으며 계산하여 얻은 데이터뿐만 아니라 문자와 영상 데이터 등 모든 데이터를 포함하는 데이터이다. 빅데이너를 양(Volume), 다양한 형태(variety), 빠른 생성 속도(velocity), 가치(value)의 첫 글자를 따서 4V라고도 한다. 
  빅데이터(Big data)는 PC, 인터넷(블로그), 스마트폰(SNS), CCTV 발전과 증가에 따라 사람들의 일상생활 하나하나가 쉽게 노출되고 노출된 데이터를 축적하여 만들어진다. 공공기관 등에서는 대상이 되는 통계 집단의 단위를 하나하나 전부 조사하고 관찰(다양한 사회조사, 국세, 의료보험, 연금)하기 위해 데이터를 생산하고 분석에 활용하고 있다.
  빅데이터가 많아지고 활용도가 높아질수록 유비쿼터스 시대는 다양하게 열릴 것이다. 또한 빅데이터와 데이터마이닝(data minig)을 활용하여 고객관계관리( CRM /Customer Relationship Management)를 강화할 수 있다. CRM 시스템은 기업이 보유하고 있는 고객 데이터를 활용해 마케팅 활동을 활성화하는데 큰 역할을 한다.
  또한 CRM은 기업이 확보하고 있는 데이터를 통합하는 데이터웨어하우스(Data warehouse), 고객 데이터 분석(data mining)을 통한 마케팅(고객유지 등)에 적극적으로 활용할 가능성이 매우 크다고 볼 수 있다.
  즉 구매 이력 정보, 웹로그, 위치기반 서비스(GPS) 등을 결합하여 소비자가 원하는 서비스를 시간과 공간 제약 없이 적절한 시기에 맞춤형 상품을 제안할 수 있는 장점이 있다.
 

Ⅱ. 생각확대하기
 
1. 데이터(data)
  데이터는 ‘주다’의 라틴어 do, dare에서 유래했다. 데이터란 현실 세계의 사물이나 사건(사실, 이미지, 동영상, 소리, 음성인식, 얼굴인식)을 관찰, 측정에 의해 수집된 사실로 주로 숫자와 문자로 컴퓨터에 저장하여 어떤 일에 유용하게 사용될지 모르는 ㄱ공되지 않은 것을 말한다. 데이터는 보통 프로그램으로 처리하기 위해서 일정한 형식(format)으로 정리하여 모아 놓는다. 컴퓨터 용어로 파일(file) 이라고 라며, 파일은 데이터들의 집합이다.
  네트워크 발달로 저장되는 정보량이 급속도로 증가(data mining)하고 있으며, 데이터 분석은 일반적인 데이터는 숫자나 문자로 이루어진 복잡한 구조를 다룬다. 데이터를 분석하는 전문지식 없이는 유용한 정보를 얻는데 어려움이 있다. 전문분야로 통계학, 컴퓨터공학, 산업공학, 경영학, 심리학 등이 있다. 즉 데이터가 정보가 되는 과정은 먼저 분석과 처리과정을 거치게 된다. 이 과정을 거치면 정보가 된다.

2. 정보(information)
  정보는 ‘형식을 주다(give form to)’의 라틴어 informo, informare에서 유래했다. 형식이나 내용이 특정한 목적이나 용도에 맞도록 처리하고 가공하여 얻어진 결과로 사용자에게 의사결정을 하는데 도움을 줄 수 있는 결과물을 말한다.
  데이터를 가공 또는 처리하여 정보를 제공하는 시스템을 정보처리시스템(information processing system)이라 한다. 정보처리시스템은 데이터를 외부로부터 입력받아 형식에 맞추어 파일로 저장하고, 데이터로부터 정보를 만들어내기 위해 프로그램이 운영된다. 정보처리시스템은 데이터를 가공 또는 처리하는 소프트웨어뿐만 아니라 하드웨어까지를 모두 포함한다.
  쓸모 있는 정보는 이미 알고 있는 사실이 아니고 새로운 것 또는 확신(재확인)시켜주는 것이다. 하지만 어떤 개인이 새로운 사실을 알았다하더라도 그 정보를 알고 있는 다른 개인에게는 쓸모없는 정보이다. 예를 들면 기상정보, 구인/구직 정보, 부동산 정보 등은 단순한 정보이지만 정보는 단순히 어떤 사실을 깨닫게 하고 이해하고 확신을 주는 데 도움을 주는 것을 말한다. 이때 지식은 연관된 정보들이 인간의 사고 과정을 거친 후에 만들어진다.

3. 암묵지(暗默知, Tacit Knowledge)
  문자나 음성 등과 같은 방식을 통하여 형식화하기 힘든 지식으로 겉으로 표현하거나 명문화하기 어려운 지식을 말한다. ‘암묵’이란 눈에 보이지 않고 귀에 들리지 않는다는 뜻이다. 예를 들면 숙련된 근로자들이 익힌 비법은 기업경쟁의 중요한 자산이 되기도 한다. 예를 들면 “우리 엄마는 된장찌개 조리법을 모르지만 된장찌개를 맛있게 잘하신다.”에서와 같이 ‘손맛’이나 ‘솜씨’ ‘비법’을 구체적으로 나타내기란 매우 어렵다. 이러한 암묵지는 수없이 많이 있다. 우리는 암묵지 속에서 살아가고 있다 해도 과언이 아니다.
  마이클 폴라니는 지식을 겉으로 분명하게 표현된 걸 이해할 수 있는 ‘표출적 지식(explicit knowledge)’과 표현하기가 매우 어려운 ‘암묵적 지식(tacit knowledge)’으로 나누었다. 표출적 지식은 명제적 지식(propositional knowledge)·형식지·명시지·공식지라고 부르기도 하며, 암묵적 지식은 줄여서 ‘암묵지’라고 부른다. 암묵지를 신체지 또는 경험지(experiential knowledge)라고도 한다.
  공병호는 지식을 ‘지식인의 지식’과 ‘상인의 지식’으로 나누면서 상인의 지식을 암묵지·실제적 지식·현장 지식으로 보았다. 폴라니는 “우리는 우리가 말할 수 있는 것 이상으로 알고 있다”며 기존의 철학적 인식론이 형식지만을 특권화하고 있음을 비판했다. 그는 암묵지에 무게를 두면서 일본 기업이 성공할 수 있었던 것은 암묵지에 기반한 지식화에 성공했기 때문이라고 주장했다.
  암묵지의 반대인 명시지·형식지·공식지는 우리가 일반적으로 말하는 지식이다. 학교나 책에서 배울 수 있는 지식의 전형이다. 이런 명시지에 관한 한 한국은 세계적인 지식 강국이지만, 암묵지는 취약하다. 박기찬·이윤철·이동현은 “한국의 기업 구성원들은 자신이 알고 있는 지식과 경험을 체계화하는 것을 꺼려한다. 그래서 정말 핵심적인 지식은 대부분 개인들이 소유하고 있고, 그런 이유로 생산성이 하락한 것이다”라고 진단했다.
-출처 : 네이버 지식백과

4. 유비쿼터스(ubiquitous)
  사용자(user)가 네트워크나 컴퓨터를 의식하지 않고 장소에 상관없이 네트워크에 접속할 수 있는 정보통신 환경을 말한다. 인간의 모든 활동들이 네트워크를 통하여 컴퓨터에 저장되어 가는 세상에 우리는 살고 있다. 따라서 정보기술의 활용은 특정 학문의 전문 분야가 아니고 보편적으로 현대 사회인이 지녀야 할 능력이다. 현재는 완벽한 유비쿼터스는 아니지만 점점 그런 환경이 만들어 지고 있다. 

 



Ⅲ. 생각정리하기
 
1. 빅데이터(big data)
  데이터의 생성·양·주기·형식 등이 기존 데이터에 비해 너무 크기 때문에, 종래 방법으로는 수집·저장·검색·분석이 어려운 방대한 데이터를 말한다. 빅데이터는 각종 센서와 인터넷 발달로 데이터가 늘어나면서 나타났다. 컴퓨터 및 처리기술이 발달함에 따라 디지털 환경에서 생성되는 빅데이터와 이 데이터를 기반으로 분석할 경우 질병이나 사회현상의 변화에 관한 새로운 시각이나 법칙을 발견할 가능성이 커졌다.
  일부 학자들은 빅데이터를 통해 인류가 유사 이래 처음으로 인간 행동을 미리 예측할 수 있는 세상이 열리고 있다고 주장하기도 하며, 이를 주장하는 대표적인 학자로는 토머스 멀론(Thomas Malone) 미국 매사추세츠공과대학 집합지능연구소장이 있다.
  빅데이터는 4V라고 정의하기도 한다. 이 중 가치(value)가 중요 특징으로 등장한 것은 엄청난 규모뿐만 아니라 빅데이터의 대부분은 비정형적인 텍스트와 이미지 등으로 이루어져 있고, 이러한 데이터들은 시간이 지나면서 매우 빠르게 전파하며 변함에 따라 그 전체를 파악하고 일정한 패턴을 발견하기가 어렵게 되면서 가치(value) 창출의 중요성이 강조되었기 때문이다.
  디지털 경제 확산으로 규모를 가늠할 수 없을 정도로 많은 정보가 생산되는 ‘빅데이터(Big Data)’ 환경이 도래했다. 빅데이터는 미래 경쟁력을 좌우하는 핵심 ‘자원’이므로 기업뿐 아니라 공공 부문도 정확한 이해와 효과적으로 활용하기 위한 전략의 수립이 시급하다.
-출처 : 네이버 지식백과

2. 빅데이터의 특징과 의미
  빅데이터 환경은 과거에 비해 데이터의 양이 폭증했다는 점과 함께 데이터의 종류도 다양해져 사람들의 행동은 물론 위치정보와 SNS를 통해 생각과 의견까지 분석하고 예측할 수 있다. PC와 인터넷, 모바일 기기 이용이 생활화되면서 사람들이 도처에 남긴 발자국(데이터)은 기하급수적으로 증가하고 있다(정용찬, 2012).
 
쇼핑의 예
  데이터의 관점에서 보면 과거에는 상점에서 물건을 살 때만 데이터가 기록되었다. 반면 인터넷쇼핑몰의 경우에는 구매를 하지 않더라도 방문자가 돌아다닌 기록이 자동적으로 데이터로 저장된다. 어떤 상품에 관심이 있는지, 얼마 동안 쇼핑몰에 머물렀는지를 알 수 있다. 쇼핑뿐 아니라 은행, 증권과 같은 금융거래, 교육과 학습, 여가활동, 자료검색과 이메일 등 하루 대부분의 시간을 PC와 인터넷에 할애한다. 사람과 기계, 기계와 기계가 서로 정보를 주고받는 사물지능통신(M2M, Machine to Machine)의 확산도 디지털 정보가 폭발적으로 증가하게 되는 이유다.
  다양하고 방대한 규모의 데이터는 미래 경쟁력의 우위를 좌우하는 중요한 자원으로 활용될 수 있다는 점에서 주목받고 있다. 대규모 데이터를 분석해서 의미있는 정보를 찾아내는 시도는 예전에도 존재했다. 그러나 현재의 빅데이터 환경은 과거와 비교해 데이터의 양은 물론 질과 다양성 측면에서 패러다임의 전환을 의미한다. 이런 관점에서 빅데이터는 산업혁명 시기의 석탄처럼 IT와 스마트혁명 시기에 혁신과 경쟁력 강화, 생산성 향상을 위한 중요한 원천으로 간주되고 있다(McKinsey, 2011).
-출처 : 네이버 지식백과

3. 스마트TV ‘빅 브러더’ 논란  
  빅데이터 시대가 열리자 정부정책이 소설 『1984』의 빅브라더로 오인받기 쉬운 시대가 되었다. 범죄와 테러를 막기 위해 여러 나라에서 디지털 발자국(digital footprint)을 수집하고 분석하는 분야에 투자를 아끼지 않고 있다. 세계에서 제일 많은 영국의 폐쇄회로 텔레비전(CCTV)의 수는 180만대이다. 영국 정부는 범죄를 사전에 예방하고 감시를 쉽게 하기 위해서라는 이유로 모자가 달린 운동복을 입지 못하게 하는 것을 고려할 정도다.
  또한 삼성전자가 내놓은 스마트TV 신제품이 사생활을 감시할 수 있다는 분석이 해외에서 제기되고 있다. 영국의 ‘메일 온라인’은 ‘TV가 당신을 감시한다?’란 제목의 기사에서 “삼성의 신제품 스마트TV를 통해 해커 또는 삼성전자가 당신을 보고 듣는 한편 개인정보까지 수집할 수 있다”고 보도하여 ‘빅브러더 논란’을 불러 일으켰다.
  이 신제품 스마트TV는 동작과 음성을 인식할 수 있는 기능을 장착하고 있으며 동작과 음성을 인식하기 위해 설치된 카메라와 마이크 등 센서들을 통해 데이터를 수집할 수 있다는 것이다. 또한 이렇게 수집된 정보들이 제3자에게 넘어 갈 수 있다고 우려하고 있다. 이러한 우려는 스마트TV는 인터넷망을 통해 작동되며 이때 인터넷망을 통해 TV를 보는 사람을 몰래 관찰하고 엿들을 수 있다고 보기 때문이다. 
  IT기술이 발전하면서 빅브러더 논란은 피해갈 수 없을 것이다. 구글도 스마트폰 이용자들의 움직이는 동선을 파악하고 저장하고 있다가 정보를 손에 쥔 ‘빅브러더(권력자)’가 등장했다는  논란을 일으켰다.

4. 프라이버시 침해
  사이버세계에서는 영역이 구분되지 않는다. 경계가 흐려지고 불투명해진다. SNS사회가 확장 되면서 프라이버시 침해문제가 사회 이슈가 되었다. 페이스북이나 트위터가 대표적인 예이다. 프로필이나 소셜 그래프를 통해 개인에 대한 프라이버시는 서비스업체 데이터베이스에 저장된다. 이러한 빅데이터는 빅브라더가 될 수 있다.
 

Ⅳ. 생각 찾아보기
 
  우리나라 국가정보원도 인터넷 회선을 감청(패킷 감청)하고 있다. 패킷 감청은 이메일은 물론 웹서핑, 게시물 읽기와 쓰기 등 인터넷상 모든 활동을 실시간으로 살펴볼 수 있는 기술이다. 또한 개인 동의 없이 경찰에 자동위치추적권을 부여하는 위치정보보호법 개정안이 국회를 통과하였다. 국가 주도로 이루어지고 있는 통신 감청과 계좌 추적 등이 일상화 되어가고 있음을 알 수 있다. ‘디지털 빅 브러더’ 출현을 예고하고 있는 것이다.
  벤자민 프랭클린은 “잠깐의 안전을 위해 자유를 포기한다면 자유는 물론 안전도 보장받지 못할 것이다”고 했다. 거대한 하이테크 시스템은 개인의 정체성을 사라지게 만들고 있다. 사회의 안전과 개인의 사생활 보호가 합의점을 찾아 조화를 이루도록 만드는 것이 무엇보다 중요하다. 이에 대해 생각해 보시오.
 
/황인술 논설위원(인문학당 아르케 교수)


  • 서울특별시 서초구 논현로31길 14 (서울미디어빌딩)
  • 대표전화 : 02-581-4396
  • 팩스 : 02-522-6725
  • 청소년보호책임자 : 권동혁
  • 법인명 : (주)에이원뉴스
  • 제호 : 독서신문
  • 등록번호 : 서울 아 00379
  • 등록일 : 2007-05-28
  • 발행일 : 1970-11-08
  • 발행인 : 방재홍
  • 편집인 : 방두철
  • ⌜열린보도원칙⌟ 당 매체는 독자와 취재원 등 뉴스 이용자의 권리 보장을 위해 반론이나 정정보도, 추후보도를 요청할 수 있는 창구를 열어두고 있음을 알려드립니다.
  • 고충처리인 권동혁 070-4699-7165 kdh@readersnews.com
  • 독서신문 모든 콘텐츠(영상,기사, 사진)는 저작권법의 보호를 받은바, 무단 전재와 복사, 배포 등을 금합니다.
  • Copyright © 2024 독서신문. All rights reserved. mail to webmaster@readersnews.com
ND소프트