메이커스 관련 개념과 국내외 동향

메이커스 관련 개념과 국내외 동향
메이커스 관련 개념과 국내외 동향

메이커들이 메이커 무브먼트라고 하는 그런 활동들을 할 수 있는 곳이 과연 무엇인가? 그런 것들을 지원하는 장소, 이런 것들을 메이커 스페이스라고 하는데요. 정의는 뭐냐 하면 메이커들이 만드는데 필요한 도구를 갖춰놓은 장소라고 볼 수가 있겠습니다. 주요 도구로는 CNC 그다음에 3D 프린터, 레이저 커터, 3D 스캐너 등의 어떤 디지털 제작 도구가 있겠고요. 또는 우리가 가장 간단하게 볼 수 있는 망치나 선반이라든지 전통적인 작업 도구도 구비되어 있습니다. 그다음에 목적에 따라서 구비한 도구들은 차이가 있을 수 있는데요. 3D에 좀 더 국한되어 있다든지 아니면 패션이나 이런 웨어러블 쪽에 또 국한되어 있다든지 이런 쪽에 특화되어 있는 부분들이 있다 그러면 거기에 따른 또 도구들은 다르게 갖춰져 있을 수가 있겠습니다. 그래서 무엇이냐면, 메이커 스페이스란 무엇이든 직접 만들고 만드는 경험과 결과를 공유하는 메이커 무브먼트에서 메이커 스페이스는 아주 중요한 물리적 공간이 되겠고요. 그래서 거기에 물리적으로 뭔가 만들 수 있는 도구들을 넣어 놓았다에 그치지 않고 그 안에서 사람들과 기술적인 어떤 지식이나 이런 것들을 함께 나누는 것들이 굉장히 더 중요한 어떤 소통의 공간으로서 메이커 스페이스를 말하고 있습니다. 메이커 스페이스와 동일한 개념으로는 팹랩이라고 하는 MIT의 Center가 만들어 낸 그런 팹랩이라고 하는 것들이 있겠고요. 그래서 제작 연구실 팹랩이 있고요. 그다음에 비슷한 개념으로 해커스페이스라고 하는 것들이 있고 테크 숍라는 것들이 또 있고요. 그다음에 팹 카페라고 하는 3D 프린터와 레이저 커터를 좀 기반 설비로 해서 프로토타입을 제작할 수 있게 만들어내는 뭐 이런 것들의 동일한 개념의 어떤 공간들이 있겠습니다.

메이크 페어

그다음에 메이크 페어라는 게 있습니다. 메이크 페어란 뭐냐 하면 메이커들이 직접 만든 개인 작품이나 성과물들을 일반 대중에게 대중들에게 공개하는 행사입니다. 그래서 이런 것들을 만들었어요. 이렇게 해가지고 공개하는 것이 되겠는데요. 2006년에는 2006년에 열린 메이커 페어는 2만 2천 명이 벌써 관람을 시작했고 2015년에는 전 세계 50여 개 국가에서 200회 이상의 메이커 페어가 개최되었고요. 2017년에는 서울에서 메이커 페어가 개최된 사례가 있습니다. 그래서 2018년에 뉴욕에서의 메이크 페어와 Huston의 메이크 페어들에 대한 사진이 있습니다. 각국의 동향에 대해서 말씀드리도록 하겠습니다.

미국의 메이커스 동향

미국 같은 경우에는 제조업의 르네상스가 실현되는 메이커 국가라는 것을 목표로 해서 공공이나 민간이 협력해서 메이커 인프라를 구축하기 위한 운동으로 확산을 있습니다. 그래서 창업형의 메이커 스페이스라는 걸 만들었고요. 메이커 스페이스가 결국 그걸 어떻게 부르냐 그러면 테크숍이라고 해서 하드웨어 스타트업 플랫폼을 만들어 냈습니다. 그래서 테크숍에서 다양한 하드웨어 스타트업을 위한 어떤 환경들이나 플랫폼들을 조성을 했고요. 그다음에 학생들의 교육적인 목적으로 특히나 어린이나 학생들에게 특화된 대중문화형 창의 체험공간인 스파크랩이라는 것도 대표적인 공간으로서 메이커 정신을 지지하고 그다음에 지원하는 그런 공간으로 미국은 활용하고 있습니다.

중국의 메이커스 운동

다음은 중국인데요. 중국은 산자이 문화라고 하는 Made in China로 상징되는 산업을 통해서 Created in China를 위해 전략적으로 메이커를 육성하고 있습니다. 특별히 시드 스튜디오(Seed Studio)라는 장소를 우리가 지원하고 있는데요. 2008년에 중국 심천에 설립이 됐고요. 미·중 두 개 지점으로 확대되고 있습니다. 그래서 공장형의 어떤 제조기업으로서 그 안에는 소량 생산도 가능하고요. 온라인 부품 마켓이라든지 매뉴얼, 공유 플랫폼들을 제공을 합니다. 그래서 지원 서비스로는 3d 프린팅 서비스 그다음에 프로토타입 서비스들이 되겠고요. 공장 비용으로는 일반 중국 공장들보다 10~20%로 저렴한 되겠고요. 최소 10개부터 만개까지의 부품이 생산 가능할 수 있도록 이렇게 되어있어서요. 메이크 페어 자체도 여기서 이제 주체를 하고 실제로 많은 사람들이 참여를 하고 있는 것으로 우리가 보고 있습니다.

국내 동향

마지막으로 메이크 스페이스나 메이커 운동들의 국내 동향들을 말씀드리도록 하겠습니다. 국내 메이커 운동은 주로 민간주도의 메이커 커뮤니티, 정부 주도의 메이커 스페이스 구축으로 추진 중에 있습니다. 그래서 우리나라에 있는 주요 메이커 스페이스로는 팹랩 서울이라고 하는 한국인 최초의 우주인 후보였던 고산 씨가 설립한 타이드 인스티튜드라는 곳에 있는데요. 그 부설 기관으로 팹랩 서울이라는 것이 있고요. 무한 상상실이라고 하는 과기정통부 중심으로 만든 정부의 여러 부처가 참여해서 만든 공간들이 각 지역에 이렇게 존재하게 되고요. 그다음에 서울시에 디지털 대장간이라고 하는 서울시가 용산 전자상가나 나진상가에 위치해서 위치하게 해서 여러 이제 전자상가 내에서 전자 중심의 어떤 것들을 만들어내는 서울시의 디지털 대장간이라는 것이 있습니다. 이런 이제 주요한 메이커 스페이스들이 존재하게 되는데 우리나라의 어떤 메이커 운동들은 어떻게 돼야 되냐면 메이커 스페이스가 수적으로 증가는 되고 있지만 처음 말씀드렸듯이 메이커 스페이스 자체가 그 안에서 그런 인프라나 그런 그걸 만들 수 있는 메이킹 할 수 있는 도구를 지원하는 데 그쳐서는 안 된다는 것입니다. 그것 자체가 서로 커뮤니티나 이런 걸 통해서 공유나 소통이 중요한 공간이라고 볼 때 그런 질적 내실화가 굉장히 요구되고 있고요. 그다음에 민간 중심에서 지속적이고 자발적 운영이 가능한 지원 체계가 이제 필요할 것으로 보이고요. 그래서 정부 주도로 거기에 대한 예산을 투입해서 사람들이 자발적인 활동이 이뤄지지 않을 때는 그게 굉장히 유지하기가 어렵기 때문에 자발적으로 그걸 운영하고 할 수 있도록 하는 지원체계가 필요한 것으로 보고 있습니다. 그다음에 시제품 자체로 그치지 않고 그거 자체를 통해서 결국은 창업이나 또는 기존의 회사들이 그걸 자체 그걸 가지고서 사업화해서 더 많은 수익을 낼 수 있고 그게 바로 어떤 제조 혁신의 플랫폼이 될 수 있는 그런 적극적인 연계가 필요한 것으로 우리가 보고 있습니다. 우리나라의 그런 메이커 운동들도 앞으로는 더욱 발전된 형태로 발전할 수 있고 그다음에 내실화가 될 수 있는 그렇게 되기를 바라겠습니다.

메이커(DIY) 운동 개념과 관련 요소

메이커(DIY) 운동 개념과 관련 요소
메이커(DIY) 운동 개념과 관련 요소

디지털 DIY, do it yourself라고 하죠. 디지털 시대에서 결국은 제품과 서비스들이 많이 결합되고 있는데 그걸 개인이 개인의 취향과 목적에 맞게 무언가 만들어 보는 그런 형태 그래서 기존에 있는 기술들을 가지고서 개인이 그 모든 기술들을 총합해서 무언가 새로운 제품을 만드는 그런 메이커 운동에 대해서 한번 알아보도록 하겠습니다.

메이커 운동이란?

메이커 운동이란 ICT 기술의 발전으로 인해서 스스로 필요한 물건을 제작하는 메이커 운동이라는 것 때문에 나타나게 되었습니다. 기존의 장인들이 무언가 물건을 만들었을 때는 그냥 장인이 가지고 있는 고유의 기술을 가지고 만들게 되는데 현대에 와서는 오픈소스라든지 우리가 누구나 그래픽이나 이런 걸들을 활용해서 제품을 만들어 낼 수 있는 3D 프린팅 기반의 제품개발 기술들이 우리가 멀리 퍼지게 되면서 누구나 혁신이 가능한 수준의 제품개발이 가능해졌습니다. 거기에 따라서 메이커 운동이란것이 일어나게 되었습니다.

메이커란 그럼 무엇이냐?

기업이나 전문가가 만든 기성의 어떤 제품들을 맹목적으로 소비하는 것이 아니라 인터넷을 통해서 지식을 공유하고 다양한 재료와 기술 도구를 활용해서 주체적으로 물건을 만드는 과정에서 기쁨과 즐거움을 찾는 사람을 얘기합니다. 그래서 메이커의 특징으로는 크게 두 가지를 들고 있는데요. 대중화된 도구를 사용해야 됩니다. 그래서 3D 프린팅이라든지 그다음에 뭐 아두이노 키트라든지 뭐 이런 키트들을 이용해서 대중화된 도구를 사용해서 새로운 물건을 만들어야 되고요. 그게 본인의 어떤 지식만 가지고 하는 게 아니라 여러 온라인 커뮤니티를 통해서 얻은 공유된 정보로 만들어야 되고, 그것을 혼자만이 아니라 다양한 사람과 소통을 통해서 만들어 낸다는 점에서 어떻게 보면은 굉장히 서로 협동해서 만들어내는 그다음에 커뮤니티 스타일의 활동이라고 볼 수가 있겠습니다.

DIT와 메이커 무브먼트

DIT와 메이커 무브먼트에 대해서 말씀드리도록 하겠습니다. 그래서 앞서 말씀드렸듯이 메이커 정신이라는 것은 그거 자체가 커뮤니티를 통해서 서로 협동하고 서로 무언가 같이 만드는 거라고 볼 수가 있다고 그러면 기존에 있는 DIY라는 용어는 본인이 직접 뭔가를 만드는 거를 의미하는데요. DIT라는 것이 요새는 각광받고 있습니다. 즉 Do It Together, 다양한 플랫폼을 통해서 지식을 공유해서 만들어내는 이런 것들이 볼 수가 있겠고요. 앞서 말씀드린 메이커들이 결국은 프로슈머라는 형태로 무언가 제품을 소비하기도 하지만 거기서 또 생산을 이뤄내는 그런 것들이 되겠고요. 그다음에 소량 생산이나 온라인 유통망 등의 새로운 산업혁명을 이끌게 되는 그런 관점으로 DIT라는 것들이 대두되고 있습니다. 그다음에 그런 메이커 무브먼트의 하나로서 협동 기반의 확장된 DIY로서 DIY 정신 자체가 어떤 산업 단위로 계속 어떤 사회적 흐름화되는 그런 것들을 메이커 무브먼트라고 합니다. 그래서 메이커들이 새로운 제품이나 이런 것들 공유나 협업의 형태로 제품을 마련하면서 거기에 또 디지털 매체가 포함되고 그걸 또 공유하게 되고요. 그것들을 나누려고 하고 거기에 따른 서로가 서로에 대해 지식적인 부분들이 또 재창조되고 그다음에 그 자체가 새로운 어떤 협동의 결과물로 또 다시 바뀌게 되는 이런 것들이 될 수가 있겠습니다. 그래서 그런 것들을 메이커 무브먼트라고도 부르게 되었습니다.

자율 주행 자동차에 진출한 기업들과 전망

자율 주행 자동차에 진출한 기업들과 전망
자율 주행 자동차에 진출한 기업들과 전망

자율 주행 선두주자로 가장 오른쪽에 보시면 Waymo라고 하는 것들이 있고요. 그다음에 GM이나 Ford 쪽도 자율주행을 굉장히 많이 하고 있습니다. 그래서 가로축이 전략 strategy, 운행의 전략 부분 그다음에 세로축이 실제 실행이라고 보면은 리더들은 결국은 얼마나 오랜 시간 자율 주행을 했는지도 굉장히 중요하거든요. 그래서 test car가 자율 주행을 얼마나 오랫동안 했느냐가 중요하는데 그 부분에서 보면은 Waymo나 그다음에 GM 쪽이 굉장히 오랫동안 했었고요. 그다음에 전략이나 실행 쪽에서도 굉장히 선두주자로 볼 수가 있습니다. 그래서 이제 2017년에 자율주행모드 강제 해제 보고서라는 게 있습니다. 강제 해제됐다는 게 무슨 말이냐면 자율주행으로 가다가 무언가 문제가 생겨서 그게 해제되고 오류가 생겼다는 뜻일 수도 있겠죠. 그래서 거기서 보면은 가장 낮은 게 Waymo가 해당되고요. 자율주행 거리도 이미 굉장히 긴 기간을 긴 거리를 이렇게 되었고요. 그다음에 GM 같은 경우도 자율주행 해제 건수가 한 1,000마일당 0.8 정도로 굉장히 해제 건수가 낮고 그다음에 자율 주행 거리도 Waymo 그다음으로 두 번째로 일단 긴 것으로 통계가 나와 있습니다.

자율주행차 메모리의 콘텐츠 전망

자율주행차 메모리의 콘텐츠 전망은 다음과 같습니다. 결국은 콘텐츠가 자율주행차가 굉장히 발전되기 위해서는 메모리나 이런 것들이 굉장히 받쳐줘야 되는데 메모리는 결국은 D 램 수준이 74GB 이상이 돼야 될 거고 NAND 메모리 수준도 1TB 이상이 될 것이다. 그다음에 반도체 시장이 발전이 될 건데 그중에서 한 9. 7% 가장 높은 수준이 물론 Automative라는 자동차 시장에서 그렇게 될 것이다. 물론 이제 자동차에서 반도체가 필요하다 그러면 그거는 주로 자율주행에 쓰이게 되는 거겠죠. 그런 부분으로 자율 주행차에서 메모리가 굉장히 중요한 것을 우리가 알 수가 있겠습니다.

자율주행 플랫폼

다음은 자율주행 플랫폼입니다. 자율주행 플랫폼은 크게 두 가지로 나누고 있습니다. 인텔에서 하는 모빌아이라는 게 있겠고요. 그다음에 엔디비아라고 하는 소위 엔디비아같은 경우에는 그래픽카드나 이런 것을 만드는 회사입니다. 그래서 결국은 그래픽 카드를 만듦에도 불구하고 자율주행차가 잘 운행될 수 있도록 결국 그 시스템을 운영하고 거기에 따라서 센서들에 대한 통신이라든지 전반적인 걸 다 그다음에 최적의 센서에 대한 내용들 그다음에 비전위에 대한 것들을 어떻게 잘 조정해서 할 거냐 이런 것들이 그래픽을 하는 컴퓨터 그래픽 회사들이 굉장히 각광받는 이유 중에도 하나가 되겠습니다. 그래서 앤디 비아 쪽은 폭스바겐, 아우디 그다음에 인텔의 모빌아이 쪽은 BMW나 FAC가 주로 하고 있고요. 부품 업체로는 콘티넨탈이나 델파이 이런 쪽 그다음에 보쉬나 ZF 쪽이 주로 엔디비아 쪽에 플랫폼을 운영하고 있습니다. 그다음에 카메라 센서 모듈의 중요성에 대해서 말씀드리도록 하겠습니다. 카메라는 일단 외부 주행 환경을 인식을 해야 됩니다. 즉 자율 주행 자동차 시스템의 중요한 것은 크게 세 가지인데요. 외부의 주행 환경을 인식해야 되고 그걸 판단해야 되고 주행 전략을 짜야 되고 그거를 통해서 차량을 제어해야 됩니다. 그래서 이제 거기에 들어가는 것이 외부환경을 인식하는 부분, 특히나 경로탐색은 정밀 지도나 측위가 될 수가 있겠고요. 고정 사물 인식이라고 하는 V2X 통신이란 것은 뭐냐 하면 Vehicle to infra 그래서 소위 얘기하는 신호이나 이런 것들을 차량이 서로 통신을 통해서 무언가 정보를 받아야 되겠고요. 그다음에 인접 차량이나 인프라에 대한 통신들에 대한 것들도 중요하고요. 그다음에 초기에 말씀드렸는데 그런 ADAS라고 하는 그런 이제 ADAS 센서들 주로 Lider, Reder 등 이런 것들이 있는 센서들의 정보들이 되겠고요. 그걸 통해서 학습을 통해서 판단하거나 제어하는 것들이 되겠고요. 또는 센서를 기반으로 해서 지금 어떤 상태인지 이게 사고가 날 수 있는 상황인지 어떤 것들인지 주변 상황을 인지하는 시스템들이 좀 필요하고요. 마지막으로 그것을 통합적으로 봐서 차량을 제어하는 통합 차량 제어 설루션이 필요한 것으로 되어있습니다.

자율주행차가 성공하려면 그러면 뭐가 필요할까요?

가장 중요한 요소로 찾는 것이 HD Map과 그다음에 말씀드린 V2X가 되겠습니다. HD Map이란건 뭐냐 하면, 물론 HD가 High Definition라고 하는 HD 화질 뭐 이렇게도 볼 수가 있겠는데요. 결국은 고성능의 map이 필요하다는 겁니다. 기존에 우리가 map이라 그러면 내비게이션의 map만 생각할 수가 있는데 그런 map에다가 주변의 인식 대상의 이동체나 이런 것들이 레벨로 쭉 나눠져서 분석이 가능하도록 하는 것들이 HD map이라고 합니다. 그래서 자동차들 신호등 그다음에 이동하는 이동체들 그다음에 레벨 3에 해당되는 거기에 따른 또 지도들 그다음에 기존 레벨 2에는 기존의 고정 환경 지도라든지 그다음에 레벨 1에 해당하는 우리가 내비게이션에서 쓰고 있는 기준지 도라든지 이런 쪽에 있어서의 그런 새로운 정보 수준에 따른 지도들이 필요한데 그걸 레벨 4까지 Layer를 두고 그게 총합된 정보를 통해서 자율 주행할 수 있는 그런 기술들이 HD map으로 필요하게 되고요. 마찬가지로 V2X(Vehicle to Everything communication)라고 하는 여기서의 V는 중요한 요소 V는 뭐냐 하면 Vehicle입니다. 자동차가 어떤 X는 뭐냐 하면 주변 환경에 있는 어떤 요소들과 서로 통신을 해야 되는데 그게 무엇이냐면 주변에 있는 신호등 그다음에 걷는 어떤 사람들 그다음에 주변의 자동차들 주변에 있는 여러 가지 어떤 그 지도들 그다음에 주변에 원래 있는 고정형이라든지 그다음에 사고라든지 이런 것들이 서로의 어떤 그 해당 사물들, 주변 사물들과의 통신을 통해서 그 거기서 주행하는 데 있어서 정보를 잘 알아낼 수 있도록 최적의 어떤 정보를 알아내고 최적의 판단을 할 수 있도록 만들어 주는 것들이 V2X라고 하고요. 그러한 통신 기술이야말로 자율 주행을 할 수 있게 하는 굉장히 요소 기술이라고 볼 수가 있겠습니다.

블록체인 기술 방식으로 만들어진 가상 국가 - 비트 네이션

블록체인 기술 방식으로 만들어진 가상 국가 - 비트 네이션
블록체인 기술 방식으로 만들어진 가상 국가 - 비트 네이션

비트 네이션은 최초의 블록체인 기술의 방식으로 만들어진 가상 국가입니다. 그래서 4차 산업혁명의 정신에 입각해서 거기에 따라 운영되는 통치방식을 활용하고 있는데요. 블록체인이라고 하면 블록체인 부분에 있어서 금융의 혁명 측면에서 말씀드렸는데 결국은 개인의 정보들을 개인이 그냥 블록이라는 이름으로 해서 체인으로 엮어서 개인이 보관하겠다는 것입니다. 국가라는 또는 은행이라는 중앙에 뭐가 있지 않고 개인이 주체가 되는 것이 블록체인인데, 그런 관점에서 운영되는 통치 방식을 활용하는 것이 비트 네이션입니다. 2014년에 스웨덴 출신의 해커인 수잔 타르코프스키 템펠호프가 지식자 재산권의 철폐를 주장하는 해적당을 창당합니다. 그래서 그 해적당을 창당하고요. 그 지식재산권 법이 없다, 지식 재산이라는 것을 다 공유해야 된다는 이런 관점이었고요. 그런 해커가 이런 비트 네이션을 만들었고요. 그래서 결국 시민이 자유나 표현에 자유 추구라는 디지털 시대에 맞는 원칙을 주장했습니다. 그래서 시민 자체가 자유나 표현의 자유들이 많이 있다, 시민의 자유, 또는 표현의 자유, 이런 것들이 있다고 주장했고요. 그다음에 시민의 권리와 개인의 정보보호, 문화적 자유, 특허권 등 독점권을 갖는 것들은 국가의 운영에 유해하다는 강한 신념을 가지고서 이러한 것들을, 비트 네이션을 만들었습니다. 그래서 결국은 자유, 표현, 다음은 거기에 특허나 또는 독점권 등이 없는 것이 국가가 유익하다, 이렇게 신념을 가지고 만든 것이라고 볼 수가 있겠습니다. 그래서 이제 비트 네이션은 국민의 출생, 사망, 결혼, 부동산, 등기, 법적 문서 등의 모든 기록들을 블록체인의 방식으로 기록을 하고 있고요. 중앙관료가 없어도 국가가 운영할 수 있는 형태가 되겠습니다. 그다음에 국가를 구성하는 국민이 자발적으로 개인 간의 업무를 블록체인에 올려서 공증받는 이런 형태로 업무가 운영됩니다. 그래서 비트 네이션의 특징은 뭐냐면 국경이 없는 것입니다. 시민이 어디에 있을 수 있고 모든 전 세계 사람들이 비트 네이션의 국민이 될 수도 있겠고요.

탈 중심적

그다음에 탈 중심적이라는 말인데요. 블록체인을 기반하고 있기 때문에 중앙에 있는 은행이라든지 정부 자체가 필요가 없습니다. 그래서 개인의 어떤 자치권을 보장하고요. 그다음에 자발적인 것이죠. 비트네이션은 사람들이 완전히 새로운 정부 시스템을 스스로 개발하고 만드는 플랫폼이라고 볼 수가 있겠습니다. 그래서 법률이나, 안전 부분이나, 경제, 외교, 그다음에 교육이나, 복지 부분에 있어서 다양한 블록체인의 관점으로 이렇게 진행됨으로써 다양한 활동 또는 국가 입장에서의 서비스들이 진행되고 있습니다. 비트 네이션에서 결혼증명의 예를 한번 들자면 비트 네이션에서 두 사람이 결혼했습니다. 결혼 증명을 등록하기 위해서는 첫 번째로 내 결혼 사실을 비트 네이션에 등록하고 싶다, 이런 의도가 있으면요. 두 번째로 비트 네이션의 신분증을 이용해서 결혼 증명서가 담긴 블록을 만듭니다. 블록체인이라고 하는 거기서 블록을 만들죠. 해당 블록을 모든 참가자들 컴퓨터에 보내고요. 모든 컴퓨터가 검증, 인증하면 블록이 등록됩니다. 즉 개인들이 두 사람이 결혼한 기록을 개개인이 다 가지고 있는 거죠. 블록을 순서대로 사슬, 체인으로 쌓이기 때문에 조작이 거의 불가능하죠. 그래서 그것을 누구나 볼 수 있는 영구 기록으로 만든 것을 결혼 증명서가 비트 네이션에 또 등록되는 이런 형태로 되겠습니다. 그래서 블록체인 관점에서 거기에 대한 자료들을 서로가 공유하면서 거기에 대한 인증 부분을 얘기할 수 있는 이런 형태가 비트 네이션에서의 결혼 증명에 대한 것이 되겠습니다.

세컨드 라이프

비트 네이션과 유사한 사례로 세컨드 라이프라는 게 있습니다. 원래 2000년대 중반에 큰 인기를 끈 세컨드 라이프라는 온라인 게임이 있습니다. 마찬가지로 거기와 콘셉트가 똑같은데요. 3차원 가상공간에 아바타를 만들어서 제2의 인생을 살아보는 서비스를 얘기합니다. 원래 세컨드 라이프라는 거는 휴가 기간이나 사이버 공간을 통해서 다른 삶을 사는 걸 의미하는데 어떻게 보면 현재 직장 외 다른 직업을 체험하고자 하는 욕구 때문에 인터넷에 보편적인 가상의 삶을 경험하는 사람들이 증가하는 추세에 따라서 대표적으로 만들어진 서비스라고 볼 수가 있겠습니다. 그래서 세컨드 라이프는 미국 샌프란시스코에 본사를 둔 벤처기업인 린든 랩에서 2003년에 인터넷 기반의 가상현실 공간인데요. 나의 자아가 있으면 여기서는 또 다른 자아, 내가 현실에서는 남자지만 이런 세컨드 라이프에서는 여자가 될 수도 있고, 흑인이나 백인이 될 수도 있고, 동양인이 될 수 있는 이런 형태로 된 것들이 또 세컨드 라이프라는 것이 있습니다.

아스가르디아

또 다른 형태로 비트 네이션의 유사 사례로 아스가르디아라고 하는데요. 2016년 10월, 오스트리아의 민간단체 항공우주 국제 연구센터(AIRC)라는 곳에서 우주 국가가 건설 프로젝트를 공개했습니다. 그래서 세계의 과학자들이 인공위성을 쏘아서 거기에 사람들을 이주시켜서 만든 우주 국가가 아스가르디아를 건설하겠다고 공표했고요. 인공위성을 쏴서 우주 이주 조건을 가진 독립국에 대한 어떤 새로운 틀이고요. 인종과 국적을 초월한 윤리적으로 독립된 국가로 이름, 주소, 이메일만으로 시민권을 인정받을 수 있는 가상 국가에 해당됩니다. 결국은 이러한 4차 산업혁명 시대에 맞게 국가라는 개념도 느슨해지고 있고요. 현실에서의 어떤 제약이나 이런 것들이 많이 느슨해지면서 사이버나 디지털 공간에서의 자아, 아이덴티티가 오히려 더 중요해지는 그런 형태의 어떤 변화들이 또 있겠습니다. 이상으로 비트 네이션에 대해서 말씀드렸습니다.

유통혁명 - 옴니채널의 등장 배경과 목적

유통혁명 - 옴니채널의 등장 배경과 목적
유통혁명 - 옴니채널의 등장 배경과 목적

유통 혁명이라고 할 수 있는 옴니채널에 대해서 말씀드리겠습니다. 옴니채널은 무엇이냐면, 옴니라는 것은 하나라는 뜻을 얘기합니다. '채널이 하나다', 이렇게 얘기하는데요. 옴니채널이라는 것은 매장이라든지, 오프라인 매장이라고 하죠. 오프라인 매장이라든지, PC의 온라인 사이트, 웹사이트라든지, 모바일의 웹사이트, 또는 구매 앱이라든지, 그다음에 TV 홈쇼핑, 소위 과거에 있던 카탈로그를 통한 카탈로그 쇼핑, 이런 여러 개의 쇼핑 채널이 있습니다. 그런 쇼핑채널들을 소비자 중심의 관점에서 각 채널을 빈틈없이 유기적으로 결합해서 일관된 쇼핑 경험을 끊김 없이 제공하는 것을 의미합니다. 즉 지금은 굉장히 많은 채널들이 존재합니다. TV에서는 홈쇼핑 채널이 있고, 그다음 모바일에서는 모바일 구매 앱이 있고, 그다음에 소셜 네트워크도 있고, 인터넷도 있고 아주 다양한 것들이 있는데 그런 여러 가지 채널을 하나의 옴니채널로서 통합해서 그다음에 거기에 대한 서비스들을 고객 입장에서 강화하겠다, 그게 이제 옴니채널의 정의가 되겠습니다.

옴니채널의 배경

옴니채널의 배경은 간단하게 두 가지의 상황으로 볼 수가 있겠습니다. 미국의 National Retail Federation에서 19개국 11만 명의 고객을 대상으로 설문을 진행했습니다. 그 결과 43%의 소비자가 온라인 쇼핑을 선호한다고 응답했습니다. 그런데 그중에서 실제로 29%만 가장 최근에 구매를 온라인에서 했습니다. 그러한 갭이 무엇이냐면, 결국은 소비자가 온라인 쇼핑을 선호하지만 실제로 본인이 굉장히 중요하고 사고 싶거나 정말 이것은 구매하는 데 있어서 중요하다고 생각하는 것들은 실제 오프라인에서 가서 구매하는 이런 경향을 보인다는 것입니다. 그래서 “내가 이거는 직접 보고 구매해야 돼” 이렇게 말씀하시는 분도 주변에 많이 보게 되죠. 그래서 그런 형태로 해서 어떻게 보면 온라인이 중요하지만 그렇다고 해서 오프라인이 중요하지 않다고 볼 수 없는 이런 상황이고요. 그다음 아래에 보시면 42%의 소비자는 GPS를 통한 유통업체들과 위치 공유가 도움이 될 것으로 생각한다, 이렇게 얘기합니다. 하지만 실제로 28%는 그럴 의향이 있다고 응답한다, 이럽니다. 그래서 42%는 내 위치를 공유하면 유통업체가 많은 서비스를 해줄 거라고 생각을 하지만, 실제로 그러고 싶은 사람은 많지 않다는 거죠. 거기에 비하면. 결국은 온라인이 잘 될 것 같지만 오프라인 보조를 해야 되는 입장이지만 마찬가지로 오프라인이 잘 될 것 같지만 그 안에는 온라인의 도움이 필요하다, 이런 쪽으로 우리가 해석이 가능합니다. 즉 온라인이 오프라인의 도움을 받고, 오프라인이 온라인의 도움을 받는, 이런 어떤 채널 간의 서로의 통합 그리고 거기에 시너지들을 이뤄내겠다는 것들이 옴니채널의 배경이 되겠습니다. 거기에는 이제 여러 용어들이 있는데요. 쇼루밍이라는 것이 있고, 웹 루밍이라는 것이 있고, 역쇼루밍이라는 것이 있습니다. 쇼루밍이라는 것은 무엇이냐면 오프라인 매장에서 제품들을 찾아봅니다. 찾아보고 가서 '어, 이 제품 괜찮나?' 보게 되는 거죠. 그래서 이제 보고 그다음에 그것을 실제로 구매할 때는 온라인으로 그 제품을 가장 최적가에 구매하는 경향이죠. 그것을 쇼루밍족, 이렇게 얘기를 합니다. 그래서 왜 쇼루밍이냐면 결국은 오프라인 매장을 마치 쇼룸처럼, 거기서 구매가 일어나는 것이 아니라 제품을 그냥 나열하는 거다, 쇼룸처럼, 이런 것을 쇼루밍족이라고 얘기를 합니다. 그래서 오프라인에서는 제품을 검색하는 데 시간을 들이고 온라인에서는 오히려 그걸 사고 구매하는 것이 되겠고요. 웹 루밍은 쇼루밍과 동일하게, 거의 비슷하게 쓰일 수가 있는데요. 그와는 반대입니다. 그래서 온라인으로 막 제품을 찾아봐서 ' 이 제품이 좋은가? 저 제품이 좋은가?' 일단은 비교해서 제품군을 만들어 내고요. 그다음에 그것을 실제로 살 때는 오프라인 가서 만져보고 색감도 보고 기능도 보고 이러면서 제품을 사는, 반대의 경향이 웹 루밍이 되겠습니다. 그래서 온라인에서 오히려 쇼룸처럼 만들어진 것이다. 온라인이. 그래서 그것을 웹 루밍이라고 얘기하기도 하고 쇼루밍의 반대라고 해서 역쇼루밍이라고 얘기를 하고 있습니다. 즉 이러한 소비자들이, 합리적 소비자들이 많아지고 있다는 것이 어떻게 보면 옴니채널의 또 하나의 배경이 될 수도 있겠습니다.

유통채널의 변화

유통채널들이 굉장히 많이 변화됐습니다. 여러분들이 처음에 볼 때는 싱글 채널이라고 하는, 과거에는 오프라인 점포만 존재했습니다. 그래서 오프라인에 가서, 그 점포에 가서 그 브랜드 물건은 거기서 사야겠죠. 그게 싱글 채널이었고요. 또 그다음에 나온 게 멀티채널입니다. 전략들이 그때는, 과거에는 멀티채널을 잘 운영해야 된다, 이런 부분들이 있었습니다. 그것이 뭐였냐면 결국은 오프라인에서 제품을 판매하고 온라인에서 제품을 판매하고 모바일에서 아주 많은 곳에 이 제품을 노출시키고 깔겠다는 얘기입니다. 노출시키고 깐 것에 통해서 다양한 곳에 소비자들의 접점을 갖게 하겠다. 그러면 매출로 늘어나겠지, 이렇게 생각하는 게 이런 멀티채널의 관점이었고요. 그렇게 되다 보니까 각 채널별로 연관성이 없어서 크로스 채널이라는 게 나옵니다. 그래서 온라인과 오프라인이 연결은 되는데 이게 마치 하나처럼 되는 게 아니라 결국은 오프라인 매장과 온라인 매장이, 그다음에 인터넷 매장과 스마트폰 매장이 이렇게 서로 연계해서 가는 그런 크로스 채널들이 나오게 됐고요. 결국은 온·오프의 보완관계만 가지고 가는 크로스 채널이고요. 그렇다면 진정한 옴니채널이란 건 뭐냐면 그걸 고객중심으로 해서 하나로 엮는 이런 것들이 온·오프 그 자체가 결국은 보완적인 것이 아니라 거기서 새로운 밸류를 찾아나가는, 더 나아지는, 과거보다, 혼자 있을 때 보다 더 나아지는, 채널 하나보다 여러 채널이 서로 시너지를 내는 것들을 옴니채널로 변화됐다고 얘기하겠습니다.

옴니채널의 제품 판매 프로세스

옴니채널의 제품 판매 프로세스를 보시면요. 옴니채널이 되면 기존의 본사와 매장, 이커머스 등이 서로 다르게 기획도 하고 마케팅도 하고, 재고관리도 하고, 그다음에 운송이나 이런 부분들이 있다 그러면, 이런 것들을 하나로 묶는 것입니다. 기획도 처음 단계부터 본사나 매장이나 이커머스 측과 같이하고요. 마케팅도 통합된 관점에서 하고 재고도 온라인에 재고가 있으면 오프라인에 가서 찾는다든지, 오프라인에 재고가 없으면 온라인에서 재고를 준다든지 이런 부분들이 있겠고요. 그다음에 지금도 많이 하고 있는 매장에서 픽업하기, 이런 것들의 어떤 운송이나 제품의 픽업 서비스들, 이런 것들이 많이 될 수 있겠습니다. 그래서 이런 형태로 해서 옴니채널의 형태는 다양한 제품의 밸류 체인에서 하나의 통합된 관점으로 보겠다는 것이 옴니채널의 실제가 되겠고요.

옴니채널의 목적

이렇게 이제 소비자의 요구사항들을 보면 매장재고를 실시간으로 또 온라인에서 볼 수가 있고 뭐 그런 것들이 될 수가 있겠고요. 소비자 요구사항들은 온오프에서 통합되는 쿠폰은 좀 달라, 그래서 오프라인 매장 가서 온라인에서 쓰는 쿠폰을 보여주면 거기서 할인될 수 있게, 그다음에 상품 주문이나 상품 대응들을 오프라인 매장에서도 온라인 상품을 주문을 하게 되면 그 상황에 따라 오프라인에서 살 수 있고 아니면 집으로 보낼 수 있는 이런 부분. 그다음에 결제나 결품 배송이라고 하는데 거기서 뭔가 잘못 보내졌거나 또는 제품 자체가 문제가 있거나 이런 것들에 따른 그런 어떤 대응들, 이런 것들이 있을 수가 있겠고요. 그다음에 빠져있는 것들, 이런 것들을 제품 하나가 안 왔다, 그러면 오프라인 매장에 가서 받을 수 있는 이런 부분들이 있겠고요. 그다음에 온라인에서 주문했는데 오프라인 매장에서 반품이 가능하도록 해 달라. 그다음에 온오프 라인에서 통합 로열티를 통해서, 하나의 로열티 시스템을 통해서 그런 마일리지나 이런 걸 적립하는 데 있어서 하나로 적립하면 좋겠다. 이런 것들이 소비자들의 요구사항이 되겠습니다. 그래서 선진 유통 업체는 옴니채널 효과를 보고 있는데요. 메이시스 백화점 같은 경우는 뒤에도 잠깐 나올 텐데 온·오프라인의 상품이 고객 정보를 통합하면서 온오프의 마일리지나 이런 것들을 동일하게 쓸 수 있는 이런 환경을 만들었고요. 월마트 같은 경우는 스마트폰으로 상품을 스캔하거나 결제할 수 있도록 했고, 아마존은 바코드를 찍거나 음성으로 제품명을 말하면 온라인 장바구니에 주문 접수할 수 있는, 그래서 오프라인에서 거기서 가서 이렇게 바코드를 찍거나 음성으로 제품명을 말하면 온라인 쇼핑이 가능하게 만들어져 있고요. 그다음에 Pinterest 경우는 pin을 누른 횟수가 높은 상품을 온라인 스토어 섹션에서 운영하는, 그래서 SNS 자체가 온라인 상점화와 연계성이 있겠고요. 페이스북의 '좋아요'를 누른 횟수가 실시간으로 옷걸이에 나타나는 방식으로 옷걸이를 보면 “이 옷은 페이스북의 '좋아요'가 얼마 눌러졌구나. ” 이런 온라인의 정보가 오프라인의 의류업체에 가는, 매장으로 가는 형태로 해서 옴니채널의 사례들이 있겠습니다. 그래서 결국은 월마트 같은 경우는 'Tahoe'라는 서비스를 진행하고 있고요. 베스트바이 같은 경우도 온라인의 구매 절차를 좀 간소화했고요. 온라인의 주문 상품을 오프라인 매장에서 수령할 수 있고, 메이시스 같은 경우는 '숍 비콘' 비콘 서비스라고 해서 오프라인 매장 가까이 가면 관련 제품의 쿠폰을 사용자한테 보내주는, 온라인으로, 스마트폰으로 보내주는. 이런 형태가 숍 비콘 서비스가 되겠습니다. 아마존닷컴 같은 경우는 '대시(Dash)'라는 이런 조그마한 기계가 있는데 그 서비스를 통해서 편리하게 온라인으로 주문할 수 있게 만들어주는 일종의 거래환경을 제공하고 있습니다. 이렇듯 채널 자체의 온라인과 오프라인을 단순히 보완뿐만 아니라 그것 자체에 대해서 새로운 형태의 서비스를 진행하는 것들이 고객 관점의 옴니채널이라고 볼 수가 있겠습니다. 이상으로 옴니채널에 대해서 말씀드렸습니다.

머신러닝 유형과 활용분야, 국내외 개발사례

머신러닝 유형과 활용분야, 국내외 개발사례
머신러닝 유형과 활용분야, 국내외 개발사례

머신러닝에 대해서 알아보도록 하겠습니다. 머신러닝은 기계 학습인데 기계학습이라는 것은 컴퓨터에 명시적으로 프로그래밍하지 않고 학습할 수 있는 능력을 부여하는 컴퓨터 과학의 하위 분야입니다. 그림에 보시면 원래는 컴퓨터가 input과 program 입력 변수와 임의 사용자와 개발자가 만든 프로그램을 가지고 그것을 컴퓨터에 집어넣게 되면 output을 내놓게 됩니다. 일반적인 프로그래밍은 프로그래머가 프로그램을 해서 컴퓨터가 이해하고 output을 내놓는 과정이라고 그러면 기계학습은 뭐냐면 컴퓨터에 input과 output을 줍니다. input이 이것이고 output이 이건대 그 안의 logic을 컴퓨터가 찾아내 봐, 이것이 바로 기계 학습이라고 볼 수 있고 기계가 프로그램을 직접 작성하는 것이 기계 학습이라고 볼 수 있겠습니다.

머신러닝의 세 가지 분야 활용

머신러닝은 총 세 가지 분야에 걸쳐서 우리가 배우게 되고 활용할 수 있게 됩니다. 첫 번째는 Computer Science이고 인공지능이나 뉴럴 네트워크, 컴퓨터 비전, 자연어 처리에 있어서 Computer Science 영역이 있고, 그다음에 Statistics라고 하는 확률 부분이 있습니다. 확률과 회귀, 베이지안 네트워크와 관련한 부분이 있고 그다음에 Data Mining이라고 하는 학문에 패턴인식, 빅데이터, 연관분석, 추천 등에 있어서 세 가지의 공통분모를 또는 세 가지의 활용 분야를 가지고 세 가지의 기술 요소를 가지고 Machine Learning을 수행하게 되겠습니다. 최근에 나와서는 언어들이 혼재되거나 언어들이 비슷한 것으로 쓰이고 있는데 초기에는 우리가 인공지능이라는 것을 얘기했습니다. 사고나 학습, 인간이 가진 지적 능력을 컴퓨터를 통해 구현하는 기술을 인공지능이라고 하면 그것 중의 하나의 방법이 머신러닝이라고 볼 수 있겠습니다. 컴퓨터가 스스로 학습해서 인공지능의 성능을 향상하는 기술 방법인데 input과 output을 주고 그것을 통해서 머신이, 기계라고 할 수 있는 것이 그 결과를 찾아가기 위해서 끊임없이 학습해서 logic을 만들어 내는 것이 머신러닝이고, 그것보다 조금 작은 것이 딥러닝인데, 딥러닝은 인공신경망의 방법의 하나의 종류입니다. 그래서 인공신경망이라고 하면, 인공지능 강의에서 말씀드렸듯이 인공지능 자체가 사람들의 뇌가 어떻게 생겼을까? 하는 관점에서 처음에 시작했다고 할 때 스냅 시스라는 인공 뇌의 전달 망들을 시뮬레이션해서 인공 신경망을 만들었고 그것 중에 여러 계층을 둠으로써 마치 계층 자체가 깊은 계층이라고 볼 수 있어서 인공신경망의 계층을 깊게 만든 것을, 여러 계층으로 깊게 만든 것을 딥러닝이라고 부르고 있습니다.

머신러닝의 유형에는 어떤 것들이 있을까요?

첫 번째로는 supervised learning이라고 하는 지도 학습이 있습니다. 정답지로 학습을 하는 것입니다. 그래서 input이 있고 정답지가 있어서 그 정답을 가지고 정답을 찾아가는 방법을 supervised 됐다 지도 학습이 supervised가 되겠습니다. 아예 정답이 없는 경우가 있습니다. 무조건 어떤 데이터가 있으면 이 데이터의 특성을 여러 가지로 분석해서 이것을 분리하라는 것이 있습니다. 이것이 어떤 특정한 분류 자체의 정답이 없는 것입니다. 그것이 비지도 학습이 되겠습니다. 그다음에 강화 학습이란 건 시뮬레이션 반복학습을 통해서 예측이나 퍼포먼스의 성능에 강화하는 데 사용되는 것이 강화 학습이 되겠습니다. 그래서 머신러닝은 이 세 가지 유형으로 나눌 수 있겠습니다.

그러면 머신러닝을 어디에 쓸 수 있을까요?

여러 응용 분야들이 있습니다. 첫 번째로 인터넷 정보검색을 할 수 있습니다. 웹로그, 스팸 필터, 문서 분류 등이 있고 컴퓨터의 시각이라고 할 수 있는 문자, 패턴, 물체를 인식하고 이미지 안의 얼굴을 인식하는 것이고 마찬가지로 음성인식을 통해서 사람이 하는 말을 듣고 그것이 어떤 단어인지를 인식하는 것, 그리고 모바일 휴먼 컴퓨터 인터페이스(Human Computer interface)에서 보면 모바일에서 동작, 패턴, 제스처를 인식하는 것이 있고 생물 정보에서 유전자 인식, 단백질 분류, 유전자 조절 망 분석이 있고 바이오 매트릭스에서 홍채인식, 심장박동 수 측정, 혈압 측정, 당뇨치 측정이 있고 컴퓨터 그래픽은 데이터를 기반해서 애니메이션, 캐릭터가 3D로 만들어지면 그 캐릭터 동작을 제어하거나 운동학적으로 된 것을 역운 동학으로 다시 만들어주는 것이 있겠습니다. 로보틱스는 로보틱스 안에 들어가서 장애물을 인식, 물체를 분류, 지도 작성, 무인자동차를 운전하는 것이 될 수 있고 서비스업 같은 경우는 고객 분석, 해당 시장 분석, 고객 관리, 마케팅, 상품 추천 등 이런 곳에 활용될 수 있습니다. 제조업 같은 경우는 공장에서의 이상을 탐지, 에너지 소모 예측 공정을 분석하면서 어떻게 공정을 해야 되는지 효율성에 대해서 분석하는 것 등 아주 다양하게 머신러닝이 활용되고 있습니다.

국내외 머신러닝 개발 사례

국내외 머신러닝 개발 사례들에 대해서 알아보도록 하겠습니다. 구글 같은 경우는 무인자동차의 주변 환경을 인지하는데 있어서 활용하고 있고 스카이프는 영상 통화하게 되면 외국인이면 실시간으로 통역해서 그 사람이 어떤 말을 하는지 알려주고 페이스북은 음성인식, 얼굴인식 서비스를 통해서 해당 페이스북에 사진이 올라오면 자동으로 태깅을 해주는 것이 있고 네이버는 기계 번역이나 음성검색, 쇼핑 카테고리 자동 분류에 활용하고 있고 SK텔레콤은 개인화 서비스나 맞춤화 서비스에 이런 머신러닝을 적용하고 있습니다. 머신러닝의 잠재력은 이렇습니다. 인간의 학습 수준이 시간에 따라서 점진적으로 증가한다고 보면 머신러닝은 어느 시점에 가면 인간의 학습능력보다 더 높아질 수 있다고 얘기하고 있습니다. 그럼에도 불구하고 현재는 머신러닝 자체가 인간의 학습 수준보다 약간 떨어지는데 5년~10년 안에 이런 머신러닝이 굉장히 많은 데이터를 학습할 경우 인간의 학습능력을 따라잡아서 더 나아질 것이라고 모든 학자들이 얘기하고 있습니다. 결국은 잠재력이 있는 머신러닝을 우리가 어떤 형태로 어디에 활용하는 사람들의 몫이라고 볼 수 있겠습니다. 이상으로 머신러닝에 대해서 말씀드렸습니다.

산업별 빅데이터 활용 전망

산업별 빅데이터 활용 전망
산업별 빅데이터 활용 전망

빅데이터의 전망에 대해서 알아보도록 하겠습니다. 빅데이터 전망에서 2017년 데이터인데, 2017년에 대비해서 3년 후 2020년, 2021~2022년쯤에도 꾸준하게 해외시장에서 빅데이터는 계속 8~9% 정도 성장할 것으로 전망하고 있습니다. 국내 시장 같은 경우에는 전망이 더 밝아서 2020년에는 24. 9% 정도 더 성장할 것으로 예상하고 있고 4~5년 후에 해당하는 2021년~2022년쯤에는 26. 3% 정도 성장할 것으로 얘기하고 있습니다. 그렇다면 주로 공급기업과 수요기업 측면에서 볼 때 어떤 부분들이 유망종목이 되는지 볼 수 있습니다. 수요기업 측면, 빅데이터 기술을 통해서 서비스 수요측면에서 볼 때 IT나 물류 유통 쪽에 적용이 많을 것 같고 공급의 측면에서는 제조업이나 금융업 쪽에 수요가 유망하다고 볼 수 있고 그다음에 향후 유망 업무에는 과연 어떤 업무에 빅데이터가 적용되는 것이 좋은가, 유망하다고 보면, 수요기업에서 보면 고객관리, 모니터링 부분과 향후 브랜드나 트렌드를 예측하는 것도 수요기업에서는 많이 필요한 빅데이터의 활용 측면이라고 볼 수 있고, 공급업체에서 보면 향후 트렌드를 파악, 위험요소 예측, 실적 관리하는 측면에서 빅데이터를 많이 활용할 수 있다고 얘기하고 있습니다. 산업별 주요 기대 수요가 있습니다.

제조업에서 빅데이터 전망

제조업 같은 경우는 로그분석을 통해서 불량품을 예측, 생산량 증가 예측이 있고 리스크 감속을 위한 예측과 모니터링 센서·기기나 축적 정보를 통한 공정 최적화, 생산 스케줄을 수립하는 것이 있고, 금융 부분에 있어서는 데이터 기반 소비자 마케팅을 통해서 맞춤형 상품 추천 및 고객 이탈 방지 등에 쓸 수 있고 연체 고객이나 부도 여부에 대한 예측, 신용 리스크 관리, 보험사기를 예방하는 것이 있고 AI와 연계를 통해서 장세, 주식시장이 어떻게 될지, 어떻게 갈지 투자종목을 추천하는 부분도 쓰이게 될 수 있고 통신 부분은 콜센터나 챗봇 서비스 등에서 빅데이터 기반으로 추천하는 내용을 그것을 통해서 질문에 답을 해주는 것이 있겠습니다.

유통, 의료 분야에서 빅데이터 전망

유통이나 물류 쪽에서는 수출입 데이터를 통해서 화물의 운송량을 예측하고 어떤 사고가 있는지 사고 위험요인을 예측할 수 있고, 의료 부분에서는 질병 예측이나 의료비를 절감하고, 신약개발 및 시간 비용을 단축하는 데 쓰이고 119 취약 지역이 어느 곳인지를 통해서 구급차를 적재적소에 배치하고, 어느 부분에 있어서 어디에 배치하는 것이 가장 효율적이라는 것을 할 수 있고, 공공 부분에서는 고위험 가구를 예측 선별을 통해서 단수, 단전 등의 위기 예측이나 복지서비스를 제공하고 교통량을 측정, 교통사고의 원인을 파악하는 등 이런 것이 될 수 있고, 그다음에 기타, 데이터 분석 기반의 작물 생장, 계절상품 수확량 예측 등이 주로 기대수요가 되겠습니다. 빅데이터에서 키워드로 보고 있는 것이 뭐냐면 플랫폼이라는 용어입니다. 플랫폼이 뭐냐면 데이터를 쌓아 놓고 있어서, 데이터가 플랫폼 안에서 사람들이 데이터를 다운로드하거나 데이터를 통해서 분석하고, 분석을 통해서 유의미한, 의미 있는 결과를 도출하는 것이 되겠습니다. 그래서 특히나 우리나라는 바이오 부분, 소위 말하는 병원에서의 전자 의무 기록부들이 있는데 병원의 치료나 모든 것들에 대한 내용을 전자적, 디지털로 잘 관리하고 있습니다. 그런 부분들을 바이오 빅데이터 센터를 통해서 관리가 가능할 것 같고 보시면 국내 보건 의료 데이터 현황에서 볼 때 한국이 92% 정도 전자 의무 기록을 가지고 있습니다. 이것을 통해서 바이오 빅데이터 센서를 만들고 환자들이 어떤 약을 투여받았는지, 어떻게 나았는지, 며칠 만에 나았는지 이런 것들에 대한 전반적인 정보를 다 가지고 있을 수 있다고 볼 수 있어서 바이오 빅데이터 같은 경우는 우리나라가 향후 전체적으로 국가 경쟁력을 갖는 한 분야가 아닐까 하는 생각도 해봅니다. 그런 관점에서 보면 빅데이터 플랫폼으로 보는 것이 주로 사기업, 네이버의 DATA Lap, SKT의 BIG Data Hub, 공공에서 보시면 교통안전 연구원에서 교통에 관련한 데이터들을 공개한다든지, 그런 교통 관련한 데이터를 제공하고 있습니다.

빅데이터에서 플랫폼의 중요성

이런 빅데이터를 위해서는 플랫폼의 활용, 플랫폼의 구성, 플랫폼의 마련 등이 중요하다고 얘기하고 있습니다. 주요 키워드로 나오는 것이 뭐가 있냐면, MyData가 있습니다. MyData가 뭐냐면, 빅데이터라고 볼 때 가장 우려하는 것이 뭐냐면 데이터가 굉장히 많은 것 중에 내 데이터는 하나인데, 어떻게 보면 한명의 데이터인 것입니다. 빅데이터를 분석하는 것 자체가 의미 있게 가져오지만, 빅데이터 분석의 과실들이 빅데이터를 가지고 있는 기업, 포털의 형태가 되겠습니다. 그런 과실들을 기업에만 주지 말고 개인한테, 개인이 이로운 곳, 개인이 서비스받는 곳에 활용하자. 그런 것들이 MyData 관점입니다. 데이터양이 많긴 많지만 내 데이터, 내 의료에 관련한 데이터가 있다면 그 데이터를 다운로드하고 내가 이때까지 투자한 것에 대한 데이터가 있으면 그 데이터도 다운로드하여서 투자업체에 보내서 투자 포트폴리오가 괜찮은지 판별할 수 있는. 그래서 MyData 관점에서 개인의 정보보호를 해치지 않는 한에서 많은 서비스를 한다는 것 그것들이 MyData라는 관점에서 빅데이터 이후에 관심 있는 부분이 되겠습니다.

전쟁에서 되돌아온, 살아서 돌아온 비행기에 대한 오류

끝으로 Survivorship paradox라는, Survivorship에 대한 오류에 대한 얘기를 말씀드리고 빅데이터에 대한 내용을 마치도록 할 텐데 Survivorship은 전쟁에서 되돌아온, 살아서 돌아온 비행기에 대한 오류의 뜻입니다. 제2차 세계대전 때 돌아온 비행기를 분석을 시작했습니다. 무엇을 분석했냐면, 탄환을 맞아서 구멍이 뚫린 부분을 분석해서 '이 부분은 약한 부분이다. '라고 결론을 내린 것입니다. 그 부분을 보완하자, 이렇게 얘기했는데, 그것을 헝가리 수학자가 거기에 대해서 반박하기 시작했습니다. 무엇이냐면, 이미 총에 맞은 비행기가 critical 한 부분, 비행기가 더 이상 날 수 없는 부분에 총알을 맞았다면 그 비행기는 돌아오지 않았다는 것입니다. 총알을 맞아서 돌아왔다는 것은 그 부분은 오히려 보강할 필요가 없다는 것이다. 거기에 총알을 맞더라도 비행기는 괜찮다는 것이고, 돌아오지 못한 데이터, 돌아오지 못한 비행기를 분석해야 비로소 어느 부분이 약한지 알 수 있다는 얘기입니다. 왜 빅데이터에서 이런 얘기를 하냐면, 빅데이터 분석 자체가 기존에 있는 데이터, 내가 확보할 수 있는 데이터 관점에 머물러 있다 보면, 결국은 확보되지 못한 데이터의 귀중한 내용이 담겨있음에도 불구하고 그것을 분석하지 못하는 경우들이 있습니다. 그래서 데이터를 확보하는 것 실패한 사례를 가진 데이터라도 꼭 분석하는 데 있어서 굉장히 중요한 데이터가 될 수 있다는 것 그런 것을 염두에 두고 빅데이터에 대해서 접근하시면 좋을 것 같습니다.

빅데이터 실제 활용사례

빅데이터 실제 활용사례
빅데이터 실제 활용사례

빅데이터의 사례에 대해서 알아보도록 하겠습니다. 빅데이터 활용 사례는 다섯 가지 관점으로 우리가 볼 수 있습니다. 무언가를 예측하기 위해서 빅데이터를 분석하는 경우 거기에 숨겨진 사실이 있는지, 숨겨진 패턴이 있는지 발견하기 위해서 빅데이터를 분석하는 사례가 있고 어떤 위험도가 있는 활동을 하는데 위험도를 경감시키는 방향으로 활용하는 것도 있고 1:1 맞춤형 서비스, 어떤 사람이 개인의 맞춤형 서비스를 제공하기 위해서 빅데이터를 분석하는 사례가 있고 실시간으로 나오는 데이터를 분석해서 실시간으로 대응하려고 하는 것들이 빅데이터 분석을 하는 사례들 중에 목표, 내용이 될 수 있습니다. 그러면 하나하나 사례를 알아보도록 하겠습니다.

빅데이터 분석 사례 - 미국의 치안 및 범죄

첫 번째로 미국의 치안 및 범죄 예방입니다. 범죄 발생 지역이나 시각을 중심으로 과거의 범죄 발생이 많았던 시간, 지역, 요일을 봐서 범죄가 일어날 것 같은 시각과 지역을 예측하는 것입니다. 그렇게 되면 그 지역에 순찰을 더 자주 돌거나 하겠습니다. 그래서 과거 범죄나 범죄 기록, 범죄 패턴을 분석해서 후속 범죄 발생 지역 및 시각을 예측하고, 약 71% 정확도를 갖는다고 합니다. 그리고 미국의 FBI의 유전자 색인 시스템을 활용한 단시간 범인 검거 체계인데 1시간 이내에 범인 DNA 분석을 위해서 주 정부 데이터 연계 및 빅데이터 실시간 분석 솔루션을 통해 범죄 사건을 해결합니다. 내장된 DNA 분석정보를 활용하여 07년에 45,500건의 범인이 DNA에 적중한 적이 있습니다. 미국 같은 경우는 치안과 범죄 예방, 예측, 실시간 대응 측면에서 활용한 예로 볼 수 있습니다. 미국의 국세청 같은 경우는 다양한 데이터를 분석해서 탈세, 사기 범죄를 예방하는 시스템을 구축했습니다. 보시면 정부 기관의 사기 방지 솔루션을 했는데 방대한 과거 재료로부터 사기를 했거나 사기를 한 것을 보고 방대한 자료를 봐서 사기가 일어날 징후가 있다, 어떠한 형태의 것이 있다는 것을 찾아내고, 과거의 행동 정보를 분석해서 사기의 패턴과 유사한 행동이 있다면 그 사람을 유심하게 더 보는, 정밀하게 보는 것이 진행됐고, 또는 소셜 네트워크 분석을 통해서 페이스북이나 트위터의 범죄자들의 소셜 네트워크를 분석해서 범죄자 집단에 대한 감시 시스템을 마련한 것이 있겠습니다. 탈세 및 정부 사기 방지 시스템을 통해서 연간 3,450억 달러에 달하는 세금 누락 및 불필요한 세금 환급을 절감했다고 볼 수 있습니다.

빅데이터 분석 사례 - 밀라노의 지능형 교통정보 시스템

다른 분야는 뭐냐면 밀라노의 지능형 교통정보 시스템입니다. 우리나라의 서울 같은 경우도 부엉이 버스를 도입하면서 심야 시간에 사람들이 어디서부터 어디까지 이동했는지 기지국 측면에서 스마트폰이나 모바일폰의 기지국에서 사람이 얼마나 있다가 얼마나 이동했는지를 중심으로 노선을 짜는 데 활용했습니다. 이탈리아 밀라노 같은 경우도 지능형 교통형 시스템이라고 해서 시내 교통상황을 고려해서 최적의 교통안내 서비스를 제공하는데, 일정 기간 동안의 교통량, 속도, 기후 조건 등의 데이터를 종합 분석하게 되고, 실시간 교통흐름을 바탕으로 신속 정확한 내비게이션 서비스를 하게 되는 것이 되겠습니다. 이것은 빅데이터 사례 중 예측의 예라고 보실 수 있겠습니다.

빅데이터 분석 사례 - 리츠칼튼 호텔

리츠칼튼 호텔 같은 경우에는 이미 투숙한 고객의 특성을 관찰해서 데이터화 하고, 이를 종합 분석해서 친절 서비스를 제공하는데 전 세계 100만 명의 고객 정보 DB를 공유하고 있습니다. 그래서 해당 고객이 종합예약 시스템을 통해서 자동 예약하게 되면 예약 기록을 통해서 고객이 도착했음을 알려주고 고객의 성향, 특성을 파악해서 고객의 코디네이터를 배정하고 고객의 인지나 개인적 취향이 기록된 것을 토대로 해서 호텔 직원이 개별적으로 서비스하게 되는 것이 되겠습니다. 그래서 채식주의자이기 때문에 채식 서비스를 해줘야 한다. 이런 것들이 있을 수 있고 개인 맞춤형 서비스를 고객이 미리 얘기하지 않아도 실시간으로 대응하는 부분이 빅데이터를 활용한 것이 되겠습니다.

빅데이터 분석 사례 - 캐나다 온타리오 공과 병원

캐나다 온타리오 공과 병원에서는 미숙아를 모니터링하기 위해서 빅데이터를 활용하고 있습니다. 환자당 일 9,000만 건 이상의 생리학 데이터 스트림을 실시간으로 분석하는 것입니다. 어떤 형태로 문제점이 발견되면 의료진이 24시간 전에, 감염되어 갑자기 열이 오른다거나 그런 데이터들을 쭉 보게 되면 또는 감염의 징후가 미리 나오는 것이 있으면 24시간 전에 감염 사실을 밝혀내고 더 악화하기 전에 치료를 시작하는 것입니다. 그래서 미숙아 같은 경우는 인큐베이터에 있기 때문에 상대적으로 생체정보 자체를 잘 기록할 수 있습니다. 그런 데이터를 잘 관리해서 실시간으로 대응하는 것이 있습니다.

빅데이터 분석 사례 - 할리우드 흥행 수익 예측

SNS를 통해서 할리우드 흥행 수익을 예측하기도 합니다. 칼슨은 트위터를 통해서 분석합니다. 트위터에 얼마나 리트윗이 됐고 사람들이 어느 정도 관심을 보이는지, 그래서 거기에 대한 예측 모형을 만들고 트위터를 통해 분석한 트와일라잇이라는 영화는 흥행실적으로 약 1억 4,000만 달러를 예상했는데 실제로는 1억 3,850만 달러로 매우 근접했다고 볼 수 있습니다. 그리고 2010년 리메이크된 나이트메어 경우에는 트위터에 부정적 반응이 있었습니다. 그래서 그런 부분 때문에 유료 관객이 50% 감소했습니다. 그래서 트위터를 통해서, SNS를 통해서 흥행 수익이 어느 정도 될 것인지 예측하는 이런 사례도 있겠습니다.

빅데이터 분석 사례 - 화장품 분석

맞춤형 서비스'화해'라고 있는데, 제1회 공공데이터 창업경진대회에서 최우수상을 받은 것이 되겠습니다. 뭐냐면 화장품에 있는 전 성분 분석을 통해서 안전도 피부 타입 별 성분, 기능성 성분 등을 통해서 화장품 종합 성분 정보를 제공하고 그것을 통해서 내 피부 타입에 맞는 것들, 맞지 않는 것들을 추천받거나 분석할 수 있고 볼 수 있도록 하게 만든 것이 화해가 되겠습니다. 그래서 개인용으로 맞춤형 서비스를 통해서 화장품에 대한 전체적인 데이터를 다 저장하고 분석한 예가 되겠습니다.

빅데이터 분석 사례 - 티버즈

다음 사례는 '티버즈'라는 회사의 사례인데 페이스북에 빼빼로데이에 대한 남녀의 오피니언 차이를 Text 분석을 한 것입니다. 남자는 빼빼로데이 하면 만족하고 기쁨을 나타내는 남성을 볼 수 있고, 여성도 마찬가지로 기쁨이 있지만 상대적으로 불만이 있는 것이 오피니언 측면에서 분석해 본 것이 있습니다. 빼빼로데이에 대해서 숨은 사실, 숨은 오피니언에 대해서 남녀 차이를 분석해 보는 것이 있었습니다. 아마존 같은 경우는 매출의 30%가 similarity 기반 추천의 결과라고 합니다. similarity가 뭐냐면, '이 사람이 이 책을 샀는데 다른 사람도 이 책을 또 샀습니다. ' 이렇게 추천하는 것입니다. Customers Who Bought This Item Also Bought가 되겠습니다. 이것을 산 사람이 이 책도 또 샀다고 추천해 주는데, 이것을 통해서 30% 이상 그 책을 사게 됐다고 합니다. 이것도 맞춤형 서비스에 해당한다고 볼 수 있는데 그래서 데이터 분석을 통해서 어떤 사람이 어떤 것을 샀고, 이런 추천 시스템을 통해서 우리가 개인화된 어떤 서비스를 진행할 수 있을 것 같습니다. 이상으로 빅데이터 분석 사례에 대해서 말씀드렸습니다.

빅데이터 출현 배경과 특성 정리

빅데이터 출현 배경과 특성 정리
빅데이터 출현 배경과 특성 정리

빅데이터에 대해서 말씀드리도록 하겠습니다. 빅데이터의 개요부터 분석 방법, 활용 사례, 전망에 대해서 알아보도록 하겠습니다. 빅데이터의 개요입니다. 빅데이터란 용어가 굉장히 요새는 많이 쓰이고 있습니다. 최근에 와서 빅데이터 용어들이 여러 방면에 활용되고 있고 쓰이고 있는데 원래 빅데이터란 무엇인지 한번 알아보도록 하겠습니다. 디지털 환경의 발달로 사람들이 하루에 쏟아내는 천문학적인 양의 데이터들이 있습니다. 스마트폰이 보급되면서 사람들이 많은 정보를 양산, 생산하게 됐습니다. 생산된 데이터양이 2조 기가바이트가 됐고, 생성 주기가 짧고 광범위하고 형태가 다양해서 디지털화된 방대한 양의 정보를 빅데이터라고 부릅니다. 기업에서는 이미 이전부터 소셜 네트워크뿐만 아니라 GPS 기반의 지도정보, 날씨 정보 등 이런 다양한 정보들을 중요한 데이터, 원래 기업이 관리한 데이터 외에 중요한 데이터가 하나 더 있다는 관점에서 빅데이터라는 이름으로 재정의하게 됐습니다. 그러면 빅데이터 시대는 어떤 것이냐면 개인화된 서비스와 소셜미디어의 확산 때문에 기본적으로 인터넷 서비스 환경이 재구성되게 돼 있습니다. 세계 디지털 데이터양이 제타 바이트 수준까지 가고 있고, 2년마다 두 배씩 증가하고 있습니다. 2020년에는 약 40 제타 바이트가 될 것이라고 예측하고 스마트폰의 보급 때문에 데이터가 매우 빠르게 축적되고 그것을 통해서 스마트한 시대를 열어갈 것이라고 얘기합니다. 기존에 있던 데이터 규모가 엑사 바이트에서 제타 바이트로 급격하게 바뀌고 있고 데이터의 유형도 정형 데이터가 많았다면 사물인터넷을 통해서 사물이나 정보나 인지 정보들이 들어가는 형태로 스마트 시대가 열리고 있고 데이터 특성도 구조화된 것으로 시작해서 현실성과 실시간성을 갖게 되는 정보로 바뀌고 있습니다. 결국은 정보 자체가 스마트폰이라는 개인들이 PC를 들고 다니면서 많은 정보가 양산됐고 그거 자체가 다양한 형태로 엮여 있는 것을 빅데이터라고 볼 수 있겠습니다.

빅데이터가 왜 출현하게 됐을까요?

빅데이터의 출현 배경은 크게 두 가지로 볼 수 있겠습니다. 첫 번째로는 데이터가 실제로 증가한 것입니다. PC나 인터넷 보급이 많아지고 모바일 기기나 스마트폰의 이용이 많아지면서 많은 정보가 나오게 됐습니다. 인터넷 뱅킹, 온라인 쇼핑, 유튜브, SNS 등에 대한 많은 데이터가 쌓이게 됐고 영상정보라고 하는 교통이나 방범 CCTV의 정보들도 많이 쌓이게 됐고 공공데이터의 개방 측면에서도 공공에 있던 데이터들도 일반인이 사용할 수 있을 정도로 많이 개방이 됐다고 볼 수 있겠습니다. 그런 하나의 축이 있다면 다른 하나의 축은 처리 기술이 발전됐다고 볼 수 있습니다. 기존에 대량의 데이터를 분석하고 빠른 시간 내에 결과를 내는 것들이 필요했는데 필요한 내용들이 기술적인 발전을 통해서 실제로 컴퓨팅 파워가 증가됐다고 볼 수 있겠습니다. 그래서 스마트폰이 도래하게 되고 스마트폰과 기술의 결합을 통해서 데이터를 분석할 수 있는 환경이 된 것입니다.

빅데이터의 특성

빅데이터의 특성이 뭐냐고 할 때 3V 또는 4V, 5V 이렇게 V로 얘기합니다. 3V 안에 들어가는 것이 규모에 해당되는 것이 있고, 속도 velocity, 다양성이라고 하는 variety가 있습니다. 3V는 규모에 해당하는 Volume, velocity, variety이 있고, 거기에 하나 더 붙여서 정확하게 나와야 한다는 의미에서 정확성 측면 가치를 줘야 한다는 value의 가치 측면, 정확성의 veracity 측면 등이 3V, 4V 이런 식으로 얘기하고 있습니다. 그러면 크기 Volume은 어떤 것에 해당하게 될까요. 일반적으로 수십 테라바이트(terabyte) 혹은 수십 페타 바이트(petabyte) 이상의 빅데이터가 그 범위에 해당하고 그것 이상은 제타 바이트로 얘기하는데 1페타 바이트는 어떤 크기냐면, 6GB DVD 영화를 17만 4천 편을 담을 수 있는 용량입니다. 거대한 용량입니다. 그런 용량의 크기들, 많은 크기가 쌓인 것들을 분석해야 되는 것이 되겠습니다. 기존에 크기 측면에서 볼 때 우리가 한 가지 알아야 할 것이 있는데 빅데이터 분석을 하면서 하둡이라든지 하드웨어적인 요소를 많이 얘기합니다. 빅데이터가 크기가 크다 보니 기존의 데이터 웨어하우스나 데이터 스토어, 데이터 웨어하우징 측면에서 데이터를 저장하는데 어느 한 공간에 저장하기는 어렵습니다. 그렇기 때문에 다양한 곳에 흩어진 데이터들을 마치 하나의 데이터처럼 보일 수 있게 만들어 주는 것들이 중요합니다. 분산된 데이터들을 하나의 데이터로 볼 수 있게 하는 것이 필요한데 그것을 분산 컴퓨팅이라고 하고 그런 분산 컴퓨팅이 필요하다. 그 정도 크기다 이렇게 볼 수 있겠습니다. 분산 컴퓨팅 설루션에는 구글의 GFS, 아파치의 하둡 등이 있겠습니다. 빅데이터의 특성 중 속도 측면은 실시간 처리와 장기적인 접근으로 나눌 수 있는데 오늘날 디지털 데이터들은 빠른 속도로 생성됩니다. 데이터의 수집, 저장, 분석 등이 실시간으로 되어야 하고 하지만 실시간으로 처리하는 것이 다는 아니라는 것입니다. 수집된 대량의 데이터를 다양한 분석 방법과 표현 기술로 분석해야 하는데, 이것은 장기적이고 전략적인 차원에서 접근할 필요가 있는 것입니다. 속도가 빠르게 쌓이고 있는 데이터에 대해서 실시간으로 대응해야 하는 측면도 있지만 쌓인 데이터들을 창의적인 관점, 새로운 관점으로 해석할 필요가 있다는 것이 되겠습니다. 다양성 측면에서는 데이터는 정형화된 정도에 따라서 정형 데이터, 반정형 데이터, 비정형 데이터라고 볼 수 있는데, 정형 데이터는 한정된 필드가 있는 것입니다. 주민등록번호, 주민번호라고 하는 필드가 있으면 한정된 필드가 정형화되어 있는 것입니다. 반정형 데이터는 고정된 필드를 사용하지 않고 XML이나 HTML같이 메타데이터나 스키마를 포함하는 반정형 데이터라 하고, 비정형 데이터는 고정된 필드로 저장하지 않고 사진이나 동영상과 같이 다양한 형태로 데이터들이 쌓이게 되는 것들이 빅데이터의 특성 중에 다양성이라고 볼 수 있겠습니다.

기존의 데이터 관점과 빅데이터의 관점 비교

기존의 데이터 관점과 빅데이터의 관점에 대한 비교입니다. 데이터 원천은 정보시스템, 정보서비스라고 볼 수 있고, 빅데이터는 일상화된 정보서비스가 되겠습니다. 전통적 데이터들의 목적은 업무의 효율화가 되고, 빅데이터는 사회적 소통과 자기표현, 사회 기반 서비스가 빅데이터로 활용하게 되고, 그렇다면 전통 데이터의 주체는 정부나 기업 등의 조직이었다면 빅데이터는 개인이나 시스템 등의 개인적인 측면이 되겠습니다. 데이터 유형 측면도 전통적 데이터는 정형 데이터들이 주로 많았고 빅데이터는 비정형 데이터, 공개 데이터 일부, 조직 외부 데이터들을 일부 활용할 수 있습니다. 데이터 특징으로는 신뢰성이 아주 높은 핵심 데이터가 정통 데이터였다면 빅데이터는 기하급수적으로 증가하면서 쓰레기 데이터도 많이 있고 문맥이나 다양한 데이터들에 대한 분석도 필요하다고 합니다. 데이터의 보유 측면은 주로 정부나 기업이 보유하고 있다면 이제는 인터넷 서비스 업체나 포털, 이동통신 업체, 디바이스 생산 업체들이 가지고 있다고 볼 수 있습니다. 데이터를 다운로드하거나 분석할 수 있는 틀에 대한 데이터 플랫폼 같은 경우는 정형 데이터를 생산, 저장, 분석, 처리할 수 있는 정통적인 플랫폼이 있었다면 빅데이터는 비정형 데이터들을 생산, 저장, 분석, 처리할 수 있는 새로운 플랫폼이 필요하다고 얘기하고 있습니다. 이상으로 빅데이터의 개요에 대해서 말씀드렸습니다.

빅데이터 분석 방법과 종류

빅데이터 분석 방법과 종류
빅데이터 분석 방법과 종류

빅데이터의 분석 측면에서 빅데이터를 어떻게 분석할 것이냐에 대해서 한 번 알아보도록 하겠습니다. 빅데이터를 분석하는 관점은 크게 두 가지가 있습니다. 첫 번째는 비즈니스 분석 관점입니다. 현재의 현상과 결과적인 관점을 제시하는데 초점을 두는 현재 현상이 어떻게 됐고 그것이 어떻게 반영되고 있는지 그런 비즈니스 분석 관점이 있고, 고급 분석 관점은 대용량의 데이터로부터 이때까지 알려지지 않았던 몰랐던 그런 숨겨진 패턴을 발견하고, 상황 자체를 미래를 예측할 수 있는 것이 될 수 있고 의미 있는 데이터의 패턴을 식별하는 것입니다. 숨겨진 패턴이 있되 그것이 의미가 있어야 하는 것입니다. 미래의 품질 수준이 어떻게 될지, 어떤 형태로 되면 어떤 용도로 올라갈 수 있을지 예측할 수 있는 모델에 근거해서 예측하게 된다는 것입니다. 비즈니스 분석 부분에 있어서는 현재나 과거 실적을 분석한다면 그걸 통해서 미래를 어떻게 해야 되는지 이런 부분들이 고급 분석 쪽에 속한다고 볼 수가 있겠습니다.

빅데이터를 분석 과정

빅데이터를 분석하는 데 있어서 어떤 과정을 겪게 될까요. 첫 번째는 데이터를 수집하는 단계가 있습니다. 내부정보, 외부정보에서 우리가 원하는 데이터를 수집합니다. 그래야 분석 대상이 되기 때문에, 그런데 여기서 중요한 것은 뭐냐면 외부 데이터도 분석의 대상이 된다는 것입니다. 내부 데이터만 분석 대상이 되는 것이 아니라 그것을 서로 연관 관계해서 외부 데이터 부분도 분석할 수 있고 데이터 저장관리를 해야 합니다. 데이터를 모은 다음 그중에서 유효한 데이터가 뭐가 있는지 그 데이터를 어떻게 분산된 데이터를 하나로 볼 것인지, 분산된 데이터를 어떻게 관리할 것인지가 되고 그것을 통해서 우리가 데이터 분석을 하게 됩니다. 키워드를 추출한다든지 키워드에 대한 통계를 낸다든지 데이터가 어떻게 그룹으로 되어있는지 군집 분석을 한다든지 이런 것들이 되고 그런 분석이 끝나면 분석을 통해서 나온 결과를 활용하는 단계가 되겠습니다. 보시면 데이터 수집 단계에서는 Web Crawler라고 하는 tool을 사용하게 되고, 데이터를 저장하는 데 있어서 하둡이 쓰이게 되고 데이터를 분석하는 데는 Text Mining, Natural language processing(NLP, 자연어 처리 부분), Real time analysis 등의 방법들을 쓰게 되고 결과를 제시하는 데는 통계적인 방법, 데이터 시각화라고 하는 시각화 해서 도표로 나타나는 방법이 쓰이고 있습니다.

빅데이터의 분석방법 - 텍스트 마이닝

빅데이터의 분석방법에는 대표적인 것으로 무엇이 있을까요. 첫 번째로는 텍스트 마이닝(Text mining)이 있습니다. 정형화된 데이터를 분석하는데 데이터 마이닝과 비슷한 기법인데 이것이 언어라는 것입니다. 자연어 처리 기술을 바탕으로 해서 비정형 텍스트 데이터로부터 가치와 의미를 찾아내는 기술입니다. 텍스트가 가진 카테고리를 알 수 있고, Opinion Mining이라고 하는 평판 분석이 있습니다. SNS, 블로그, 게시판 등에 있어서 인터넷상의 모든 웹 문서나 의견을 분석해서 그에 맞는 제품이나 서비스에 대한 평판을 추출해 내는 평판 분석이 있습니다. 소셜 네트워크 분석이라고 하는 개인 또는 그룹의 네트워크 영향력이나 관심사, 성향의 패턴을 분석하고 추출해 내는 소셜 네트워크 분석이 있고 클러스터 분석, 비슷한 특성을 가진 개체를 합쳐 나가면서 최종적으로 유사한 그룹을 만들고 그것을 나눠보고 할 수 있는 유사한 그룹을 발굴하거나 관심사나 취미에 따른 사용자 그룹을 군집을 통해 분류하는 것입니다. 여러 개의 집단으로 차이를 보이는 집단을 분석해 내는 것을 클러스터 분석이라고 볼 수 있겠습니다. 텍스트 마이닝에 대해서 알아보도록 하겠습니다. 텍스트 문서가 있다고 하면 텍스트 문서는 거기에 명사도 있고, 접속사 등 여러 가지 내용이 있습니다. 텍스트 문서가 있고, 특수문자가 있어서 텍스트 전처리를 통해서 그중에 명사, 단어들을 뽑아내는 부분이 있고 거기에 대해서 의미 정보로 변환할 수 있습니다. 긍정적, 부정적이라는 의미 정보로 변환할 수 있고, 그것으로부터 의미 정보를 추출하게 되고, 패턴이나 경향을 분석하게 됩니다. 그것을 통해서 정보를 표현하고 평가하는 단계가 되겠습니다. 텍스트 데이터가 있으면 텍스트 데이터 전처리를 통해서 또는 그 단어가 가지는 의미에 대해서 Semantic을 넣기도 합니다. 그것을 텍스트 마이닝이라고 할 수 있겠습니다. 어떤 문서가 있으면 가장 많은 키워드가 어떤 것이고 몇 회 정도 나왔고 최고로 많이 나온 단어가 무엇이고 그것들이 어떤 형태로 서로 엮어있는지 이런 것들도 보여줄 수 있는 것이 되겠습니다.

빅데이터의 분석방법 - 오피니언 마이닝

오피니언 마이닝은 간단하게 설명드릴 수 있겠습니다. 모든 제품 상품평을 읽기가 힘들다 그러니까 내가 사고 싶은 상품 두 개가 있는데 그 두 개의 긍정, 부정이 어떻게 되는지 한번 보겠다. 그렇게 볼 수 있겠습니다. 오피니언 마이닝을 하면 내가 사고 싶은 디지털카메라가 두 가지 있는데 한 가지는 긍정이 209, 부정이 89개, 다른 한 가지는 긍정이 146, 부정이 32. 그래서 어떤 부분에 대한 긍정이 많은지 부정이 많은지에 있어서 서로 비교할 수 있는 것들이 오피니언 마이닝에 속한다고 볼 수 있겠습니다.

빅데이터의 분석방법 - 감성 분석

감성 분석이 있습니다. 감성 분석은 오피니언 마이닝의 또 다른 형태인데, Sentiment analysis라고도 부릅니다. 뭐냐면, 주어진 문서가 오피니언 자체를 추출하려면 그것이 긍정적인지 부정적인지 알아야 합니다. 그것에 따라서 어떤 것들이 있냐면, DS Lap에서 만든 감성 분석을 서울대 심리학과에서 만든 감성 수치 사전이 있습니다. 그것을 통해서 6가지 감성으로 확장되는 것입니다. 단어에 대한 감성 틀이 있으면 형태소 분석 결과를 프로그램을 통해서 어떤 감정이라는 것을 알 수 있는 것입니다. 감성 분석의 예로는 매드 맥스라는 영화 재미있었지? 그러면 긍정은 2. 287, 부정은 0, happiness는 2. 833 이런 식으로 해서 그 내용 자체에 대한 긍정, 부정의 내용, 거기에 대한 감정이 어떤 것들이 들어가 있는지 이렇게 얘기할 수 있겠습니다.

빅데이터의 분석방법 - 소셜 네트워크

소셜 네트워크 분석인데, 망에 대한 분석입니다. 사람들이 연결되어있는데, 그 연결들이 어떻게 되어있는지. 예를 들어 페이스북에 친구가 돼 있는 데 친구이고 얼마나 빈도로 서로 맨션을 하고 언급하고 서로 상호 작용을 하는지 네트워크 형태로 나타내는 것입니다. 그렇게 되면 여러 가지 선과 점으로 연결된 네트워크 분석이 일어나게 되는데 크게는 네 가지의 목적을 위해서 소셜 네트워크 분석을 하고 있습니다. 어떤 점이라고 하는 사람이 어떤 영향력이 있는지, 중앙에 있어서 어떤 영향을 갖는지 그 사람하고 관계가 어떻게 되는지 관계 경로를 분석하고, 서로 떨어져 있는 형태로 군집들처럼 마치 네트워크가 형성되면 그 커뮤니티가 몇 개가 존재하는지에 대한 파악, 키맨들이 몇 개 있고, 키맨을 중심으로 커뮤니티가 어떻게 형성되었는지 파악할 수 있고, 그다음에 왜 그렇게 뭉쳐있는지 사회적인 어떤 역할을 하고 있는지에 대해 그게 뭉쳐지게 된 요소가 어떤 것 때문에 뭉쳐있는지에 대해 분석하는 그런 것들이 소셜 네트워크의 분석 예라고 볼 수 있겠습니다.

빅데이터의 분석방법 - 군집분석

군집 분석은 뭐냐면, 군집이라는 것은 일종의 원소들 어떤 형태를 가진 것들이 서로 비슷한 것들이 모여있는 것을 군집이라고 합니다. 군집 분석이란 어떤 목표가 있는 것이 아니라 서로 차이가 있는 것을 집단으로 나눠주는 것, 그것이 군집 분석입니다. 군집 분석을 왜 하게 될까요? 몇 개의 집단으로 나누어져 있는지, 그 집단을 우리가 해석하는 그런 관점에서 군집 분석을 하게 되고 군집이 왜 이렇게 분류할 수 있는지 역으로 계산해서 군집할 기준이라든지 어떤 변수들로 활용할 수 있는 형태로 쓰이기도 합니다. 이상으로 빅데이터에서 활용되는 여러 가지 분석방법에 대해서 알아봤습니다.

+ Recent posts