갈루아의 반서재

빅데이터 비즈니스
국내도서>경제경영
저자 : 스즈키 료스케 / 천재정역
출판 : 도서출판더숲 2012.03.13
상세보기



chromebook foto test
chromebook foto test by zoinno 저작자 표시동일조건 변경허락



제2장 빅 데이터 비즈니스의 효용과 그 활용의 예



클라우드가 늘어나면 정보는 저절로 축적된다


네트워크 너머에 있는 클라우드의 효용을 단말기로 불러내 이용한다

하강의 관점에서 보면, 데이터의 이용과 열람이 편리해진다.

↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓

하지만 앞으로는 데이터의 상승이 중요해진다. 

- 유저의 동향정보도, '세만틱~'도 '상승'의 관점이 중요

- 디바이스와 그 디바이스가 수집하는 데이터의 관련성이 높기 때문에 PC와 휴대전화만으로는 얻을 수 없는 데이터도 많다.

- 단말기는 열람을 위한 것이지만 고유의 정보를 '끌어올리는' 데도 도움이 된다. 그 결과 클라우드에는 막대한 정보가 축적된다

- 예) Amazon Popular Highlights




데이터 활용에 따른 효용과 다섯 가지 사례


1. 데이터 활용의 유형과 단계 (로버트 다벤포트)

- 데이터는 사장시켜두는 데도 비용이 든다. 

- 더 깊게 분석할수록 더 높은 경쟁 우위성을 얻을 수 있다.

(1) 정례, 임시보고

(2) 조사(원인 지정)

(3) 경고(대책 제시)

(4) 통계분석

(5) 예측, 추계

(6) 예측 모델

(7) 최적화


2. 데이터 활용 단계에 대한 기존의 논의 정리


미래에
관한
사항

 

 Ⅲ. 어떻게 될 것 같은가?

   Ⅳ. 어떻게 하면 좋은가?
   (4) 통계분석

 

 
   (5) 예측, 추계  →  (7) 최적화
   (6) 예측 모델  ↖  

과거에

관한

사항

   Ⅰ. 어땠는가?

 

 Ⅱ. 왜 그랬는가?
   (1) 정례, 임시보고  →  
 

 (2) 조사 (원인 지정)

       (3)  경고

 

 

 사실

 

해석 

출처 : 『분석력을 무기로 하는 기업』 (토마스 H 다벤포트, 2008) 및 『Data Computing Appliance』(CALIKU, Emin, 2011)를 근거로 노무라총합연구소에서 작성


3. 사례

1) 사례1. 신제품 개발 관련

이노베이션의 딜레마 - 제조사는 편리한 기능이라고 생각해서 구비한 기능이 소비자에게는 전혀 소용이 없거나 과잉성능이라는 것이 밝혀지기도 했다


구글 GOOG-411 - 각 국의 전화번호 서비스에 해당되는 것으로, 안내를 오퍼레이터가 아닌 기계가 하고 있다. 구글은 이 서비스로 전화번호를 물어온 사람들의 목소리 데이터를 모아 음성인식 알고리즘의 품질 향상을 꾀했다. 돈이 아니라 알고리즘을 강화시키기 위한 트레이닝 데이터 수집이 목적이었던 것이다. 구글은 이를 통해 수집한 음성인식 알고리즘을 스마트폰 음성인식 인터페이스에 적용시켜 그들이 장점으로 내세우는 광고형 비지니스 모델로 귀착시켰다.


2) 사례 2. 마케팅 관련 사례

 POS(Point of Sales) 에서 POU(Point of Use) 로 (게이오기주쿠대학의 고쿠료 교수)


Amazon - Amazon Popular Highlights

넷플릭스 - 넷플릭스 프라이즈, 추천엔진 - 대량의 데이터를 보유하고 있는 사업자가 데이터에서 인사이트를 도출하거나 예측 알고리즘을 도출한 사례

Kaggle - 데이터 예측 콘테스트, 주최자가 제시하는 데이터를 근거로 법칙성을 발견하는 경쟁을 벌인다.


http://www.kaggle.com/

We’re making data science a sport.


3) 사례 3. 고객지원 사례

시미즈 건설 - 건축물에 대한 구조성능평가 모니터링

한국건강보험심사평가원 - 의약품 피해 대응


4) 사례 4. 준법 감시, 부정 방지 관련 사례

VISA - VISA Advanced Authorization (고속부정거래 감지 시스템)

이스즈 - 고속운행정보시스템 미마모리쿤


5) 사례 5. 업무 기반과 사회 인프라 관련 사례

NTT - 모바일 공간 통계

IBM - 스마트 OO (Smart Grid, Smart Irrigation)





실시간성과 피드백 대상에 따른 효용의 정리와 해석


1. 피드백 대상과 실시간성

1) 피드백 대상 - 개별피드백과 계열 전체를 대상으로 하는 피드백

2) 실시간성이라는 관점 - Stock(과거의 축적)형과 Flow(실시간)형


2. 데이터 활용 방식의 변천

빅 데이터 활용에 주목해야 하는 이유는 '개별적이고 즉각적이며 다면적인 검토를 거친 부가가치를 제공하고 싶다'는 이용사업자의 요구를 충족시키기 위해서이다. 따라서 세 가지 요소인 빈도, 생성, 다양성이 중시되고 있는 가운데 데이터의 용량이 빅이 되는 것은 어찌보면 당연한 일이다. 

전체 피드백×스토크형의 중요성이 낮아진 것은 아니나, 개별피드백×플로형의 사례나 요구가 증가하고 있는 것은 분명하다. 이러한 요구가 최근에 생겨난 것은 아니고 그 동안은 수집이나 기술적 분석이 어려웠을 뿐이다. 그리고 기존의 전체 피드백×스토크형으로 데이터를 활용하고 있는 경우에도 기술적 향상으로 인해 정책의 수준을 높여가는 경우도 종종 있다.



빅데이터 활용을 촉진하는 서비스 모델과 비지니스 모델

데이터 취득시 유저에게 부담을 주어서는 안된다. 이를 위해서 필요한 4가지 힌트


1. 통신의 은폐 

통신비는 자기 부담입니다라고 하는 것보다 비용이 발생하지 않는 편이 소비자를 더 많이 수용할 수 있다(닌텐도의 이와다 사장, 2009년 10월 경영방침 설명회)


2. 제로 클릭 서비스

 Eye-Fi 와 같은 기능을 말하는 것으로, 아이파이는 와이파이 접속 기능을 구비한 외부기억매체(SSD)로 무선 LAN  영역권 안에만 있으면 촬영한 사진을 온라인 포토앨범 등에 자동으로 업로드해준다. 이처럼 클라우드 상에 다양한 데이터가 대량으로 수집, 축적되기 위해서는 PC나 휴대전화 뿐만 아니라 다양한 기기가 네트워크를 통해 클라우드와 접속가능한 상태가 되어야 한다. 왜냐하면 특정 기기와 그 기기가 취급하는 데이터 사이에는 높은 연관성이 있기 때문이다. 다양한 데이터를 얻으려면 PC나 휴대전화와 같은 범용기기만으로는 충분하지가 않다. 


Less Hassle. More Play.

http://www.eye.fi

※ 정보 감소의 부담과 동시에 나타난 정보 발신의 증대


3. 속도에 의한 중독

1) 속도가 수익을 좌우한다

(1) 속도가 수익을 좌우한다


 10개의 검색결과 제시

 →

30개의 검색결과 제시 

 0.4초

0.5초 증가 

0.9초 

 

트래픽/수익 20% 감소 

 

- 100밀리초 단위로 페이지를 지연시키는 A/B 테스트로 아주 작은 지연조차 수입에 큰 영향을 미친다는 것이 밝혀짐


구글 검색 총괄 담당 부사장 Marissa Ann Mayer 의 말대로 유저는 속도에 민감하게 반응한다. 메이어에 따르면 구글맵에서 웹페이지를 100KB에서 70~80KB 로 줄었더니 그 다음주에 트래픽이 10%, 그 후 3주 동안 25%가 늘어났다고 한다.


(2) 구글 인스턴트 검색

구글이 입력중인 검색어에 대한 결과를 바로 찾아주는 검색 기능을 선보였다. 

 

구글 검색 시연장에서 발표된 '검색 소요 시간 구성표'


'인스턴트 검색'은 사용자가 검색어를 입력중에도 우선순위가 높은 낱말을 실제로 검색한 것처럼 즉시 보여주는 기능이다. 마리사 메이어 구글 검색 총괄 담당 부사장은 "매 검색어를 입력할 때마다 24초가 걸린다"며 "인스턴트 검색 기능을 통해 사람들이 검색에 사용하는 시간을 2~5초씩 줄일 수 있다"고 말했다. 이는 전세계 구글 사용자 시간 합치면 35억초를 아끼는 셈이라고 덧붙였다. 검색 속도를 높인 게 아니라 검색 과정에 걸리는 시간을 줄여 더 빠른 검색을 할 수 있게 해준다. 


보통 키를 하나 누른 다음에 다른 키를 누를 때까지 걸리는 시간은 300밀리초이지만 페이지의 다른 부분으로 시선으로 옮기는데 걸리는 시간은 1/10의 인 30밀리초이다. 즉, 사람은 문자를 입력하면서 검색 결과를 읽을 수 있다.


(3) 구글의 독자 브라우저 '크롬'의 개발


- 스피디 SPDY 를 통한 웹사이트를 볼 때 전송되는 데이터의 규격 개선(크롬 브라우저에서만 이용 가능)

* SPDY 관련 자료 → http://www.slideshare.net/oddpoet/spdy-13231459


- 구글 퍼블릭 DNS

- 페이지 스피드 서비스


2) 기기의 조작감 향상이 취득 가능한 데이터의 해상도를 높인다

토르네(Torne) - 플레이스테이션3용 주변기기로 지상파 디지털 튜너이자 시청과 녹화가 가능한 애플리케이션


3) 데이터 포터빌리티의 확보를 위해서도 속도 중독은 불가피하다

Google Takeout - 데이터 자체를 확보하여 고객 이탈을 방지한다


Google Takeout is a tool that lets you quickly and easily download data that you created in (or imported into) a number of Google products. It provides the data in a variety of open, portable formats so that you can easily import the data into other internet services.


Google 테이크아웃을 사용하면 Google 제품 내에 저장되어 있는 데이터의 복사본을 다운로드할 수 있습니다.


이런 서비스를 실시하면 기본적인 고객 이탈 방지책으로 여겨졌던 '데이터 확보'를 꾀하기가 어려워진다. 하지만 고객을 속도에 중독시킴으로써 '다른 곳은 왠지 느리고 불쾌하다'는 느낌을 주는 동시에 자사를 부각시키는 방법은 점점 더 중요해지고 있다.


4) 유휴 시간과 유휴 자산 활용

캐스트 오븐 - 웹에서 얻을 수 있는 정보나 개인이 쌓아둔 정보가 늘어나면 개인이 소비해야하는 정보도 늘어난다. 하지만 열람 방법과 디바이스, 시간은 한정되어 있다.





빅데이터 비즈니스

저자
스즈키 료스케 지음
출판사
더숲 | 2012-03-21 출간
카테고리
경제/경영
책소개
빅 데이터는 21세기형 산업혁명이다!『빅 데이터 비즈니스』는 우...
가격비교