TECH ISSUE 02

Tech Issue - 빅데이터 비즈니스 성공사례 2가지_지식을 넘어 지혜로! ‘빅데이터’가 그리는 세상

Tech Issue는 글로벌 기술 트렌드 및 해외 유망 기술을 소개하기 위해 (주)스페이스점프와 협력하여 게재하고 있습니다.


15.png

▲ 이형민 대표
(주)스페이스점프


바야흐로 우리는 ‘빅데이터’의 시대에 살고 있다.

지금의 신(新)세계는 ‘지식의 세계’를 넘어 ‘지혜의 세계’를 의미한다.

하루에도 수많은 데이터가 쓰나미처럼 밀려들어 오고 다시 나가고를 반복한다.

그동안 데이터는 기존 산업에서 조연 역할을 자청했지만, 이제 조연이 아닌 주연으로서 입지를 탄탄히 구축하고 있다.

빅데이터는 ‘구글’을 빼놓고 얘기할 수가 없다.

구글은 창업 당시부터 남다른 선언으로 시작한 기업이다.

“우리의 임무는 세상의 모든 데이터와 정보를 조직화하고 전 인류가 접근하고 사용하게 하는 것이다.”

우리가 구글을 주목하는 이유는 바로 엄청난 데이터를 연결해 사람들이 사용하도록 하는 구글의 미션이 바로 빅데이터 산업의 표본이기 때문이다.

구글도 초기에 데이터 처리를 위해 많은 고생을 했다.

다른 초기 기업들처럼 마땅한 전산장비 하나 마련하지 못해 애를 먹었던 적이 있다.

그래서 구글이 개발한 것이 바로 ‘구글 파일 시스템’이다.

이는 일반 컴퓨터 여러 대를 연결해 하나의 고성능 서버처럼 사용하는 방법을 개발한 것이다.

구글은 여기에서 한 발 더 나아가 빅데이터의 효율적인 처리 방법도 개발했다.

이것이 바로 ‘맵리듀스(Map Reduce)’라는 시스템이다.

대규모의 데이터를 그 구성과 속성을 고려해 분리한 후 그것에 맞게 정렬하는 기능이 ‘맵’이고, 그 다음 분리된 데이터를 다시 합치는 기능이 바로 ‘리듀스’다.

이 맵리듀스를 발표한 2004년이 바로 사실상 빅데이터 기술의 원년이라고 볼 수 있다.

그리고 2006년에 등장한 빅데이터 플랫폼 ‘하둡(Hadoop)’을 기점으로 빅데이터가 주목을 받게 된다.


16.png


보통 과학자들은 인풋(Input)이 프로세스를 거쳐 아웃풋(Output)이 나온다고 설명하기를 원한다.

“원인이 특정 과정을 거쳐 결과가 이렇게 나왔다”고 설명하는 식이다.

그래서 그들은 ‘특정 프로세스’에 집착하며, 이 프로세스를 ‘논리’라는 단어를 사용해 절대적인 것으로 포장한다.

그러나 데이터가 많아지면 이런 프로세스 즉 ‘논리’는 퇴색되고 만다.

데이터는 그저 인풋과 아웃풋이 ‘상관이 있다. 또는 없다’ 정도만을 알려준다.

이런 이슈를 ‘인과성과 상관성’의 문제라고 부른다. 빅데이터는 인과성이 아니라 상관성을 따른다.

따라서 데이터는 실험실을 벗어나 ‘빅데이터’가 되면서 이제 더는 과학자들의 전유물이 아니게 된 셈이다.

‘지식의 파편’을 끼워 맞춘다고 ‘지혜의 거울’이 되는 것은 아니다.

과거의 경험을 바탕으로 지혜가 완성되듯 모이고 쌓인 빅데이터를 해석하면 비로소 지혜가 만들어지는 것이다.

빅데이터는 3V를 주목해야 한다. ‘흐름(Vogue)’을 주시해 나만의 ‘관점(View)’을 가지고 필요한 ‘가치(Value)’를 창출해갈 때 의미가 있는 것이다.

즉, ‘빅데이터(Big Data)’ 그 자체가 의미가 있는 것이 아니고 ‘빅가치(Big Value)’를 창출하는 것이 중요하다는 말이다.

그래서 빅데이터 시대를 살아가는 우리가 갖추어야 할 능력이 있는데, 바로 ‘큐레이션(Curation)’ 능력이다.

박물관이나 미술관에서 작품의 수집, 관리 그리고 해석까지 해주는 큐레이터처럼, 빅데이터에서 필요한 정보와 가치만을 뽑아주는 큐레이터인 ‘데이터 사이언티스트’가 앞으로 촉망받는 직업으로 주목받고있다.

앞으로 거의 모든 기업들은 데이터의 가치 창출에 투자를 아끼지 않을 것이며, 큐레이터들의 데이터 분석 자료를 바탕으로 기업을 경영하게 될 것이다.


영화관을 넷플릭스처럼! ‘무비패스’

미국에서는 한 달에 1만 원만 내면 아무 영화관이나 가서 30번 공짜로 영화를 보는 방법이 있다.

바로 선풍적인 인기를 끌고 있는 ‘무비패스(MoviePass)’라는 앱 덕분이다.

월 회원비로 매달 30편, 즉 하루에 한편씩 영화를 무료로 볼 수 있는 셈이다.


17.png


현재 미국에는 4,000여 개의 영화관과 36,000여 개의 스크린이 있다.

무비패스는 이 중에서 무려 91%의 영화관을 이용할 수 있도록 했다.

미국에 있는 대부분의 영화관을 이용할 수 있는 셈이다.

2011년에 서비스를 시작한 무비패스는 월 이용료가 50달러였다.

영화 한 편의 가격이 8.89달러인 점을 고려하면 6편을 봐야 본전이었다.

결국, 사람들은 무비패스의 이용을 꺼렸다.

가격정책의 실패를 뼈저리게 경험한 이후 무비패스는 월정료를 9.95달러로 확 내려버렸다.

영화 한 편의 가격으로 매일 영화를 무료로 볼 수 있도록 만들어버린 것이다.

이런 무비패스의 성공 뒤에는 넷플릭스 창업멤버 중 한 사람인 ‘미치로우(Mitch Lowe)’의 공이 크다.

그가 무비패스의 CEO로 부임하면서부터 가격정책의 변화와 함께 많은 변화가 생겼기 때문이다.

그렇다면 무비패스는 어떻게 돈을 벌까? 회원들의 월정료가 돈이 될까?

원래 무비패스의 수익모델은 헬스클럽의 모델과 유사했다.

즉, 회원들 중에서 회원비만 납부하고 잘 이용하지 않는 고객들의 회원비를 수익으로 잡은 것이다.

그러나 미치로우는 이런 수익모델을 바꿔버렸다. 현재 무비패스의 수익원은 바로 ‘데이터’이다.

영화관을 이용하는 소비자들의 다양한 정보를 마케팅 회사와 데이터 회사에 판매하는 것이다.

요즘 빅데이터가 주목받는 이유가 바로 여기에 있다.

고객의 행동패턴과 다양한 소비 정보가 다시 돈이 되는 세상이다.

미국에서 1년에 판매되는 영화관 티켓은 130억 장이다.

이는 1년 동안 벌어지는 모든 스포츠 경기와 콘서트 티켓의 수를 다 합친 것보다 많다.

데이터가 많으면 많을수록 양질의 데이터를 뽑아낼 가능성은 더 커진다.

결국, 구글과 페이스북처럼 더 많은 부를 창출할 기회를 얻게 될 것이다.

무비패스의 미래가 더욱 밝은 이유가 바로 여기에 있다.


빅데이터 분석으로 신약을 개발하는 ‘스탠다임’

‘스탠다임(대표 김진한)’은 인공지능과 시스템생물학 기술을 접목해 신약 개발 과정을 개선시키고자 하는 기술 기반 스타트업이다.

10년 이상의 기간, 1조 이상의 비용이 소요되던 전통적인 신약 개발을 획기적으로 단축하는 것이 목표다.

스탠다임은 인공지능 전문가와 시스템생물학 전문가로 구성되어 있는데(시스템생물학은 생명 현상을 생물학뿐만 아니라 수학, 물리학, 화학 등 다양한 측면에서 분석하는 학문이다), 인공지능과 시스템생물학의 성과를 제약 분야에 적용한다.

다년간 축적된 의학/생물학 데이터를 인공지능이 학습하고 신약의 효과를 예측하는 컴퓨터 모델링 기술을 개발했다.

스탠다임은 제약사 같은 고객이 가진 정보, 예를 들어 생물학적 모델이나 관련 출판물 등을 받아 하나의 포괄적인 DB를 구성하고, 인공지능 시스템 ‘스탠다임AI’로 분석한다.

인공지능 시스템은 방대한 데이터를 분석해 인간이 생각하기 어려운 패턴을 파악한다.

딥러닝 알고리즘을 기반으로 정보를 분석, 통합해 신약이 될 가능성이 가장 큰 후보를 예측해 낸다.

단순히 결과를 예측할 뿐만 아니라, 해당 후보가 어떻게 만들어지는지에 대한 설명도 제공해 준다.

연구진은 기존의 연구로 얻어낼 수 없었던 추가 정보를 얻게 되는 셈이다.

또한, 스탠다임의 각 분야 전문가는 인공지능으로 도출된 신약 후보가 실제로 인체에 어떻게 작용할지에 대한 심도 있는 분석을 제공한다.

해당 후보로 연구를 진행할 때의 시뮬레이션 결과도 제공해 추후 연구에 큰 도움이 된다.

스탠다임은 딥러닝 기반 인공지능 시스템을 활용해, 신약 개발 시 유망한 후보군을 선별할 뿐만 아니라, 임상시험에 필요한 최적의 환자군을 선별해 개발의 효율성을 높이고 있다.

기존에 존재하는 약물을 다른 방식으로 조합하거나, 다른 용도로 사용할 수 있는지 등을 탐색해 더욱 효과적인 질병 치료 방법을 찾는 데에도 기여한다.

그 첫 번째 성과라 할 수 있는 일이 올해 1월에 있었다.


18.png


미국 캘리포니아에서 개최된 ‘2017 국제 정밀의학 컨퍼런스(PMWC, Precision Medicine World Conference)’에 참가해 스탠다임AI를 공개한 것이다.

스탠다임AI가 약물 종류가 한정되었던 기존 질병에 대해 ‘약물 용도 변경’을 예측하자, 인간이 발견하지 못했던 새로운 용도의 약물이 20종이나 나타난 것이다.

그중 2개는 각각 유방암과 폐섬유증에 사용되던 약이었는데, 2012년과 2016년 발표된 논문 결과도 있었다.

논문으로 검증된 2개 약물 외에, 나머지 18개 약물도 새로운 용도로 사용될 가능성이 크다. 해당 약물은 올해 중순까지 연구를 통해 검증될 예정이다.

이처럼 인공지능을 신약 개발에 활용할 경우, 개발에 소요되는 시간과 노력을 획기적으로 줄일 수 있다.

스탠다임은 대규모의 질병-약물 간 생물학적 DB를 시각화하는 작업을 진행하고 있다.

데이터를 그래프 형식으로 표현해, 약물이 효과적으로 작용하는 경우를 더 효율적으로 찾아낼 수 있기 때문이다.

그래프 DB가 지속적으로 구축되면, 아직 알려지지 않은 단백질과 약물, 질병 간 연결고리를 분석하는 솔루션을 개발할 계획이다.

제약업계에서는 인공지능 적용이 앞으로 20년 넘게 확대되어 지속될 것이라고 예측한다.

제약 분야에 인공지능 기술이 도입되면서, 신약 개발의 새로운 패러다임이 만들어지고 있다.

인공지능과 신약 개발의 조합은 기존의 제약을 해소하고 약물 개발의 속도를 높여, 전 세계인의 보건/의료 서비스 수준을 한 단계 올려줄 발판이 되어줄 것으로 기대된다.