01 - R&D의 디지털 전환, 어떻게 할 것인가?

SPECIAL ISSUE 01

01 - R&D의 디지털 전환, 어떻게 할 것인가?

▲ 최병삼 단장
과학기술정책연구원 신산업전략연구단

디지털 전환의 중심에는 데이터가 있다. 또한 데이터 기반의 디지털 전환이 변화시킬 대표적인 영역이 R&D이다.

이 글에서는 디지털 전환과 데이터가 R&D를 어떻게 변화시킬지 알아보고 성공적으로 추진하기 위한 다양한 방안에 대해 알아보고자 한다.

최근 수년간 ‘4차 산업혁명’이라는 개념에 국가적으로 많은 관심이 쏠렸고 널리 사용되고 있지만, 거부감을 가진 분들도 여전히 많은 것 같다.

새로운 산업혁명이 시작된 것이 아니라 1960년대 또는 1970년대부터 진행되어 온 3차 산업혁명이 여전히 진행 중이라는 주장도 존재한다.01

하지만 최근 기술, 산업, 사회 전반에 걸쳐 급격한 변화가 진행 중이고 이를 디지털 전환(Digital transformation)의 과정으로 설명할 수 있다는 견해에 대해서는 많은 분들이 공감하고 있는 것으로 보인다.

전자(Electronics), 인터넷, 클라우드 등의 확산으로 빅데이터가 쌓이고, 인공지능(딥러닝) 알고리즘의 발전이 불씨를 당기는 누적적 과정을 통해 전인미답의 혁신이 창출되고 있다.

디지털 전환의 중심에 데이터가 있음은 주지의 사실이다.

최근 우리가 목격하는 많은 사례에서 가치가 창출되는 방식을 살펴보면, 현실 세계에서 데이터를 수집하여(데이터 확보) 가상 세계에서 분석하고 지식을 추출하여(데이터 분석) 이를 다시 현실 세계에 활용(현실에 적용)한다는 것을 알 수 있다.

여기서 현실 세계는 일상생활, 산업현장, 사회 등의 공간과 인간, 제품, 서비스, 인프라 등 다양한 개체를 포함하며 가상 세계는 데이터가 모이고 분석되는 클라우드 등의 온라인 공간을 말한다.

현실 세계와 가상세계가 데이터를 매개로 연계되며 그 과정에서 데이터가 축적되는 선순환을 통해 전체 시스템이 최적화 되는 것이다.

디지털 전환의 주인공은 데이터 그 자체만이 아니라 데이터를 수집하고 전송·공유하고 분석하여 활용하는 과정에 포함된 하드웨어, 소프트웨어, 데이터웨어, 휴먼웨어 등 데이터 생태계 전체이다.

데이터 중심 연구 패러다임의 부상

데이터 기반의 디지털 전환이 변화시킬 대표적인 영역이 바로 R&D이다.

Hey, Tansley, and Tolle(2009)는 과거 실험, 이론, 컴퓨팅자원 중심의 연구에서 데이터 중심의 4세대 연구(Fourth Paradigm)가 부상하고 있다고 주장한다.

즉, 수천 년 동안 과학은 실험적이었고 자연현상을 관찰하는 것이 주된 내용이었다(Experimental or Empirical Science).

지난 수백 년 동안에는 과학이 이론적이었으며 모델을 활용한 일반화가 주된 내용이었다(Theoretical Science).

케플러의 법칙, 뉴튼의 운동법칙, 맥스웰 방정식 등이 이 시기의 산물이다.

최근 수십 년 동안 복잡한 현상의 시뮬레이션을 활용하는 계산 과학(Computational Science)의 측면이 강조되었다.

이제는 센서나 측정기구에 의해 생성된 데이터를 소프트웨어 알고리즘으로 분석하여 새로운 사실을 찾아내는 데이터 중심의 과학(Data-Intensive Science)이 새롭게 부상하고 있다.

데이터가 희소하고 획득비용이 높을 때는 미리 연구 가설을 세우고 그에 적합한 데이터를 생성해 가설을 검증했으나, 방대한 데이터가 생산되는 오늘날의 환경에서는 데이터 자체로부터 가설을 도출하고 검증하는 역량이 과학기술계의 핵심역량으로 부상하는 것이다.

R&D 설계 단계의 디지털 전환

그렇다면, 디지털 전환과 데이터는 R&D를 어떻게 변화시킬 것인가? 먼저 연구 주제나 가설을 설정하는 설계 단계를 살펴보자.

디지털 전환과 관련된 다양한 기술 중 단연 두각을 나타내고 있는 것은 인공지능, 즉 딥러닝(Deep Learning)이다.

지금까지의 연구는 사람이 가설을 수립하고 컴퓨터와 데이터는 그 가설의 검증에만 활용되었는데 소수의 천재적인 과학자를 제외하고 인간 연구자가 세우는 가설은 이미 그럴 것이라고 예상되는 당연한 내용인 경우가 많아 힘든 노력을 들여 가설을 검증하더라도 효용이 낮았다.

기존의 프로그래밍 방식에서 인간의 기존 지식으로 만든 프로그램에 전적으로 의존하는 것과 달리, 딥러닝과 같은 기계학습(Machine Learning)에서는 투입/산출 데이터(Input and output)로 논리를 만들어 낸다.

따라서 인간의 상식이나 선입견의 한계를 벗어날 수 있고 인간이 생각해 보지 못한 연구 주제나 가설, 결과를 만들어낼 수 있다.

또한, 방대한 문헌 데이터를 단시간에 탐색해 연구 설계에 필요한 유의미한 사실을 도출할 수도 있다.

특허분석의 예를 들어보자. 특허분석은 연구 설계단계에서 필수적이지만 시간이 지남에 따라 점점 어려워지고 있는 작업이다.

특허분석의 난점은 첫째 방대한 규모이다. 2018년 7월 1천만 번째의 미국 특허가 공개되었고 전 세계적으로는 현재 약 1억 개 이상의 특허 문건이 존재한다고 한다.02

둘째, 다양한 언어이다. 2017년 전 세계에서 공개된 560만 건의 특허 중 62%가 중국어, 일본어, 한국어로 기재되어 있다.

셋째, 복잡하고 어려운 내용이다. 최근 기술 전 분야에 걸쳐 융합이 활발하게 진행되고 있어서 특허 1건에도 다수 전문 분야의 기술지식이 포함되어 있다.

즉, 전문가 몇 사람이 읽고, 분석하고, 이해하기에 특허 정보가 너무 많다는 것이다.

이런 분야야말로 인공지능이 인간보다 탁월한 능력을 발휘할 수 있다.

예를 들어 IBM에서는 인공지능엔진 왓슨(Watson)을 활용하여 특허정보를 학습하고 분석하고 있다.

실제로 'IP Advisor with Watson'이라는 시스템을 개발하여 특허 침해 여부, 관련 특허 유무 등을 파악하거나 특허 유지를 결정하는 데 활용하고 있다.

구 톰슨 로이터의 지적재산권 및 과학(IP&Science) 사업부인 Clarivate Analytics도 특허 간 유사성을 평가하거나 누락되어 있거나 오타가 있는 경우에도 출원인이나 기관을 정확하게 파악하는 시스템을 개발하여 활용하고 있다.

R&D 수행 단계의 디지털 전환

실제 R&D를 수행하는 과정에서도 디지털 기술은 위력을 발휘한다.

몇 가지 예를 들면, 자동차 등의 제품개발에서는 디지털 트윈 기술이 활용되고 있다(Brossard, Erntell, and Hepp, 2018).

디지털 트윈(Digital twin)은 실제로 존재하는 제품에 대한 데이터를 센서로 수집하여 가상 세계에 그 제품과 같은 제품을 구현하는 것이다.

제품이 현실에서 사용되는 과정에서 얻어지는 다양한 정보를 바탕으로 제품의 실제 성능, 소비자의 숨은 니즈 등을 파악하여 제품 개선이나 차기 제품 개발에 활용할 수 있다.

의료 분야에서는 가상현실(VR)/증강현실(AR)을 활용한 교육과 연구가 활발하게 시도되고 있다.

일례로 의과대학 해부 실습용 ‘가상 해부테이블’은 실물 인체영상이 가로 205㎝, 세로 58㎝ 크기의 테이블에 3D영상으로 생생하게 구현되어 손끝 하나로 인체 곳곳을 자유자재로 해부하고, 실제 내부 모습을 볼 수 있다.03

전 세계 500개 의과대학에 배치되어 기존의 ‘카데바’(의학 교육 및 연구 목적으로 기증된 해부용 시신)를 대체해 나가고 있다.

가상현실(VR), 3D프린팅 등의 가시화(Visualization) 기술은 협업을 촉진함으로써 제품 개발 과정의 효율성을 획기적으로 높일 수 있는 가상현실 해커톤(Virtual reality hackathon)을 개최하기도 한다(Brossard, Erntell, and Hepp, 2018).

해외 기업에서는 현재 개발 중인 제품을 가상현실로 구현하고 디자인, 설계, 제조, 마케팅, 고객서비스 등 전 부문의 전문가들이 가상공간에서 모여 향후 개발 방향을 논의하는 가상현실 해커톤.

가상공간이기는 하지만 실제로 가시화된 제품을 두고 논의가 이루어지므로 효율성이 높다고 한다.

한 조사에 따르면 가상현실을 활용한 제품개발의 효과는 제품 성능은 약 20% 높아지고, 개발비용과 개발 기간은 모두 15%씩 감소했다고 한다.

제품의 프로토타입을 만드는 데 보통 5~6주가 걸리는데 가상현실이나 3D프린팅은 이를 몇 시간에서 며칠 이내로 단축해 준다.

머지않은 미래에는 인공지능이 연구개발 과정 전체를 대신할 수 있을지도 모른다.

2009년 사이언스지에는 영국 에버리스트위스 대학 교수팀이 개발한 로봇 과학자 '아담(Adam)'이 소개되었다.

아담은 미생물 실험을 자동으로 수행하기 위해 개발되었는데, 데이터를 수집하고 패턴을 분석해 가설을 세우고 실험을 통해 가설을 입증하는 일련의 절차를 사람의 개입 없이 스스로 수행한다고 한다.

R&D 디지털 전환을 위한 선결과제, 데이터 확보

앞서 디지털 전환의 핵심은 데이터라고 언급하였는데 이는 R&D의 경우에도 동일하게 적용된다.

R&D의 디지털 전환을 성공적으로 추진하기 위해서는 대량의 양질의 데이터가 필수적이다.

이를 위해 기존에 확보된 데이터를 효과적으로 공유하고 결합하여 활용하는 것도 중요하겠지만 가치 있는 데이터를 새롭게 수집하는 것도 중요하다.

구글 알파벳의 스마트시티 부문 자회사인 사이드워크 랩스(Sidewalk Labs)는 미국 정부와 협력하여 2016년부터 뉴욕에 공중전화 부스를 대체하는 Link NYC라는 이름의 디지털 키오스크를 설치하고 있다.

2018년 9월 현재 약 1,600개가 설치되었고 향후 7,500개까지 늘려나갈 계획이다. 디지털 키오스크는 고속 와이파이, 안드로이드 태블릿, 충전기, 911 비상버튼, 무료 국내전화 등을 제공한다.

무엇보다 키오스크는 3개의 카메라와 30개의 센서를 장착하여 온도, 습도, 기업, 대기 오염 수준, 자동차나 대중의 움직임 등을 감지한다.

현지에서도 프라이버시 우려가 지속적으로 제기되고 있기는 하지만 이와 같은 데이터가 수집되고 축적된다면 스마트시티 관련 연구나 서비스 개발에 핵심적인 역할을 할 것임은 분명하다.

우리나라에는 혁신을 선도하는 R&D를 위한 데이터 센서 인프라나 이를 구축하기 위한 전략이 있는가?

맺음말

표 1은 미국산업연구원(IRI, Industrial Research Institute)이 2016년 10월 개최한 워크숍에서 참석자들을 대상으로 디지털 전환, 구체적으로 디지털 협업, 가상 실험/시뮬레이션, 빅데이터 분석이 R&D에 어떤 영향을 줄 것인가를 질문한 결과이다.

조사 규모가 통계분석을 위해 충분하지는 않지만, 디지털 전환은 디지털 협업을 통해 오픈 이노베이션을 촉진하고 가상 실험/시뮬레이션을 통해 개발 기간을 단축하며, 빅데이터 분석을 통해 소비자 친밀도를 제고할 것이라는 것이 다수 의견으로 나타났다.

앞서 소개한 다양한 사례들과 대체적으로 일치하는 결과이다.

OECD(2015)는 데이터분석(Data analytics)을 제품, 프로세스, 조직에 활용하여 효율성, 생산성, 경쟁력, 사회복지를 강화하는 '데이터 기반 혁신(Data-driven innovation)'을 강조한 바 있다.

데이터 기반의 디지털 전환은 비용과 시간 측면에서의 R&D의 효율성(Efficiency)을 개선할 뿐만 아니라 이제까지 하지 못했던 연구를 가능하게 하여 R&D의 효과성(Effectiveness)도 높일 것이다.

과학기술 연구자들은 이제 R&D의 디지털 전환이 선택이 아닌 필수임을 인식해야 하고, 정책담당자들은 R&D 혁신을 제도로 추진할 수도 있지만 기술로도 시도할 수 있다는 사실에 주목해야 한다.

01 관련된 보다 상세한 논의는 “최병삼·양희태·이제영(2017), 「제4차 산업혁명의 도전과 국가전략의 주요 의제」, 『STEPI Insight』, 과학기술정책연구원”을 참조

02 https://clarivate.com/blog/ip-standards/artificial-intelligence-hype-vs-realityimpact-patent-industry/

03 연합뉴스(2016.4.11), 한국인 개발 ‘가상 해부테이블’ 세계 500개 의대에서 쓴다.