04 - 4차 산업혁명을 위한 R&D 혁신

SPECIAL ISSUE 04

04 - 4차 산업혁명을 위한 R&D 혁신

▲ 김호인 수석연구원
포스코경영연구원

기술혁신의 최전선에서 새로운 시대를 열어가는 역할을 수행하는 것이 R&D이다.

하지만 하얀 가운과 각종 실험도구로 대변되는 실험실 풍경은 어떤 분야보다 매우 아날로그적이고 고전적이다.

4차 산업혁명 시대의 R&D는 어떤 모습일까? 주목할 만한 R&D 디지털화 사례를 통해 4차 산업혁명 시대의 R&D 풍경을 그려 보았다.

고전적인 R&D 풍경의 변화

빅데이터와 인공지능이 주도하는 4차 산업혁명은 제조업을 넘어, 유통업, 금융업, 서비스업 등 전 산업에 큰 영향을 미치고 있다.

또한, 자율주행, 스마트홈, 스마트시티 등 생활 인프라 전반이라고 할 수 있는 우리 삶의 깊숙한 곳까지 그 범위를 넓히고 있다.

기술혁신의 최전선에서 새로운 시대를 열어가는 역할을 수행하는 것이 R&D이지만 1~3차 산업혁명을 거치는 동안에도 실험자의 하얀 가운과, 검정 안경테, 그리고 각종 실험도구로 대변되는 고전적인 실험실 풍경은 아날로그적인 모습을 보존하고 있었다.

그러나 4차 산업혁명을 주도하고 있는 빅데이터와 인공지능이 R&D분야에도 주목할 만한 혁신을 가져오면서 고전적인 실험실 풍경의 변화를 예고하고 있다.

주목할 만한 R&D 혁신 사례를 통해 4차 산업혁명 시대의 R&D 풍경은 어떤 모습으로 변화할지 그려 보았다.

머신러닝 기반 문헌탐색(BASF)

독일계 글로벌 화학회사인 바스프(BASF)에서 옥수수의 내성을 개선할 수 있는 박테리아를 찾는 프로젝트의 연구팀은 활용 가능한 내부 보고서 40만 건, 외부에 공개된 연구논문, 그리고 특허에서 선행연구 탐색을 시작하였다.

키워드 검색을 통해 연구주제와 관련이 있는 48,000건의 문헌을 1차적으로 확보하였다.

연구팀은 48,000건의 문헌 DB에 머신러닝 기반의 문헌탐색 기술을 적용하여 연구주제와 직접 관련성이 높은 38건의 핵심 문헌을 단시간에 찾아낼 수 있었다.

머신러닝 기반의 문헌탐색은 연구주제와 중요한 이슈를 입력하면 컴퓨터가 입력한 내용을 이해한 후 보유하고 있는 많은 문헌의 내용을 파악하고 입력한 내용과 적합도가 높은 문헌을 빠르게 검색해 준다.

연구팀은 이 38건의 문헌을 참조하여 빠른 시간에 원하는 박테리아를 찾아내는 성과를 거둘 수 있었다.

선행연구 자료를 충분히 파악하면 최신 기술수준과 경합 기술, 사업화 관련 기술적 이슈를 파악할 수 있기 때문에 시행 착오를 큰 폭으로 줄일 수 있다.

그러나 연구자들은 시간 제약으로 선행연구를 충분히 파악하지 못하고 초기에 탐색한 한정된 문헌과 자신이 익숙한 전문 도메인을 기반으로 연구주제와 방법을 설정하는 것이 보통이다.

그러나 바스프의 사례와 같이 머신 러닝에 기반한 문헌탐색 기술로 문헌의 연구내용을 컴퓨터가 이해하고 연구주제와 관련이 높은 선행연구 문헌을 빠른 시간 내에 탐색할 수 있다면 연구과제 성공 가능성을 비약적으로 개선할 수 있다.

문헌탐색 기술은 해당 분야의 연구주제 탐색에만 국한되지 않고 관련이 있는 타 도메인과의 융합을 촉진하는 역할도 지원할 수 있다.

디지털 역량과 R&D 전문 역량 간 융합(SMS)

SMS는 2016년에 전 세계의 데이터 사이언티스트(Data Scientist)들을 초청하여 철강공정 데이터 해석을 경연하는 데이터 챌린지 이벤트를 개최하였다.

참가자들에게 연주공정 데이터를 제공하고 연주공정의 주요 불량인 크랙(Crack) 발생을 예측할 수 있는 모델을 개발하도록 한 행사였다.

약 100여 명의 데이터 사이언티스트들이 이 대회에 참가하였는데 대부분 철강공정 경험이 없는 비전문가들이었다.

참가자들은 6주간의 비교적 짧은 모델개발 시간이 주어졌음에도 괄목할 만한 성과를 거두었다.

1등을 차지한 독일의 Florian Borchert는 머신러닝 기법을 적용하여 SMS 엔지니어들이 그동안 인지하지 못하고 있던 주요 변수 간 인과관계를 밝혀내면서 크랙 발생을 효과적으로 예측할 수 있었다.

2등을 차지한 인도의 Thanish Batcha는 잘 구조화된 고급 통계분석을 적용하여 성과를 낼 수 있었다.

SMS 사례에서 주목할 점은 이벤트에 참여한 데이터 사이언티스트들이 철강공정에 문외한인 비전문가들이었다는 점, 그리고 오직 데이터 분석만을 통해 기존 엔지니어들도 인지하지 못한 공정 변수와 크랙 간 인과관계를 정확하게 파악하였다는 점이다.

인공지능 및 빅데이터 기술을 적용함으로써 도메인 지식에 의존하지 않고도 해당 시스템의 변수 간 인과관계를 파악하고 운영 모델을 개발할 수 있다는 것을 보여줬다는 점에서 의미가 있다.

SMS 사례와 같이 디지털 전문가와 도메인 전문가 간 협업을 통한 R&D 혁신은 괄목할 만한 성과를 바탕으로 가속화될 전망이다.

인공지능 기반의 CPS 구축 플랫폼(Hitachi)

Hitachi는 머신러닝 기반의 강화학습을 적용하여 복잡한 모델 기반이 아닌 데이터 기반으로 현실의 시스템을 비슷하게 구현해 내는 CPS(Cyber Physical System) 구축 지원 플랫폼 'H'를 개발하였다.

'H'를 서로 다른 도메인 지식이 필요한 7개 분야 24개 케이스에 적용하였는데 도메인 지식에 대한 사전 지식 없이도 훌륭하게 미션을 수행하여 ‘H’의 유용성을 확인하였다.

CPS가 R&D 디지털화의 핵심 툴로 여겨지는 것은 CPS를 통해 물리적인 실험실에서 수주 혹은 수개월씩 걸리는 수많은 실험을 단 몇 시간 또는 단 몇 초 안에 마무리할 수 있기 때문이다.

CPS가 이렇게 강력한 툴이지만 널리 사용되지 못하고 있는 까닭은 물리적인 실험실을 가상의 공간에 구축하기 위해서는 실제와 똑같이 작동하는 정교한 모델이 개발되어야 하는데 이 작업이 매우 어렵기 때문이다.

이러한 어려움에도 불구하고 화학 및 제약 산업에서 CPS를 적용할 수 있었던 것은 원자, 분자의 거동을 예측할 수 있는 잘 정립된 양자역할 모델과 양자역할 모델 운영에 필요한 컴퓨팅 파워를 지원할 수 있는 대규모 자본을 보유했기 때문이다.

화학 및 제약 산업의 경우 CPS를 활용하여 수억 개에 달하는 후보 물질을 사이버 공간에서 개발하고 테스트함으로써 신약이나 신물질 개발 속도를 비약적으로 향상시킬 수 있었다.

Hitachi의 'H'가 의미하는 것은 도메인 지식에 기반한 정교한 모델이 없어도 실험 데이터만 주어지면 변수 간 인과관계를 파악하여 CPS 구축에 필요한 운영모델을 개발할 수 있고 지속적인 데이터 업데이트를 통해 운영 모델을 더욱 정교하게 보완하는 것이 가능하다는 것이다.

앞에서 소개한 SMS의 연주공정 사례 역시 CPS 구축 사례로 볼 수 있다. 매우 복잡한 공정이고 다양한 변수가 상호 연관되어 있지만 머신러닝 기반 모델에 연주공정을 재현하는 CPS가 구축된 것이기 때문이다.

Hitachi의 'H'는 SMS 사례에 비하면 아주 단순한 실험 구성에 불과하지만 데이터 기반으로 CPS를 구축할 수 있는 범용 플랫폼을 구축한 데서 의미를 찾을 수 있다.

화학, 제약 산업에 국한된 CPS 활용이 산업 전반으로 확산될 수 있는 가능성이 열린 것이다.

4차 산업혁명 시대의 R&D 풍경

앞서 소개한 3가지 사례는 각각 R&D 초기 연구설정, 디지털과 기존 R&D 간 융합의 성과, R&D 수행방식과 관련하여 상징적인 가능성을 제시하였다.

각 사례의 의미에서 살펴보았지만 빅데이터 및 인공지능과 같은 강력한 디지털 툴의 적용으로 디지털화된 R&D는 고전적인 R&D와는 상당히 다른 풍경으로 변화할 것으로 보이며, 다음과 같은 변화를 전망할 수 있다.

R&D 초점, 실행에서 초기 연구설정으로

기존의 R&D 체계에서는 물리적인 실험실의 구성과 수많은 실험에 가장 많은 시간과 자본이 소요되었기 때문에 자연스럽게 R&D 실행 단계의 관리에 집중하였다.

선행연구 검토를 통한 연구주제 현황 파악과 효과적인 연구방법론 탐색이 중요한 것은 알고 있지만 키워드 검색을 통해 관련도가 높은 선행연구를 탐색하고 또 수많은 선행연구 문헌을 하나하나 정독하는 것은 물리적인 시간제약이 있었기 때문이다.

그러나 머신러닝 기반 문헌탐색은 짧은 시간 안에 주제 관련도가 높은 선행연구를 찾아줄 수 있기 때문에 훨씬 더 많은 선행연구를 검토할 수 있을 뿐만 아니라 타 도메인에서 연구주제에 도움이 될 만한 아이디어를 탐색하는 것까지 가능하게 되었기 때문에 초기 탐색이 더욱 중요한 작업이 될 것이다.

그리고 손쉽게 CPS를 구축할 수 있게 되면 R&D 실행에 소요되는 시간을 큰 폭으로 줄일 수 있기 때문에 R&D의 초점은 실행에서 초기 아이디어 탐색 과정으로 자연스럽게 이동할 것이다.

디지털 역량의 보편화

기업들은 디지털 전문가와 R&D 전문가 간 협업이 가치 있는 혁신을 창출한다는 것을 인식하면서 확대 적용을 위한 노력을 기울이고 있다.

그러나 디지털 전문가는 4차 산업혁명의 핵심 자원으로 모든 분야에서 공급 부족을 겪고 있기 때문에 R&D 분야도 마찬가지로 디지털 인재를 동원하기 어려운 실정이다.

부족한 디지털 역량은 단기적으로는 산학 연계를 통한 디지털 전문가 육성을 통해 보완될 것이다.

장기적으로 보면 디지털 툴에 접근하기 위한 문턱이 낮아지고 필수 교육으로 자리잡으면서 수학과 마찬가지로 디지털 역량 또한 R&D 전문가의 기본 역량으로 자리잡을 것이다.

바스프의 경우 기존의 연구 인력들이 인공지능이나 통계에 대한 전문지식이 없어도 쉽게 디지털 툴을 활용할 수 있도록 사내 애플리케이션 형태로 개발하여 보급하는 노력을 기울이고 있다.

미래에는 디지털 전문가가 도메인 전문가를 대체할 것이라는 성급한 전망도 있지만 실험실을 구성하고 디지털 툴로 구성한 모델을 해석하고 개선하는 등 핵심 역할은 여전히 도메인 전문가의 몫으로 남을 것이다.

도메인 간 장벽 해소와 융합

기존 도메인 내에서 혁신이 갈수록 어려워지고 있는 상황에서 도메인 간 융합을 통해 새로운 혁신의 기회를 찾고자 하는 노력이 증가하고 있다.

그러나 이러한 융합노력이 기대만큼 큰 성과를 창출하지 못하고 있는 것은 여전히 도메인 간 지식 장벽이 견고하기 때문이다.

디지털 툴은 도메인 간 지식 장벽을 낮춰 도메인 간 융합성과를 촉진할 것으로 기대한다.

머신러닝 기반 문헌탐색은 선행연구 탐색 범위를 같은 연구 분야에 한정하지 않고 비슷한 고민을 다루고 해결한 경험이 있는 다른 분야 연구성과로 쉽게 접근할 수 있도록 도울 수 있다.

그리고 기존 R&D 체계에서는 한 분야에서 뛰어난 성과를 내기까지 오랜 시간이 소요되기 때문에 우수한 연구인력이 분야를 바꿔 새로운 연구 분야에 도전하기가 쉽지 않았다.

그러나 디지털화된 R&D 체계에서는 좋은 아이디어만 있으면 연구성과를 창출하는 시간도 대폭 단축할 수 있기 때문에 우수한 연구자가 한 분야에만 매몰되지 않고 다양한 연구 분야에서 연구성과를 창출하는 것이 자연스러운 풍경이 될 수 있다.

이러한 변화는 도메인 간 융합연구를 촉진하는 결과를 가져올 것이다.

R&D는 기업의 핵심 경쟁우위를 창출하는 원천이지만 상당한 자본과 시간이 소요되고 그 성과를 예측하기도 힘들어 기업들은 효과적인 관리를 위해 고심을 거듭해 왔다.

그러나 빅데이터, 인공지능, 그리고 CPS와 같은 강력한 디지털 툴을 활용한 R&D는 기존 R&D의 불확실성을 제거하고 R&D 생산성을 비약적으로 높일 수 있다.

디지털화된 R&D는 4차 산업혁명을 견인하는 혁신의 원천으로 자기 역할을 수행할 것으로 기대해 본다.