01 - 소재 데이터와 인공지능을 활용한 소재 개발
▲ 글. 최우진 센터장
한국화학연구원 화학소재솔루션센터
인공지능 기술이 초래할 산업변화로 선발주자의 시행착오를 바탕으로 빠르게 추격하는 패스트 팔로워의 몰락을 예견하는 보고서를 본 적이 있다.
패스트 팔로워로 경쟁력을 확보하고 있는 우리나라 소재 산업은 미래에 불확실성이 커질 것이다.
이 글에서는소재 분야의 데이터 구축과 인공지능 기술 적용 현황을 살펴보고 향후 풀어야 할 문제점에 대해 이야기하고자 한다.
인공지능은 이제 우리 생활에 깊숙이 들어오게 되었다.
스피커, 카메라, 번역기, 자율주행자동차에는 이미 적용되고 있으며 최근에는 아기나 동물의 의사를 파악하는 데 인공지능 기술이 활용된다고 한다.
이렇게 우리가 생활에서 쉽게 인공지능 기술을 접할 수 있는 것은 인공지능 알고리즘의 기술개발 뿐 아니라 빅 데이터라고 일컬어지는 다양하고 많은 데이터를 빠른 시간 내에 분석해서 활용할 수 있게 되었기 때문이다.
데이터의 중요성을 이야기할 때, 요리로 생각한다면 요리 재료가 데이터이고, 조리방법이 인공지능 기술이라고 생각하면 어떨까?
영화나 만화에서 요리사들이 최고의 음식을 만들기 위해 질 좋은 재료를 구하려고 많은 노력을 아끼지 않는 것을 종종 볼 수 있다.
IT 분야에서도 GIGO, 풀어쓰면 Garbage In, Garbage Out이라는 용어가 많이 사용되고 있다.
품질 낮은 데이터가 들어가면 낮은 품질의 결과물이 얻어지는 것을 이야기하는 것이다.
특히나 비선형함수를 많이 사용하는 인공지능 분야에서는 데이터 질의 영향이 더 커질 것이라고 생각된다.
따라서 인공지능 기술을 잘 활용하여 정확한 성과를 얻기 위해서는 질 좋은 데이터를 확보하는 것이 가장 필요하다.
소재 데이터 현황과 이슈
최근 유럽 NOMAD와 미국 CHiMaD를 중심으로 계산과학 툴을 이용한 소재 데이터의 구축 및 공개가 활발하게 진행되어 소재 데이터에 대한 접근성은 상당히 높아졌다.
그러나 소재의 조성-공정-물성 관계와 같이 산업적으로 활용 가능한 데이터의 확보는 여전히 어려운 상황이다.
비록 선진국보다 늦게 시작했지만 2007년 당시 산업자원부에서 시작한 소재정보 은행 구축사업을 통해 산업적으로 활용 가능한 소재 데이터를 체계적으로 구축하고 공개가 진행되었다.
소재별 특성을 고려하여 현재 금속, 화학, 세라믹, 섬유 4대 소재정보은행이 운영이 되고 있으며 표 1에 각 소재정보은행 현황을 나타냈다.
소재정보은행 데이터베이스를 인공지능 기술에 활용할 목적으로 구축한 것은 아니지만 소재-공정-물성으로 구성된 일부 데이터 셋의 경우, 인공지능에 적합한 데이터로서 가공 및 활용이 가능하다.
그러나 이미 구축된 소재 데이터 베이스를 활용하여 인공지능 기술을 연구할 때, 데이터의 목적성 및 양적 부족의 문제가 나타나고 있다.
또한 데이터 생성절차 및 출처 관리가 제대로 되지 않은 경우, 데이터의 신뢰도에도 문제가 있을 수 있다.
인공지능을 위한 데이터는 인공지능의 학습을 위해필요한 데이터로서 목적성을 가지는 것이 좋다.
2018년 미국 하버포드대학교 A.J. Norquist 교수는 실패한 실험 데이터를 활용하여 소재를 개발할 수 있는 인공지능 기술을 Nature지에 발표하였다.
즉, 전통적인 소재개발 프로세스상 실패한 데이터 혹은 의미 없는 데이터라도 인공지능이 학습하는 데 필요할 수 있다.
이는 연구개발 과정에서 실패한 실험에 대해서도 기록 및 관리가 중요하다는 것을 반증한다.
아울러 전문가적 관점에서 의미가 없는, 즉 소재개발에 도움이 되지 않는 영역(예: 조성, 공정 등)에서의 실험도 인공지능 연구를 위해서 수행해야 할 필요가 있다.
인공지능 활용을 위한 데이터를 새롭게 확보하는 것은 시간이 오래 걸릴 수밖에 없다.
그러므로 기존 소재 데이터를 활용할 수 있는 형태로 변환하는 것이 중요하고, 각 소재 데이터 간 상호 연계를 위한 표준화가 매우 중요하게 인식되고 있다.
소재 데이터의 표준화를 위해서는 소재 및 데이터 전문가가 함께 분류 및 용어 체계 표준화, 메타데이터 정의 등 표준화를 위한 가이드라인을 제정해야 한다.
중국의 경우, 중국시험재료협회(CSTM)에 소재 데이터 표준화를 위한 위원회를 구성하여 계산, 합성, 데이터, 특성, 응용기술의 5개 소위원회에서 표준화 활동을 진행하고 있다.
아직 우리나라에는 소재 데이터 표준화를 위한 공식적인 활동이 없어서 이에 대한 대책 마련이 필요하다.
데이터의 신뢰도를 높이기 위한 절차 수립도 기존에 제정된 표준을 따르거나 소재 데이터 표준화 활동에서 다루는 것도 하나의 방법으로 생각된다.
국제 표준화를 위해서는 스페인 마드리드 공대 M.D. Wilkinson 교수가 발표한 과학 데이터 관리를 위한 FAIR(Findable, Accessible, Interoperable, Reusable) 원칙을 따르는 것도 중요하다.
또한 소재분야 도메인 지식을 가지고 있는 소재전문가가 참여하여 데이터의 신뢰도와 더 나아가 인공지능을 통해 나온 결과의 적절성에 대해서 검증할 필요도 있다.
소재 데이터의 관리 및 활용을 가속화하기 위해서는 이를 위한 플랫폼 개발도 필요하다. 소재 데이터 플랫폼의 예로서 미국 NIST에서 개발한 CDCS(Configurable Data Curation System)가 있다.
CDCS는 2개의 시스템으로 구성되며 데이터 구조화 및 저장을 위한 MDCS(Materials Data Curation System), 분산된 소재데이터의 공유 및 검색이 가능한 MRR(Materials Resource Registry)로 구성되어 있다.
우리나라에서도 소재정보은행 데이터베이스 구축 경험과 표준화 활동을 통하여 소재 데이터를 모으고 이를 활용할 수 있는, 더 나아가 기업들이 활용할 수 있는 소재 데이터 플랫폼 개발이 필요하다.
인공지능을 활용한 소재개발 현황
소재산업 분야에서도 인공지능 기술을 이용하려는 연구가 수년 전부터 시작되었다.
인공지능 기술 관련하여 게재된 소재분야의 논문 건수가 2014년 기준 소재 120건, 고분자 14건이며, 2019년 9월까지 소재 747건, 고분자 156건으로 급격하게 늘어나고 있다.
또한 산업계에서 인공지능 기술을 소재개발에 적용한 사례가 발표되고 있으며 표 2에 정리하였다.
2011년 미국은 계산과학을 중심으로 한 소재개발 프로젝트(MGI)를 국가적으로 수행하기 시작하였다.
반면에 일본은 계산과학보다는 축적된 데이터를 기반으로 소재개발을 시작하자는 프로젝트를 2015년 NIMS(물질재료연구기구)를 중심으로 MI2I(「Materials research by Information Integration」Initiative) 사업을 시작하였으며 일본 기업들도 인공지능을 이용한 소재개발 사례나 계획을 속속 발표하고 있다.
이는 기업 내 축적된 데이터가 많이 있다는 것을 반증한다.
특히 일본 DIC와 JSR에서 디스플레이용 재료 개발에 인공지능 기술을 활용하는 사례는 디스플레이 및 반도체 소재에 대한 일본의 수출규제와 관련해서 우리 소재산업에서도 관심 깊게 바라볼 사례라고 판단된다.
해외사례를 바탕으로 국내 소재산업에서 인공지능을 적용할 수 있는 분야로는 소재의 조성에 따른 열적, 기계적 물성 등을 예측하는 것이라 판단된다.
특히 화학소재 중 플라스틱 복합수지, 코팅소재, 점·접착소재와 같은 배합소재는 다양한 원료를 배합하여 기능성을 가진 제품을 개발하는 과정이 해당 산업 분야에서 매우 중요하고, 각 기업의 핵심 기술로서 취급되고 있다.
그렇지만 다양한 배합소재의 개발 과정에서의 시행 오차로 인해 많은 시간과 비용이 투입되고 있는 것도 현실이다.
이러한 배합소재 개발에 인공지능 기술을 적용한다면 최소의 실험으로 원하는 물성을 가진 소재개발이 가능할 것이다.
현재 한국화학연구원에서는 「열 및 전기전도성 플라스틱 복합수지의 조성 및 물성 예측을 위한 데이터 수집 및 인공지능 기술 적용에 관한 연구」를 수행하고 있어, 향후 몇 년 내에 인공지능 기술을 활용한 배합소재 개발이 가능할 것으로 기대된다.
마무리
인공지능 기술이 산업구조를 패스트 팔로워의 몰락, 승자독식의 구조로 이끌게 된다면 최대한 빠르게 소재 데이터를 확보하고 활용하는 것이 소재산업 경쟁력을 확보하는 데 꼭 필요하다.
그러나 단시일 내에 충분한 소재 데이터를 확보한다는 것은 소재연구자라면 매우 어렵다는 것을 알 수 있을 것이다.
만일 각자 가지고 있는 데이터만으로 경쟁력을 유지할 수 없다면, 데이터를 공유하는 것이 경쟁력 강화에 도움이 될 수 있지 않을까?
다만 각 기업이 가지고 있는 데이터를 공유하는 것은 매우 어려운 일이기 때문에 초기에는 정부에서 질적 수준이 높은 데이터 확보와 플랫폼 구축을 지원하여 기업들이 협력할 수 있는 장을 마련할 필요가 있다.
그리고 데이터 공유와 활용이 기업의 경쟁력 강화에 도움이 된다는 것이 입증된다면 소재 산업분야에 인공지능 기술이 빠르게 보급될 수 있을 것이다.