인공지능 프로젝트 성공을 위한 데이터 전략과 내부 전문가 양성 프로세스 구축의 중요성

디지털 혁신

최근 많은 조직이 데이터를 충분히 쌓은 뒤 인공지능을 도입하겠다는 의사결정을 하며 인공지능의 도입을 미루고 있다. 소위 말하는 빅데이터가 아직 구축되지 않았으니, 인공지능을 도입하지 못할 것이라는 관념을 인공지능 도입 절차에서 종종 마주하게 된다. 조직의 의사결정자는 빅데이터와 인공지능이 필연적으로 함께 가야 하는 것으로 인식하는 경우가 많이 있지만, 사실은 그렇지 않을 수 있다.

현재의 인공지능은 일반적인 모든 업무를 잘 해내는 것이 아닌 특정한 업무를 양질의 데이터를 통하여 기계학습하였을 때 사람 수준의 퍼포먼스를 발휘하는 것으로 볼 수 있다. 이러한 관점에서 인공지능을 도입하고자 하였을 때, 가장 중요한 것은 어떠한 비즈니스 영역에 인공지능을 도입할지에 대한 의사결정이다. 데이터의 양을 논의하기 전에, 먼저 어떠한 업무를 인공지능화 시키고 개선할 것인지를 결정해야 한다. 어떠한 영역에 인공지능을 도입할지에 대한 구체적인 고민 없이 데이터를 무작정 쌓는 것은 목적지를 정해두지 않고 길을 떠나는 것과 같다. 따라서, 인공지능의 도입 방향을 결정할 수 있는 의사결정자라면 먼저 인공지능을 기반으로 개선할 업무의 영역을 구체적으로 도출하는 것이 필요하다는 것을 인지할 필요가 있다.

인공지능을 적용할 수 있는 영역을 구체적으로 정의하기 위해서는 두 가지 역량을 가지고 있어야 한다. 첫 번째는 인공지능에 대한 활용 역량이며, 두 번째는 도메인에 대한 산업 전문성이다. 두 가지 역량이 결합되어야만 적절한 인공지능의 적용 영역을 정의할 수 있다. 글로벌 IT 컨설팅 기업인 가트너에서도 데이터 과학자의 가장 중요한 역량으로 IT 스킬보다도 비즈니스에 대한 이해도를 꼽고 있다. 따라서, 비즈니스 이해도를 보유하고 있는 산업 전문가가 인공지능 활용 역량을 효율적으로 습득하여, 위에 언급된 인공지능의 구체적인 적용 영역을 정의하는 것이 인공지능 도입에 있어 가장 효율적인 방법이 될 수 있다. 인공지능의 구체적인 적용 영역이 정의된다는 것은 어떠한 문제를 해결할 것인지와 실무 적용을 위하여 인공지능의 정확도가 어느 정도 목표치를 가질 것인지, 해당 목표치를 달성하기 위해서 필요한 인공지능의 기술 접근 방법은 무엇이고 어떠한 데이터가 필요한지가 정해진다는 것이다. 이러한 것들이 정의되는 시점부터 비로소, 데이터 관점에서의 목적지가 어디에 있는지 알 수 있게 된다.

데이터 관점의 목적지가 정해졌다면, 그다음 프로세스는 현재 문제 해결을 위해 필요한 데이터가 얼마나 확보되어 있는지를 확인하는 것인데 많은 경우에 충분한 데이터가 없을 수 있다. 이 시점에서도 조직의 의사결정자는 두 가지의 선택지가 있을 수 있다. 한 가지는 필요한 데이터를 충분히 쌓기 위한 방향의 의사결정이며, 다른 한 가지는 현재 보유한 데이터 내에서 Proof of Concept(타당성 검증) 프로젝트를 해보는 것이다. 필자가 권장하는 방향은 후자이며, 그 이유는 구글 브레인의 총괄이었던 앤드류 응(Andrew Ng)은 ‘어떻게 당신의 기업을 인공지능 시대로 이끌 것인가?’라는 칼럼을 통하여 다음과 같이 언급한 바와 맥락을 같이한다. “데이터가 수백 개에서 수억 개 그 어느 지점에서도 유의미한 인공지능이 만들어질 수 있다.”

실제 알고리즘랩스라는 기업에서 대표이사로 재직하며 수많은 대기업의 인공지능 프로젝트를 총괄해 오고 있는데, 이 과정에서 수백 개 수준의 데이터를 활용하여 인공지능을 구축해야 하는 상황도 있었다. 실제 수백 개의 데이터로 만들어진 인공지능이 제조업 현장에서 기존의 프로세스보다 약 3배 높은 수준의 정확도 향상을 달성하며 성공적으로 실무에 적용된 프로젝트를 직접 총괄한 경험이 있다. 앤드류 응과 같은 수많은 경험을 보유한 인공지능 업계 전문가의 조언과 실제 현장에서의 경험이 일치하는 것을 토대로, 현재 보유한 데이터 내에서 타당성 검증 수준의 인공지능 프로젝트를 도전적으로 진행하는 것을 권장한다. 이 과정에서 유의미한 인공지능의 성공 사례가 도출될 수 있으며, 성공하지 못한 경우에도 부족한 데이터를 보다 상세하게 채워나갈 수 있는 구체적인 전략과 원동력이 생길 것이다.

빅데이터가 없더라도 성공적인 인공지능이 도출될 수 있는 기술적인 이유는 다음과 같다. 데이터가 적으면 적은 대로, 많으면 많은 대로의 적합한 인공지능 알고리즘이 존재한다. 소위 말하는 인공신경망을 토대로 한 딥러닝의 경우에는 수많은 데이터가 있을 때 일반적으로 좋은 성능을 발휘하게 된다. 하지만 주어진 데이터가 많지 않을 때는 딥러닝과 같은 복잡도가 높은 기술 외에 활용할 수 있는 트리 기반의 머신러닝 알고리즘, 선형 회귀 계열의 알고리즘 등으로도 충분히 의미 있는 성능의 인공지능이 도출될 수 있다. 그리고 이를 토대로 문제를 해결할 수 있다. 중요한 것은 어떤 알고리즘을 쓰는지가 아닌, 주어진 데이터로 최적의 기계학습 알고리즘을 접목하였을 때 기존 프로세스 대비 효과가 뚜렷하게 있는지의 관점으로 보는 것이다.

많은 기업이 데이터 보유 상황에 대하여 부정적인 인식으로 바라보고 있다. 하지만, 현재 보유한 데이터로 어디까지 인공지능이 활용될 수 있는지를 경험하는 프로세스를 확보할 수 있다면, 그 어떤 조직보다도 인공지능을 효율적으로 구축할 수 있는 원동력을 가지게 될 것이다.

마지막으로 인공지능 적용 영역을 구체적으로 정의할 수 있으며, 실제 워크플로우를 실행할 수 있는 인공지능 실무 인재 양성에 대한 관점에서의 방향성을 제안하고자 한다.

인공지능 기술은 최근 대중화되는 흐름에 있다. 대중화된다는 것은 곧 인공지능을 뛰어난 개발자 혹은 데이터 과학자만 활용하던 시기를 지나, 컴퓨터 공학을 전공하지 않은 비전문가들도 활용할 수 있는 시기가 도래하고 있다는 것을 뜻한다. 인공지능이 대중화되는 시기에 맞추어 인공지능 실무 인재 양성 전략을 구상할 필요가 있다. 4~5년 전만 하더라도 인공지능 기술의 장벽이 높았고, 소위 말하는 코딩, 수학, 알고리즘 등의 이해를 필수적으로 했어야만 했다면, 최근에는 No-code AI 기법 등이 활발하게 연구되고 상용화되며 어려운 코딩이나 수학 지식 없이도 인공지능을 이해하고 활용할 수 있는 기반이 갖추어졌다.

따라서, 산업 지식을 보유하고 있는 도메인 전문가에게 어려운 코딩이나 수학을 습득할 것을 강요하는 것보다, 위 AI 대중화 흐름에 있는 기술을 활용하여 인공지능을 경험할 수 있다면 가장 효율적으로 인공지능 적용 영역을 도출할 수 있을 것으로 판단한다. 실제 알고리즘랩스에서는 국내 100여 개 기업을 대상으로 단기간 내에 인공지능 실무 인재를 양성하는 과정을 운영하였으며, 이 과정을 통하여 약 5천여 개 이상의 구체적인 인공지능 적용 기획서를 도출한 경험을 가지고 있다.

가트너에 따르면, 2023년 인공지능이 계몽의 단계를 지나, 생산 안정기 수준의 기술로 성숙할 것으로 보고 있다. 생산 안정기라는 것은 인공지능의 확산기가 도래한다는 것이며, 인공지능의 확산기에는 조직마다 수천, 수만 개의 인공지능 도입을 고려할 것으로 판단된다. 이러한 흐름에 맞추어 인공지능 기술을 조직의 생산성, 효율성 관점에서 적재적소에 활용하는 기업이 인공지능 시대의 따라잡을 수 없는 격차를 보유한 기업으로 성장할 것이다. 실제 미국 브루킹스 연구소는 앞으로 10년 안에 AI 리더십을 쟁취한 국가와 기업이 2100년까지 세계 AI 시장을 주도할 것으로 전망하고 있다. 내부 산업 전문가를 인공지능 실무 인재로 양성하며 데이터가 쌓이길 기다리는 관점의 소극적인 접근보다 현재 보유한 데이터로 적극적인 인공지능 프로젝트를 실행할 수 있다면 AI 리더십을 쟁취할 수 있을 것으로 기대한다.