최근 기업들은 인공지능을 기반으로 의미 있는 의사결정을 하기 위해 다양한 데이터 분석을 진행하고 있다. 기본적인 방식인 기초통계분석부터 높은 수준의 인공지능에 이르기까지, 데이터 분석의 공통점은 데이터 속에 숨어 있는 의미 있는 패턴을 기반으로 분석을 진행한다는 것이다. 이렇게 데이터 분석을 기반으로, 인공지능을 적용하여 의미 있는 의사결정을 하기 위해서는 고려해야 할 중요한 사항들이 있다. 본 고에서는 이와 관련한 필자의 경험을 토대로 인공지능을 활용한 데이터 분석을 논하고자 한다. 이 글의 내용은 모두 실제 필자가 비즈니스와 프로젝트에서 경험한 바를 기반으로 한다.
데이터 특성을 고려한 모델링
데이터는 각각 다양한 패턴과 고유의 특징을 가지고 있다. 그러므로 일반적인 책에서 언급되는 유명한 방법론을 그대로 적용한다고 해서 의미 있는 성과를 도출하기는 어렵다. 여러 산업에서 다양한 타입과 패턴을 가진 데이터들이 존재하기에 각 데이터의 특징을 분석하고 학습 및 예측할 수 있도록 적합한 모델을 적용해야 한다. 각 데이터의 유니크한 특성을 잘 학습할 수 있는 모델링이 추가되어야 의미 있는 결과를 도출할 수 있다.
Digitization
데이터는 다양한 환경에서 새롭게 수집될 수 있고, 기존과는 다른 방법을 통해 다른 유형으로 데이터화될 수 있다. 따라서 기존에 보유한 데이터만 분석하고 결과를 내야 한다는 강박관념에 갇혀 있어서는 안 된다. 데이터 수집은 다방면에서 높은 기술력을 기반으로 진행될 수 있기에, 넓은 시야를 가지고 의미 있는 데이터를 수집·활용하여 분석을 수행하여야 한다. 여기에 추가 데이터까지 고려한다면, 기존에 성공하지 못했던 미션들도 새롭게 의미 있는 결과로 전환할 수 있을 것이다.
유의미한 데이터
‘의미 있는 인풋이 없다면, 의미 있는 아웃풋은 절대 만들어 낼 수 없다.’ 빅데이터 시대가 열려 수많은 데이터가 쏟아져 나오면서 인공지능이 더욱 활성화되었다. 그러나 빅데이터는 수많은 노이즈를 함께 가지고 있을 가능성이 높다. 모든 빅데이터를 분석에 적용하게 되면 이와 같은 노이즈도 함께 모델에 학습되어, 오히려 안 좋은 영향을 줄 수도 있다. 그러므로 인공지능을 적용하기 전에, 보유한 데이터를 기반으로 유의미한 정보를 추출하고 의미 없는 노이즈를 제거하는 과정은 필수적이다.
통계와 인공지능
기존 인공지능의 한계점 중 하나는, 원인을 파악하려는 노력은 없이 그저 예측정확도 향상에만 집중했다는 점이다. 하지만 요즘에는 원인을 설명할 수 있는 인공지능도 활발히 연구되고 있어, 그 가치가 더욱 높아질 예정이다.
스마트 팩토리와 인공지능
현재 인공지능은 다양한 분야에 적용되고 있는데, 가장 빠르고 정확하게 인공지능의 효과를 누릴 분야는 많은 데이터가 쌓이는 분야가 될 것이다. 대표적인 분야가 스마트 팩토리로, 이 분야에는 일정하고 명확한 패턴이 존재하며 다양하기보다는 한정된 패턴의 데이터가 많이 쌓인다.
이러한 스마트 팩토리의 특성에 적합한 인공지능을 활용한 데이터 분석 예로는, 첫 번째로 ‘고속데이터 분석 기반 이상 감지 시스템’을 꼽을 수 있다. 이 시스템은 진동 데이터와 같은 고속데이터를 기반으로 하여, 상세한 분석을 통해 명확한 패턴을 학습한다. 이후 이상 패턴을 감지하여 불량품이나 기기의 고장을 예측하는 데 효과적으로 사용될 수 있다.
두 번째 예로는, 컴퓨터 비전 기술을 활용하여 사람의 패턴을 인식하고 로봇에 적용한 사례를 들 수 있다. 앞으로 사람의 단순한 행동 패턴뿐만 아니라 다양한 행동 패턴을 모두 학습하여 기계에 적용하게 된다면, 기계에 많은 사람들의 효율적인 행동이 학습되어 사람보다 정확하고 효과적인 움직임이 가능한 로봇이 탄생할 것이다.
[그림 1] 사람의 패턴을 인식하여 로봇에 적용한 사례