SPECIAL ISSUE 04

04 - 빅데이터와 인공지능의 제조업 적용 경험을 통한 스마트팩토리에 대한 소고

12.png

11.png

▲ 이종석 부교수
성균관대학교 공과대학 시스템경영공학과


빅데이터와 인공지능의 제조업 적용 경험 통해 스마트팩토리의 실현 가능성을 보았다.

그러나 여러 장애물이 존재하며, 이를 극복하기 위해서는 구성원의 동의와 협업이 반드시 필요하다.

설비-센서-통신-데이터저장-분석의 구조에서 어느 한 곳에서라도 단절이 발생하면 스마트팩토리는 실현이 불가능하다. 동의와 협업이 필요한 이유이다.



스마트팩토리는 단순히 사람의 노동력을 대체하는 공장 자동화에서 한 발 더 나아간 형태로서, 공장이 스스로 판단하고 이에 따라 작업을 수행할 수 있는 지능화된 공장으로 정의될 수 있다.

이러한 정의에 부합하기 위해서는 공정 전반에 걸쳐 수집되는 데이터로부터 현상을 학습(Learning)하고, 학습된 결과를 스스로 공정 제어나 공장의 운영에 반영할 수 있는 기능이 탑재되어야 한다.

즉, 요사이 자주 회자되는 빅데이터와 인공지능의 제조업 적용이 바로 우리가 지향하는 이상적인 스마트팩토리의 모습일 것이다.

하지만 4차 산업혁명의 한 핵심 분야로서 정부나 기업의 큰 관심을 받는 것에 비하여, 이처럼 지능화된 — 스스로 학습하는 — 공장의 사례는 찾아보기 어려운 실정이다.

스마트팩토리의 선두주자로 알려져 있는 Siemens나 GE의 공장 자동화 솔루션(Siemens의 MindSphere, GE의 Predix)에도 이러한 기능은 아직 구현되어 있지 않다.

필자는 지난 2년 동안 국내 철강회사와의 산학 프로젝트를 통하여 이러한 기능의 구현을 위하여 노력하여 왔고, 그 경험을 회고하는 형식으로 이 글을 작성하고자 한다.


스마트팩도리 구현의 어려움

살아있는 시스템에서 수집되는 데이터는 분석하기에 만만하지 않다.

살아있는 시스템에 명령을 내리는 것 또한 쉽지 않다. 대상 시스템이 24시간 연속공정이라는 것도 상당히 큰 어려움이다.

예상치 못하게 공정환경이 급변하는 상황이 생기기도 하고, 설비 정비나 또 다른 이유들로 생산라인이 정지했다가 다시 가동하기를 반복한다.

정상 범위 밖의 데이터가 소리 없이 데이터베이스에 쌓이기도 하고, 정상 범위이지만 센서의 오작동으로 편차가 크게 발생하는 데이터가 오기도 한다.

이는 더 알아채기 어렵다. 그러다가 어느새 다시 정상 상태로 되돌아온다. 참으로 변화무쌍한 시스템을 대상으로 올바른 데이터를 선택해서 모델을 학습해야 하고, 개발된 알고리즘을 현장에 적용하기 위해서는 기존 조업자가 당황하지 않는 제어값을 산출해야 한다. 즉, 현장적용의 “벽”이 존재한다.

스마트팩토리 구현의 연구대상이었던 도금공장(CGL, Continuous Galvanizing Line)은 길이가 약 800m이고 가장 높은 곳의 높이는 10층 높이 규모인데, 이 안은 곳곳이 고온과 고압의 극한 상황들로 구성되어 있다.

잘 계획되어 한눈에 들어오는 공간에 몇개의 블록으로 테스트베드를 구성해 놓고 데이터를 수집하는 상황과는 거리가 있다.

심지어 제어가 잘 되는지 여부도 눈으로 직접 확인할 수 없고, 제품의 품질을 결정하는 조업 결과의 수치는 하루 정도 시간이 지나야 알 수 있는 경우도 있다.

논문이나 책에서 말하고 있는 지식들을 실제 현장에 적용하는 일은 지식에 도전하는 것 이외의 다른 성격의 도전들이 기다리고 있으며, 그것들을 하나하나 극복하는 데에는 늘 겸손함과 믿음이 있어야 한다.

여기서 겸손함이란 일이 뜻대로 풀리지 않는 것은 남 탓이 아니라 내 탓이라 생각하는 자세이다.

또한 문제를 해결하기 위해서는 충분한 데이터가 확보되어야 한다. 공장에서는 충분한 데이터를 제공하고 있다고 믿고 있지만, 사실은 그렇지 않다는 점도 큰 어려움 중 하나이다.

쓸모 있는 데이터의 부족함을 늘 설명해야 했고 설득해야 했다. 최근 모 대학 교수가 쓴 인공지능이 데이터 없이도 가능하다는 자극적인 타이틀의 글을 읽은 적이 있는데, 글의 의도는 알겠으나 대중을 대상으로 그렇게 쉽사리 던지는 말은 필자에겐 너무 야속하게 느껴진다.

인공지능의 기반이 되는 머신러닝 기법들은 대부분 정적인(Static) 상태를 가정하고 개발된 것들인데, 이런 방법들을 동적인(Dynamic) 시스템에 적용하는 일도 새로운 알고리즘을 개발하는 측면에서 그리 쉬운 일은 아니다.

우리는 스마트팩토리가 곧 눈앞에서 구현이 될 수 있을 것처럼 말하고 있지만, 위에 언급된 어려움들 이외에도 극복해야 하는 많은 어려움들이 있다.
 
간략히 요약하면, 설비/환경-센서-통신-데이터 저장-분석/처리의 구조에서 어느 하나의 연결고리에서라도 오류가 발생하면 우리가 지금 스마트팩토리라고 부르는 것은 구현이 불가능하다. 그러나 이 연결 구조에 오류가 존재하는 것이 현실이다.


인공지능에 대한 환상과 반감의 공존

빅데이터와 인공지능에 대한 관심은 반갑지만 부담스러운 일이다. 필자의 연구팀은 철강 산업에서 인공지능을 적용하는 프로젝트들의 수행을 통해 매우 좋은 경험을 했다는 것에 동의한다.

이런 기회를 가질 수 있었던 것은 매우 감사한 일이고, 이는 결국 사람들 사이에 회자되는 빅데이터와 인공지능에 대한 큰 관심 덕분이다.

하지만 비전공자들과 일반인들에게 인공지능은 그 어떠한 돌발 상황도 예측할 수 있어야 하고 그것들을 미리 대응할 수 있는 “만능”이어야 한다.

이세돌을 이기는 알파고라면 데이터의 오류조차도 쉽게 알아채고 대응할 수 있어야 한다고 생각한다. 99%의 정확도로 예측할 수 있을 것이라고 그래야 한다고 믿고 있다.
 
측정의 과정에서 데이터에 발생하는 불가피한 오류조차도 학습하면 예측할 수 있는 것이 아니냐고 묻는다. 왜냐하면 그들은 누군가 그렇게 말한 것들을 들었기 때문이다.

하지만 지금 기술력은 그렇지 못하다. 어쩌면 필자의 연구팀의 기술력이 그렇지 못한 것일지도 모르겠다.
 
동시에 누군가는 이것 또한 과거 여느 다른 기술들이 유행처럼 지나갔듯이 그렇게 지나갈 것이라고 믿는다.

바둑에서는 그럴 수 있을지 모르지만, 자신이 십 수 년 또는 그 이상의 시간을 쏟아온 분야에 감히 회귀모형의 사촌쯤으로 보이는 무언가가 하루아침에 더 나은 결과를 절대 산출할 수 없을 것이라고 믿는다.

그런데 이들은 그런 믿음을 마음속에 품고는 필자의 연구팀이 산출한 결과물이 “만능”이 아니라는 점을 비난하는 이중성을 보이기도 한다.


유행 지난 방법들의 가치

필자의 연구팀이 도금공장에서 지능화를 시도한 부분은 도금부착량 제어, 후처리부착량 제어, 그리고 합금화도 제어 이렇게 세 부분이다.

앞서 언급한 바와 같이 도금공정 전반에서 수집되는 데이터를 학습하여 스스로 설비를 제어하는 알고리즘을 개발하는 것이 필자의 연구팀에게 주어진 임무였다.

필자의 연구팀은 주어진 데이터 및 기타 환경에서 시도할 수 있는 거의 모든 것을 했다는 것에 동의하였고, 그렇게 만들어진 알고리즘은 안정적으로 결과를 예측하고 설비를 제어할 수 있게 되었다.

조업자가 어떤 상황에 늦게 대응한 반면 개발된 인공지능 알고리즘은 미리 대응하는 제어값을 산출하기도 하고, 수동 조업에 비해 더 정밀하게 도금부착량을 제어할 수 있는 기술은 최근 국가핵심기술로 지정이 되었다.

요즈음 머신러닝과 인공지능 분야에서 가장 각광을 받는 기술은 단연코 딥러닝일 것이다. 하지만 필자의 연구팀은 위의 프로젝트들을 수행하는 과정에서 그 어떤 딥러닝 기법도 직접적으로 활용하지 않았다.

물론 유사한 측면은 있다. 필자의 연구팀이 개발한 알고리즘들은 크게 보면 신경망과 비선형최적화의 조합인데, 신경망의 구조를 도메인에 적합하게 변형하여 사용하였고 최종 제어 최적해를 산출하는 전략에 약간의 아이디어를 더했다.

수십 개의 모델을 확보하여 가장 적합한 모델을 예측과 제어에 활용하는 구조로 설계하였다.
 
이 유행 지난 기법들의 변형 및 적절한 조합은 성공적으로 의도한 대로 움직여주고 있다. 인공지능이란 예측과 최적화로 귀결될 수 있다.

최근 유행하는 딥러닝과 강화학습은 결국 예측을 더 정확히 하고, 최적화를 더 잘하기 위한 최신의 방법들인 것이다.

그러나 모든 상황에 딥러닝과 강화학습의 조합이 최선의 선택은 아닐 것이다.

필자의 연구팀이 개발한 알고리즘의 학습 부분에 대해서만 간략히 언급해 보고자 한다. 최초에는 Fully-connected 구조로 신경망을 학습하였으나, Response surface들을 관찰해 본 결과 물리현상에 위배되는 신경망이 학습되고 있음을 발견하였다.
 
단지 에러를 최소화시키는 것밖에 모르는 기본 신경망 구조가 물리현상에 대해 알 리가 없다. 데이터가 그런 것이라면 그럴 것이라고 믿는다.

그래서 우리는 도메인 지식을 반영하여 Grouped and partially connected 구조의 신경망을 학습시키되, 물리현상에 위배되지 않는 신경망 학습을 위한 Optimization 과정에 Weight constraints를 추가하였다.

신경망 학습을 위한 Optimization을 속도 향상과 제약식 추가를 위해 Gradient descent에서 Quasi-newton 계열의 BFGS-B로 바꾸어 기본 Back-propagation 알고리즘을 변형하였다.

이제 말이 되는 Response surface들이 나오기 시작하였다. 시간을 Primary key로 하여 데이터가 수집되므로, 데이터베이스 내한 Record는 시간을 기반으로 쌓이게 된다.
 
이러한 데이터를 Query해 오고, 이를 다시 코일의 Locationbased로 바꾸어 학습 데이터를 준비하는 데 상당히 오랜 시간이 걸리기 때문에 신경망의 학습시간을 반드시 줄여야 했고, 이러한 상황에서 딥러닝의 심층신경망은 좋은 선택이 아니었다.

학습 도중에도 공장은 살아서 움직이고 있다.


가능성과 새로운 B2B 비즈니스 기회

앞서 언급한 바와 같이 여러 어려움이 존재함에도 불구하고 필자의 연구팀은 스마트팩토리의 실현 가능성을 보았다.

적어도 지난 2년간의 연구 대상이었던 도금공장에서는 반드시 실현될 수 있을 것이라고 믿는다.
 
공정 데이터로부터 모델을 학습시키고, 학습된 모델을 활용하여 최적의 제어값을 산출하는 것이 가능하다는 것을 확인하였다.

사람이 제어했던 이 공정은 이제 개발된 알고리즘인 인공지능이 맡아줄 수 있을 것이다.
 
단언컨대, 필자의 연구팀이 개발한 알고리즘들은 현재 조업자들의 조업 부담을 상당히 경감시켜줄 수 있을 것이다.

가능성을 확인하였으면, 황당하겠지만 이제 처음부터 새롭게 다시 제대로 시작해야 한다.

소위 Smart CGL의 실현을 위해서 이제 CGL 전체를 대상으로 연구를 시작해야 한다. 도메인 전문가와 철저한 조사를 통해 현재 수집되지 않는 필요한 정보가 있다면 추가로 수집해야 한다.

안정적으로 정확한 데이터를 수집하기 위해서 센서를 담당하는 전문가는 당연히 필요하며, 이때 이 데이터를 저장하고 활용하는 DB 전문가나 요샛말로 데이터 사이언티스트의 동시 협업이 수반되어야 한다.

이러한 일들이 가치 있는 이유는, 이것은 매우 큰 비즈니스 기회로 이어질 수 있기 때문이다.

세계에서 생산량 규모가 가장 큰 국내 P사가 보유하고 있는 도금라인은 십여 개 정도인데, 전 세계에 약 300개 정도의 도금공장이 있다고 한다.
 
Smart CGL을 운용할 수 있는 솔루션이 개발이 된다면 전 세계의 다른 철강회사의 동일 공정에 적용할 수 있을 것이고, 이는 새로운 B2B 비즈니스 기회로 이어질 수 있음을 보여준다.

필자는 제조업은 반드시 이러한 방향으로 흐르게 될 것이라고 믿으며, 이것이 바로 현재 미국의 GE나 독일의 Siemens가 스마트팩토리라는 이름으로 그들의 사업 방향을 전환하고 있는 것과 일맥상통한다.


스마트팩토리를 위한 인력양성

이렇듯 새로운 비즈니스 기회의 시대가 오고 있음에도 불구하고, 이 시대를 준비할 관련 인력이 부족하다.
 
특히, 전문적으로 데이터를 분석하고 해당 기술을 도메인에 적절히 변형하여 적용할 수 있는 인력은 매우 부족한 것이 현실이다.

사실 인력에 대한 논의가 우리 사회 곳곳에서 이루어지고 있으나, 유행에 편승하여 얕은 지식의 함양으로 교육의 방향이 흘러가지는 않을까 기우가 앞선다.

우리는 긴 호흡을 가지고 전문 인력을 양성해야 할 것이다. 고급 분석가는 단기간에 육성될 수 없기 때문이다.

데이터의 크기와 종류가 다양하듯이 분석 기법도 활용 목적에 따라 그 종류가 매우 다양하며, 문제 상황에 적절한 분석 기법을 선택하는 것, 데이터에 적합하게 기존의 기법을 수정하는 것, 선택된 기법들을 적절히 조합하고 설계하는 것, 이 모든 것들은 분석 기법 내부에 대한 이해가 없으면 불가능하다.

또한, 분석 기법을 사용할 수 있도록 원시 데이터를 가공하고 정제하는 과정에도 큰 노력이 수반되어야 한다.

이를 가능하게 하기 위해서는 확률 및 통계에 대한 지식, 최적화 기법에 대한 지식, 컴퓨터 알고리즘, 데이터를 다루거나 알고리즘의 구현을 위한 프로그래밍 스킬 등이 필수적이다.

즉, 선형대수, 확률론, 통계, 최적화 등 기반 지식에 초점을 맞춘 교육이 이루어져야 한다. 이처럼 기본에 충실하지 못하면, 데이터 시대가 필요로 하는 인재가 될 수도, 인재를 육성할 수도 없을 것이다.


인공지능의 활용에 대한 구성원의 동의

가능성을 직접 경험한 필자는 이제 미래는 진정으로 이러한 방향, 데이터를 활용하여 가치를 창출하는 그런 방향으로 흘러갈 것이라는 생각이 든다.

여러 언론매체를 포함한 사회 곳곳에서 이미 언급되었듯이, 이제는 진정으로 대체하는 인력과 대체되는 인력에 대한 사회적 논의가 필요한 때라고 느끼게 되었다.

인공지능이 활용 가능한 영역은 가까운 미래에 점차 사람의 자리를 인공지능이 대체하게 될 것이다.

개인적으로 물론 아직 제조업은 사람과 인공지능이 공존하는 것이 가장 이상적이라고 생각하지만 말이다. 이러한 변화가 그 누구에게도 불행을 주지 않았으면 좋겠다는 생각을 해 본다.