본문 바로가기

기획

[165호] 인공지능의 창의성

[출처:pixabay]

 

박 우 승 기자

 

지난 2016년, 이세돌 9단이 인공지능 프로그램 알파고에 패배를 안긴 충격은 인류가 AI와 공존하는 탈인간중심주의적 포스트 휴먼 시대의 개막을 알리는 신호탄이었다. 그리고 7년이 지난 현재, 인류에게 생소했던 AI는 사회의 다양한 분야에서 자연스럽게 활용되고 있다. 돌이켜보면 불과 10년도 지나지 않은 사이에 공상과학 소설이나 영화에서나 볼 수 있었던 AI는 어느새 일상의 곳곳에 스며들었고, Chat-GPT의 출시로 인해 AI는 대중들 사이에서 한층 더 보편화되었다. Chat-GPT는 출시 이후 대중들의 상상력을 사로잡으며 다양한 분야에서 광범위한 관심을 받았다.

 

특히 Chat-GPT의 인간과 유사한 텍스트를 이해하고 생성하는 높은 언어 능력, 다양한 용도에 활용될 수 있는 다재다능한 특징, 창의적인 작업을 수행할 수 있는 능력은 다양한 영역의 전문가와 대중들 사이에 서 큰 관심을 불러일으켰다. Chat-GPT의 등장은 1994년의 웹 브라우저, 1998년의 구글 검색엔진, 2007년 아이폰의 등장과 같은 IT계의 게임 체인져가 되고 있다고 해도 과언이 아니다.

 

인공지능의 언어모델

 

Chat-GPT의 언어능력에 대해 구체적으로 알기 위해선 먼저 챗봇의 언 어 모델(language Model)에 대해 이해할 필요가 있다. 챗봇의 언어 모델 은 챗봇이 인간과 같은 언어로 원활한 소통을 할 수 있게 만들어 주는 중 요한 기능을 한다. 챗봇의 언어 모델은 크게 통계를 활용한 언어 방식과 인공신경망을 이용한 언어 방식으로 나뉘는데, 통계를 활용하는 언어 방 식은 규칙 기반 모델(Rule based Model)로 불린다.

 

규칙 기반 모델은 인간처럼 자동적으로 학습되지 않고 오로지 인간이 넣은 규칙에 대해서만 기능한다는 특징이 있으며, 쇼핑몰, 기업 등의 고객상담센터에서 주로 활용되고 있다. 독자들도 간혹 웹사이트, 앱 등의 고객 문의 센터에서 챗봇이 서비스 문의에 정해진 같은 말만 되풀이하며 정확히 원하고자 하는 답변을 주지 못해 답답한 나머지 고객센터로 전화했던 경험이 있을 것이다. 이처럼 규칙 기반의 챗봇은 정해진 시나리오를 통한 단순한 대화나 특정한 목적에 적합하고 비용 측면에서 효율적일 수 있지만, 복잡한 대화 흐름이나 유연성이 요구되는 상황에서는 명확한 한계점이 존재한다.

 

반면, 러닝 기반 모델(Learning based Model)은 대용량 데이터를 단기간 내에 스스로 학습할 수 있고 인간이 직접 하던 기존의 패턴 추출 작업을 생략할 수 있다는 특징을 지니고 있다. 따라서 러닝 기반의 챗봇은 규칙 기반의 챗봇에 비해 유연하고, 다양한 범위를 넘나들며 활용성이 매우 높다. 과거 러닝 기반 모델에는 데이터를 순차적으로 처리하는 순환신경망(Recurrent neural network, RNN) 알고리즘만이 존재하였다. 해당 알고리즘은 데이터를 동시다발적으로 학습하지 못하기 때문에 학습하는 속도가 느리다는 치명적인 단점이 있었다. 하지만 대량의 데이터셋을 한꺼번에 학습할 수 있는 ‘트랜스포머(Transformer)’ 알고리즘 개발 이후, 해당 알고리즘이 방대한 양의 데이터를 단시간 내 학습 가능하다는 점에서 트랜스포머 모델은 최근 빅테크 기업들이 고차원적인 챗봇을 개발하는 데 적극적으로 활용되고 있다.

 

정리하자면 기존의 러닝 기반 모델은 주로 순환신경망 알고리즘으로 설계되었지만, 트랜스포머 알고리즘 기반의 러닝 모델이 더 빠른 학습 속도와 순환신경망 알고리즘의 문제점들을 보완할 수 있어 현재 러닝 기반 모델에서 주류 알고리즘으로 사용되고 있다. 특히 엄청난 양의 데이터가 학습되어 있다는 부분에서 유연성은 물론, 폭넓고 다양한 분야들에 대해 전문 지식을 가진 인간처럼 대화를 나눌 수 있기 때문에 트랜스포머 알고리즘으로 설계된 인공지능은 높은 다용도성을 지니고 있다. ChatGPT를 비롯한 구글의 바드(Bard), 마이크로소프트의 튜링 NLG, 페이스북의 ROBERTA 등의 챗봇들이 그 예시이다.

 

인공지능의 매개변수

 

최근 출시되고 있는 Chat-GPT, 바드(Bard), 빙(Bing)과 같은 챗봇의 기본적인 원리는 알고리즘 자체적으로 찾아낸 답을 반영하여 실제값과 출력 값을 최소화하는 가중치를 찾아나가는 메커니즘으로 구성되어 있다. 이때 가중치는 매개변수(Parameter)라고 불리며, 학습 데이터와 매개변수의 양이 많을수록 인공지능의 답변에 대한 오차는 줄어들고 정답률이 높아진다고 볼 수 있다. 인간에게 ‘학습’은 두뇌에 기억하고 이해하며 익히는 것을 뜻하지만, 인공지능에게 학습은 인간처럼 이해하는 것이 아닌, 매개변수로 학습 결과물이 수치화된다.

 

 하지만 인간의 지능이 많은 요소와 맥락에 따라 다양하게 표현되기 때문에 아이큐 하나만으로 모든 측면을 평가하는 것이 적절하지 않듯이 해당 인공지능이 보유한 매개변수의 숫자만으로 인공지능의 성능을 평가하기엔 어렵다. 실제로 최근 Chat-GPT의 대항마인 구글(Google)사의 바드(Bard)가 제임스 웹(James Webb) 우주 망원경에 대한 정보를 잘못 대답하는 실수가 보도된 후 구글에 약 1,000억 달러(한화 약 126조 4,000억 원)의 손실을 입히기도 하였다. 그럼에도 불구하고 매개변수가 인공지능의 잠재력을 평가하는 데 있어 중요한 지표임은 부정할 수 없는 사실이다.

 

Chat-GPT가 등장하기 전 가장 많은 매개변수를 지녔던 마이크로소프트(MS) 사의 튜링 NLG는 170억 개의 매개변수를 지녔지만, Chat-GPT 서비스는 GPT-3.0의 매개변수가 1,750억 개라는 점에서 기존의 최고 서비스에 비해 약 10배 이상의 성능을 가진 채 출시되었다. 해당 기준도 현재 Chat-GPT 서비스에 탑재되어 있는 GPT-3.5(유료버전은 4.0)의 매개변수 숫자가 공식 적으로 공개되지 않았기 때문에 GPT-3.0을 기준으로 할 때의 이야기다. 

 

더욱이 마이크로소프트사가 빠르게 경쟁을 포기하고 OpenAI와 파트너십을 체결한 후 2019년도부터 OpenAI는 마이크로소프트의 막대한 투자금과 슈퍼컴퓨터 기반의 클라우드 지원을 등에 업었다. Chat-GPT는 그야말로 적토마를 얻은 여포가 되었다고 볼 수 있었다. 결과적으로 GPT 모델의 어마 어마하게 많은 매개변수와 마이크로소프트의 전폭적인 기술 지원으로 인해 사용자 입력 문장을 높은 수준으로 이해하고, 각종 분야의 온갖 데이터들을 학습하여 해당 분야의 전문 지식을 가진 사람과 대화하는 것처럼 자연스럽게 의사소통할 수 있는 Chat-GPT 서비스가 대중에게 제공된 것이다.

 

인공지능의 창작물

 

Chat-GPT는 전통적으로 인간만이 할 수 있다고 믿었던 창작 분야에서도 폭넓게 활용되고 있다. 인공지능에 의해 만들어진 창작물의 창작 주체 가 인간인지 혹은 인공지능인지에 대한 논의와 함께 소설, 시, 그림, 음악 등 다양한 창작 분야에 Chat-GPT를 활용한 창작이 어떻게 적용될 수 있는지에 대한 논의 또한 대중 사이에서 활발히 진행되고 있다.

 

Chat-GPT는 사용자와의 대화에서 창작에 관한 다양한 의견과 관점을 제공한다. 사용자가 해당 분야에 대한 이해를 넓힐 수 있도록 새로운 시각을 제공하며, 독후감, 논문, 리포트, 소설, 가사, 시, 작곡 등의 창작 능력에서도 출중한 창작 능력을 지니고 있다. 특히 소설, 시와 같은 문학 장르에서는 창작자의 상상력과 언어적 기술이 요구되는데, Chat-GPT가 상상력과 언어적 기술을 인공지능 언어 모델로 결합하여 창작 과정에 참여할 수 있는 일종의 도구로서의 역할 수행이 가능하다. 따라서 창작자는 Chat-GPT 와의 상호작용을 통해 새로운 플롯, 주제 등의 다양한 아이디어와 문장 구성, 서술 스타일 등의 다양한 문학적 기술을 개선하여 창작자의 의도에 맞는 독특한 창작물을 만들 수 있다. 심지어 Chat-GPT는 문학 장르뿐만 아니라 음악 장르에서도 작곡이 가능하다. 예를 들어 Chat-GPT에게 원하는 코드로 진행되는 곡을 작곡해 달라고 할 수 있고, 그에 맞는 가사와 심지어 재즈풍 등의 상세한 음악 장르까지도 짧은 시간 안에 손쉽게 만들 수 있다.

 

이와 같이 Chat-GPT와 같은 인공지능은 이상적인 면에서 창작자의 창작 과정을 다각도로 지원할 수 있고, 창작 영감을 자극할 수 있으며, 피드백을 제공하여 창작자가 더욱 효과적인 창작 내용을 찾을 수 있도록 도와줄 수 있기에 일종의 가치 있는 파트너처럼 느껴진다. 하지만 이는 어디까지나 Chat-GPT가 이상적으로 쓰였다고 가정했을 때의 이야기이다. 반대로 생각한다면 Chat-GPT가 제공하는 아이디어와 표현들은 전부 과거 인간들이 만들었던 자료들로 구성된 것들이기 때문에 독창적이라고도 볼 수 없다. 만약 창작가로서 인간의 주체성이 전혀 들어가 있지 않고 오로지 인공지능에게 모든 창작을 맡긴다면 해당 창작물에 대한 결과물은 창작자 고유의 창작물로 볼 수 있는지, 인공지능의 창작물이 그저 재탕한 것이 아닌 독특하고 고유한 창작물이라고 볼 수 있는지 우리는 스스로 끊임없이 질문을 던질 필요가 있다.

 

지난해 9월, 미국의 ‘콜로라도 박람회 미술대회’의 디지털예술/디지 털사진 부문에서 <스페이스 오페라 극장> 작품으로 1위를 차지한 Jason M. Allen은 자신이 문자를 이미지 그래픽으로 변환시켜 주는 인공지능 미 드저니(Mid-journey) 프로그램을 사용해 수상했다는 것을 밝힌 바 있다. 해당 수상 부문에서는 디지털 기술을 활용하여 이미지를 편집하는 행위가 허용되기 때문에 대회 규정을 어기지 않은 것으로 간주하였는데, 많은 예술가들은 예술의 죽음, 인간의 패배, 인공지능의 공포 등을 주장하며 수상에 대해 분노한 바 있다. 단 몇 개의 문구와 몇 번의 클릭으로도 미술 작품 그리고 예술가가 탄생한다는 것이 어떤 것을 의미하는지에 관한 담론은 여전히 갑론을박 중이다.

 

Theatre D&rsquo; opera Spatial(스페이스 오페라 극장)&nbsp;[출처: &copy; 2022 Jason M Allen / https://www.jasonmallen.com]

 

인간 사용자는 인공지능이 어떤 데이터에 의해 결과를 제시하는지 정확히 알 수 없다. 인간의 능력으로 매우 오래 걸리는 중간 작업은 생략된 채, 사용자는 마치 어리석고 거만한 왕과 같은 모습으로 해당 결과물만을 받아볼 뿐이다. 창작물이라는 결과에 담긴 창작 과정과 의도에 따라 창작물이 더욱 가치 있게 판단된다는 관점에서, 인공지능이 만든 창작물은 결과적으로 창작 과정 자체가 통째로 생략되고 결과물에 담긴 의미 자체가 퇴색되어 버린 것은 아닐까? 또한 언어 그 자체가 이데올로기인만큼, 인공지능이 인간의 언어를 주도할 수 있는 능력을 소유함에 따라 언어 기반으로 만들어진 인공지능의 창작물은 인간의 생각과 감각을 교묘하게 지배할 수 있는 강력한 매개체가 되어 버린 것은 아닐까?라는 걱정이 앞선다.

 

그렇기 때문에 인간은 인공지능에게 지배되거나 의존하는 것이 아닌, 주체로서의 ‘인간’을 최대한 보존하며 인공지능을 활용하는 방법을 찾아야 한다. 인간 사용자가 인공지능과의 역할 분담에 관한 권한을 가지고 있다는 점에서 인간은 주체이자 결과물에 관한 창작자로서 주된 역할을 맡고, 인공지능은 철저하게 보조적인 임무를 수행하도록 해야 한다. 특 히 단순 계산이나 문서작업과 같은 실용적인 것이 아닌 인간의 사유가 높게 필요한 고차원적인 작업일수록 ‘인간’을 보존하고자 인공지능과 인간의 영역을 구분하고, 핸들을 항해사에게 넘겨주는 것이 아닌 조타실에서 핸들을 지키는 선장으로서의 위치를 고수해야 할 것이다. 현재 정부 또는 규제 기관에서 인공지능 기술에 관한 법과 규제망 및 가이드라인을 마련하는 것에 있어 느리게 검토되고 있으므로 앞서 말했던 것과 같이 대중들과 창작자들 모두가 적절한 인공지능 통제를 위한 다양한 사회적 규범과 합의를 만들어 나가는 것이 그 어느 때보다 필요한 시점이다.

 

19세기에 최초로 카메라가 상용화되었을 때도 당시 화가들은 사진이 순수 예술의 타락으로 여겼다. 이후 20세기에 들어서며 디지털 편집 도구 및 프로그램들이 등장하였을 때도 카메라와 비슷하게 많은 비난의 대상을 받았다. 그러나 언제나 그랬듯 새로운 도구들은 대중들의 호응 속에 각기의 세계를 구축하며 새로운 시장을 열어나갔다. 앞으로 인간의 감당해야 할 노력과 과정은 더욱 줄어들고, 인공지능이 하나부터 열까지 인간에게 떠먹여 줄 수 있는 시점에서 창작영역의 인공지능이 어떤 방식으로 흘러가고, 새로운 시장이 어떻게 열릴지 기대되면서 한편으로는 무섭다는 생각이다. 아울러 우리는 인간으로서 지닌 주체성과 사유가 곧 ‘인간’ 그 자체임을 잊지 말아야 할 필요가 있다.