서강대 대학원 신문사

[170호] 번역, 결국은 사람의 일 본문

기고

[170호] 번역, 결국은 사람의 일

dreaming marionette 2024. 10. 24. 17:00

서강대학교 중국문화학과 박사, 최승혁

 

출처: 아시아경제, “[뉴 잡스] AI가 우리를 대체한다고?…코웃음치는 번역가들”

 

 

파파고 번역기 써봤어?” 지인이 물었다. 나는 10년차 중국어 번역사다. 번역을 업()으로 삼고 있는 내게 이 질문은 터무니없게만 들렸다. ‘나를 뭘로 보고......’ 그로부터 10년도 채 지나지 않은 지금, 나는 주변 사람들에게 묻는다. “GPT로 번역해 봤어?”

 

우리는 인공지능(AI)으로 대표되는 4차 산업혁명 시대에 살고 있다. 4차 산업혁명 과정에서 가장 먼저 대체될, 혹은 사라질 직업으로 통·번역사는 상위에 꼽힌다. 그렇다면 기계번역이 등장한 지 10년이 지난 지금, 게다가 챗GPT로 대표되는 생성형 AI가 최대 화두가 된 지금, 번역은 어떻게 변화하고 있으며, 인간 번역사는 무엇을 해야 할까.

 

기계번역, 그리고 번역사에게 가져온 도전

기계번역의 역사는 제2차 세계대전으로 거슬러 올라간다. 1960년대 소련과 미국에서 주로 이뤄진 기계번역 연구는 상대국 언어로 쓰인 과학 기술 문서를 빨리 해독하고자 하는 군사적 목적이 컸다(구본권, 2010). 이후 40여 년의 암흑기를 지나 기계번역은 심층학습(Deep Learning)을 적용한 신경망 기계번역(NMT)로 진화했다. 그리고 2017년 구글에서 공개한 트랜스포머(Transformer) 모델로 신경망 기계번역의 성능을 획기적으로 끌어올렸다.

 

기계번역의 눈부신 발전에도 불구하고 그 번역물을 온전히 믿고 사용하기에는 여전히 부족함이 많다. 신경망 기계번역의 등장 이후에 번역학계에서는 기계번역에서 발생하는 오류의 분석과 유형화, 인간번역과 기계번역의 비교에 관한 연구가 증가했다. 이는 기계번역의 한계를 통해 아직은 인간번역을 대체할 수 없다는 조용한 경고와도 같았다. 기계번역은 번역기마다 성능 차이 또는 텍스트 유형 등 여러 요인의 영향을 받기 때문에 일반화하기 어렵지만, 기계번역의 오류는 주로 어휘 사용과 관련한 형태적 오류, 시제나 어순 등 문법에 관련한 통사적 오류, 그리고 문화적 요소와 관련한 오류로 나눌 수 있다. 이 중에서 기계번역은 원문의 문화적 요소를 처리하는데 매우 취약하다.

[한국어 원문] 우리 집 대만 이어주면, 떡두꺼비 같은 아들 하나만 낳아주면 내, 애는 물론 처자도 평생 호의호식하며 살게 해주리다.
[인간번역] You just have to continue our line, give me a nice, fat son, and I’ll  make sure you and the child will live a happy life.
[파파고 번역] If I connect my family to Taiwan, if I give birth to a son like a rice  cake toad, I will let not only my child but also my wife and children live afavorable life for the rest of their lives.

 

위 예시는 정보라 소설 저주토끼에 사용된 문화특수항목(CSI) 중 관용어구에 대한 인간번역과 기계번역을 비교한 최연우(2024) 연구의 중 일부이다. 밑줄 친 떡두꺼비 같은 아들이라는 관용적 표현을 인간번역은 ‘a nice, fat son’으로 원문에 함축된 의미를 텍스트로 옮겨 번역했고, 파파고 번역은 완전히 직역해 ‘a son like a rice cake toad’로 번역했다. ‘떡두꺼비 같은 아들탐스럽고 튼실하게 생긴 사내아이라는 뜻으로 직역할 경우 의미가 왜곡될 수 있다(최연우, 2024:57-58).

 

여러 가지 약점에도 불구하고 기계번역의 이기(利器)는 외면당하지 않았다. 실무를 주도하는 언어서비스공급업체(LSP)의 경우, 기계번역을 활용하면 인간 번역사를 통할 때보다 시간과 비용을 크게 줄일 수 있다는 장점을 피부로 느꼈다. 그래서 일차적으로 원문 텍스트를 기계번역으로 처리한 후에 번역사가 해당 번역문을 다시 수정하는 포스트에디팅(MTPE)을 도입하고 관련 가이드라인을 만드는 데 힘썼다. 번역사는 업체의 요구에 따라 가이드라인을 준수해 기계번역의 번역물을 수정하도록 요청 받았다.

 

이전까지 번역사는 원문 텍스트를 이해, 분석하고 그 안에 녹아 있는 사회문화적 요소들까지 파악해 번역문이라는 개인의 창작물을 내놓았다. 하지만 번역업계에서 기계번역 활용이 늘어나면서 번역사의 역할은 포스트에디팅을 하는 쪽으로 축소되는 측면도 없지 않았다.

 

생성형 AI의 등장, 그리고 여러 가지 이슈

기계번역의 출현으로 번역 패러다임은 크게 요동쳤고 현재 진행형이다. 그런데 더 엄청난 녀석이 나타났다. 바로 챗GPT. 20249월 기준 o1-mini 버전까지 출시된 챗GPT는 출시와 동시에 금융, 의료, 제약, 미디어 등 셀 수 없이 많은 산업에 영향을 미치고 있다.

 

GPT챗봇 생성형 사전 학습 변환기의 약자로 챗봇의 기반은 대규모 언어 모델(LLM)이다. LLM은 일종의 AI이다. 오픈소스 LLM은 맞춤형 모델을 더욱 저렴한 비용으로 개발할 수 있어 호응이 크다. 2월 메타의 LLaMA 출시를 계기로 오픈소스 LLM을 바탕으로 한 개발 활동이 폭발적으로 늘어났다(itworld, 2023).

 

이번에도 번역은 LLM의 영향을 피할 수 없었다. 자연어 처리 기반의 LLM은 번역 품질에 있어 또 한번의 도약을 가져왔다. LLM은 문맥을 인식하고 해석하는 능력을 갖추었다. 번역할 때는 문맥(Context)을 파악하는 것이 매우 중요하다. 문맥은 단순히 앞뒤 문장과의 관계일 수도 있고, 여러 문단을 뛰어넘어 텍스트 층위로 확대해야 정확히 이해할 수도 있다. LLM은 그 안에 내장된 수천억 개의 파라미터를 통해 문장의 심층 구조와 그 안의 의미를 연계해 해석해 내고, 이를 통해 숨겨진 뉘앙스 감정, 의도 등의 복잡한 요소를 함축적으로 파악할 수 있다(강병규, 2024:36-37).

 

현재 OpenAIGPT 시리즈, 구글 제미나이(Gemini), 메타(Meta) LLaMA 등 대표적인 LLM 모델이 공개되었다. 하지만 LLM을 사용하려면 구축·운영 비용, 데이터 수집 및 보안에 이르기까지 많은 요소가 부담으로 작용한다. 최근에는 소형 언어 모델(sLLM)이 주목을 받고 있다. sLLM은 상대적으로 낮은 개발·운영 비용 및 경량화를 통해 응답속도를 높인 것 이외에도 특정 도메인에 특화할 수 있다는 장점이 있다. 최근 인텔리콘연구소에서는 법률에 특화한 sLLM코알라(KOALLA, Korean Adaptive Legal Language AI)’ 개발에 성공했다(전자신문, 2024).

 

하지만 LLM은 여러 가지 문제를 안고 있다. 가장 대표적이고 치명적인 것이 환각(hallucination)’이다. 이와 관련한 유명한 에피소드가 있다. 작년에 챗GPT에게 세종대왕의 맥북프로 던짐 사건에 대해 알려달라고 묻자 세종대왕의 맥북프로 던짐 사건은 역사 서적인 조선왕조실록에 기록된 일화로처럼 사실이 아닌 내용을 마치 사실인 양 뻔뻔하게 답변한 에피소드가 있었다(동아일보, 2004.6.21).

 

출처: IT Daily, “생성형 AI의 한계 ‘환각’, 대안으로 주목받는 RAG“

 

환각 현상은 학습데이터에 없는 부정확한 정보 또는 사실이 아닌 정보를 생성하는 것이다. 이는 오역으로 이어질 수 있는 중요한 문제이다. 특히, 정확성이 중요한 법률·의료 분야에서 환각 현상은 치명적이다.

이 밖에도 LLM을 활용해 번역을 했을 때 그 번역물에 대한 저작권 문제, 번역 내용의 편향성, 번역 윤리 등 해결해야 할 문제가 적지 않다.

 

 

기계와의 협업, 하지만 언어는 인간 고유의 능력

사람들은 전에 없던 새로운 존재를 발견하면 그것에 호기심을 갖기보다 위험성이 없는지 경계하는 방향으로 진화해왔다. 혁신으로 무장한 iPhone에 대해 시장의 반응도 처음에는 걱정 반, 기대 반이었다.

 

기계번역도 다르지 않다. 날로 새롭게 업그레이드되는 기계번역 기술에 대해 부정적인 번역사가 있는가 하면, 이를 자신의 업무에 적극적으로 활용하는 번역사도 있다. 전문번역사들의 기계번역 수용에 관한 연구(천종성, 2020)에서는 전문번역사들은 기계번역을 자신과 상충적 관계로 보기보다 유용한 도구로 인식하고 있다고 분석했다. , 기계번역과 협력하는 방향으로 인식이 전환하고 있는 것이다. 앞에서 언급한 포스트에디팅 역시 번역사의 역할 축소로 볼 수도 있다. 하지만 생각을 조금만 바꾸면 인간과 기계번역이 협업으로 나아가는 하나의 과도기적 지점으로 이해할 수도 있다. 김순미(2018)AI시대 인간번역과 기계번역이 공존하는 환경에서 번역이란 작업이 기계의 도움을 통해 생산성과 창의성을 높일 수 있고, 향후에 번역사에게 기본적인 번역능력 외에도 AI시대에 맞는 더 많은 능력을 요구할 것이므로 번역과 번역사의 일에 대한 새로운 개념을 정립할 필요가 있다고 강조했다.

 

기계와의 협업이 필연(必然)이 된 지금, 인간 번역사는 무엇을 해야 할까.

많은 전문가가 LLM을 개발할 때 잘 가공된 정확성 높은 데이터를 활용하라든지, 혹은 원하는 번역물을 잘 생성하도록 프롬프트를 잘 구성하라든지 같은 대안을 제시하고 있다. 물론 맞는 말이다. 하지만 그에 앞서 인간 언어의 고유한 특성이 무엇이고, 그것을 어떻게 사용할지 세밀하게 들여다보는 노력이 필요하다고 생각한다. 필자는 인간과 기계의 언어 사용에 있어서 가장 중요한 차이는 자의성(恣意性)’에 있다고 본다. ‘()’는 마음대로 한다는 뜻이다. , 기표(記標)와 기의(記意) 사이에 필연적 관계가 없다는 의미이다. 이는 인간의 언어 사용에 있어 창조성을 부여하는 바탕이 된다. 반면, 기계는 학습을 통해 언어를 사용한다. 학습데이터는 대부분 적절한 가공을 거쳤고, 따라서 기계는 언어 사용 규범에 벗어나지 않는 결과만을 도출할 뿐이다. 바로 이 자의성 덕분에 찬란한 슬픔의 봄과 같은 역설이나 내 마음은 호수요같은 은유부터 알잘딱깔센과 같은 줄임말까지 창조적 사용이 가능하다. 이것이 바로 기계와 차별되는 능력인 것이다.

인간의 언어 사용 능력이 최대로 발현되는 분야는 바로 문학출판번역이다. 기계번역에게는 넘어야 할 끝판왕이지만 말이다. 여기에는 문체와 비유, 문화소, 역사적 맥락 등 언어에는 단순한 언어적 요소 외에도 사회적, 문화적, 역사적, 감성적 요소 등 수많은 것들이 녹아 있다. 따라서 고도의 언어 수행 능력, 텍스트 분석 능력, 맥락, 상황 이해 능력, 전략적 선택 능력, 소통적 번역 능력, 창의적 번역 능력과 감성이 요구되기 때문에 기계가 도전할 수 없는 오롯이 인간만의 번역 세계일 것이라는 결론을 내릴 수 있다(전혜진, 2023). 그럼에도 불구하고 결국에는 기술의 발전으로 기계는 번역의 더 많은 영역으로 들어올 것이다. 이는 인간 번역사 모두가 직면한 시대적 도전이다. 기계와 인간의 공생의 길을 찾아갈 지혜를 찾을 수 있길 기대해 본다.

 

 

 

<참고 문헌>

  강병규(2024). 생성형 AI와 사용자 특화 기계번역 모델. <서강대학교 언어정보연구소 2024 신년학술대회 발표집>, 15-40.

  구본권(2020). 로봇 시대, 인간의 일. 어크로스, 서울.

  김순미(2018). AI 시대 인간번역과 기계 번역(NMT)의 공존-경영학 ‘확장 (Augmentation)’전략 중심. <통역과 번역>, 20(2), 1-32.

  전혜진(2023). 문학번역, 기계번역 가능한가. <AI번역 현황과 문학번역의 미래 한국문학번역원 번역 교육 심포지엄 발표집>, 40-44.

  정호정(2013). 제대로 된 통역 번역의 이해. 한국문화사, 서울.

  천종성(2020). 전문번역사들의 기계번역 수용에 관한 연구. <한국융합학회논문지>, 11(6), 281-288.

  최연우(2024). 기계번역과 ChatGPT, 인간번역 비교분석: 정보라의 『저주토끼』, 문화특수항목(CSI)을 중심으로. 박사논문, 숙명여자대학교.

  동아일보(2024. 6. 21). 환각 속 AI ‘헛소리’, AI 손으로 거른다

URL: https://www.donga.com/news/It/article/all/20240620/125539573/2

  아이티월드(2023. 6. 2). 대규모 언어 모델의 정의 그리고 생성형 AI와의 관계

URL: https://www.itworld.co.kr/news/293035#csidx5bc62886c4100898043cc4a9cc6a8a6

  나무위키. 네이버 파파고

URL: https://namu.wiki/w/%EB%84%A4%EC%9D%B4%EB%B2%84%20%ED%8C%8C%ED%8C%8C%EA%B3%A0

  전자신문(2024. 2. 23). 인텔리콘연구소, 법률 특화 sLLM '코알라' 개발…할루시네이션 방지

URL: https://www.etnews.com/20240223000292