[칼럼] 인공지능(AI)의 ‘의도 없음’을 해석하려는 인간의 의도: 평균화된 창작 시대의 역설

이처럼 AI가 ‘나는 의도가 없다’고 말하는 순간에도, 우리는 그 대답에서 또 다른 해석을 찾으려 한다. 학생들의 에세이에서도 발견되었듯 인간은 늘 이유를 찾고, 맥락을 찾고, 구멍을 메우는 존재이기 때문이다.

Bluedot Admin

글 | 디렉터스초이스 감독 이수지


‘드디어 올 것이 왔구나.’

강의를 담당 중인 학과와 내년 상반기 교과목 계획을 논의하는 과정에서 든 생각이다. 개편 교육 과정에 생성형 AI 관련 교과목들이 신설되어, AI 영화 제작 수업의 커리큘럼을 새롭게 짜야 할 미션이 생겼다. 개인적 목적이거나 상업적 목적으로 AI 영상을 만드는 것이면 몰라도, 아직 그럴듯한 영상을 척척 생성해낸다 하기에는 갈 길이 만 리 쯤은 필요해 보이는 AI로 교육을 하자니 벌써부터 머리가 지끈지끈 울려온다.

얼마 전, 모 대학의 교과목 개편 과정에 자문 위원으로 참여하는 과정에서도 비슷한 고민들을 자연스레 나누었다. 영상 실무와 교육 활동을 겸하고 있는 이들이 다수 모인 기회라, ‘AI를 학습하여 생성한 결과물에 학생 스스로가 만족도가 나오는지, 교육할 때 어떤 AI를 채택하는지, 신규 채용 심사 시 지원자에게 AI 활용 능력을 기대하거나 요구하는지’ 등등 각자가 보유한 작은 조각 경험들을 엉거주춤 맞춰보며 ‘현재 개발된 생성형 AI의 컨디션에서는 어느 레벨까지의 실무 교육이 가능한가?’에 대한 지도를 그려보고자 한 자리였다.

누구도 피해갈 수 없는 AI

유튜브를 포함해 전세계 SNS 알고리즘을 가장 빠르게 장악한 AI 영상 테마 중에는 ‘유리 자르기 ASMR’이 있다. 각종 음식이나 물건들을 유리 재질로 변환하고 스테인리스 칼로 서걱서걱 잘라내는 영상들이 유행을 일으키는 와중, AI가 프롬프트를 구현하면서 엉뚱한 모션이 발생한 실패작 모음 영상까지 동반 인기에 올랐다.

<생성형 AI로 제작한 유리 자르기 ASMR 영상들. AI가 잘못 생성한 실패 사례 영상도 인기가 크다.>

엔터테인먼트 콘텐츠를 생성형 AI로 제작할 때 창작자가 겪는 스트레스를 AI가 없던 시절과 비교한다면, 고통의 종류가 다를 뿐 소모되는 에너지의 총량은 별반 다를 것이 없어 보인다. AI를 사용할 때에는 점점 줄어가는 보유 크레딧에 애가 달달 끓고, ‘이번에 넣은 프롬프트는 반드시 내가 원하는 그 느낌적인 느낌에 적중하기를…’ 하며 있지도 않을 AI 신에게 간절히 기도해야 하는 신세이니 말이다.

자연스러운 동작 묘사, 일그러지지 않는 세부 묘사, 같은 캐릭터 이미지의 반복 생산, 카메라의 움직임에도 일관되게 유지되는 이미지 등을 한번에 연산하기엔 아직 영상을 생성하는 AI들에겐 한계가 많다. 잘못된 결과가 나와도 누구를 탓하거나 하소연할 곳도 없다. 우리는 AI가 정한 거리와 범위 내에서만 그와 소통할 수 있고, 그가 진심으로 최선의 노력을 해서 내어주는 결과에 자동 승복해야 하는 구조 속에 스스로 비용까지 지불하고 합류했기 때문이다.

유리 자르기 ASMR처럼 액션이 간단하고 정보가 단순한 영상을 생성할 때도 실패한 데이터들이 무수하다면, AI로 만든 서사물을 완성하기 위해 다음 학기의 필자와 학생들은 이미 예고된 좌절들 속에서 얼마나 많은 인내심을 키워내야 할까. 어쩌면 흔히 말하는 ‘보살’들이 우르르 탄생할 수도 있겠다는 생각에 웃픈 표정이 절로 지어진다.

아는 것과 구현하는 것은 다르다

그럼에도 교육 현장에서 AI를 도입하는 새 시도에 합류한 것이 내심 기대되는 점은 부인할 수 없다. AI를 제법 깊게 다뤄본 사람이라면, 이 기술에서 개념적 이해와 작동 결과의 싱크가 맞아들어가는 순간이 얼마나 귀한 것인지 알 것이다. AI는 마치 입력된 요구를 다 알고 있는 것처럼 응답하지만, 실제 구현 단계에서는 전혀 다른 방향으로 휘어버리거나 어딘가 비슷한 느낌의 영역 내에서 본질은 놓치는 경우가 잦으며, 영상 작업에서는 특히나 그 정도가 강해진다. 교육자로서는 AI의 잠재력을 끌어올리려는 시도를 하면서도 동시에 이 기술의 구조적 한계 상황을 학생들에게 정확히 알려야 한다는 숙제가 남는다.

이러한 고민을 타파해보고자, 우선 생성형 AI에 대해 가장 현실적인 학생들의 관점을 수집하기 시작했다. 필자가 직접 운영 중인 AI 기반 유튜브 채널 ‘HalfMoon Town’을 참고 자료로 제공했고, 학생들에게는 이 채널의 주요 콘텐츠인 유명 영화 OST를 모방한 AI 음악들을 감상하게 한 뒤, ‘현재의 AI는 인간이 기대하는 감성 표현을 얼마나 구현하고 있다고 보는가?’라는 주제로 자유 에세이를 작성하게 했다.

약 60여 명이 제출한 에세이에서 추출된 의견들은 유사성이 상당했다. 학생들은 대체로 AI 음악에 “내가 아는 그 영화의 느낌은 있다.”라고 인정했다. 해리포터 시리즈와 007 시리즈에서 자주 듣던 특유의 톤과 질감이 잘 감지된다는 것이다.또 AI를 자주 사용하는 학생들은 음악 생성 과정에서 여러 실패 결과들이 탈락하고 최선의 생성물만 모아 만든 콘텐츠가 대중에게는 AI의 보편적 수준처럼 인지된다는 것 또한 정확히 알고 있었다.

보다 인상적인 지점은, “음악이 고조되고 잦아드는 등의 흐름은 있지만 그렇게 구성된 이유가 느껴지지 않는다.”, “영화의 근처 쯤은 갔지만 서사의 흐름이 느껴지는 역할은 부족하다.”는 서술들에 있었다. 이 반복적 진술들은 정서를 모방하는 능력은 있지만 표면 수준의 구현에 머물러 있는 현 AI의 한계를 정확하게 짚고 있었다.

이를 더 깊게 고민한 학생들은 ‘AI의 의도가 부재하기 때문’이라 지적했다. 이 악기가 왜 이 파트에 들어갔는지, 왜 특정 타이밍에 리듬이 전환되는지 등의 목적이 결여된 결과가 ‘그럴듯하지만 콕 집어 말하기 어려운 어느 한 구석이 비어 보이는 이유’로 귀결된다는 것이다. 새 학기에 강의실에 함께 존재할 우리들 중에 가장 아는 것이 많은 이는 다름아닌 AI이겠지만, 학생들이 낸 의견 속에는 생산자인 AI가 주문자인 우리를 설득하기 위해 자신의 의도를 설명해주길 바라는 요구들이 있었다.

물론 프롬프트 입력 후 콘텐츠 출력만 가능한 AI야 아무 말이 없겠지만, 혹 그가 ‘이렇게 결과가 나오게 된 이유’를 설명한다 하더라도… 미리 슬픈 지점은 그 설명마저 의도가 없을 거라는 것이다.

의도가 없는 결과에서
의도를 찾는 우리

쇼츠, 릴스 등에서 자주 목격되는 AI 생성 이미지들 다수는 학습 데이터 세트가 평균적으로 ‘더 예쁘다고 여겨지는 얼굴’과 ‘정돈된 미적 특성’을 강화한 결과들로 보인다. 표면적 패턴에 적합한 값을 찾는 데 최적화되어 있는 AI 특성이 ‘시각적으로 예쁘기만 함’으로 수렴되는 결과는, 음악 생성에서의 ‘분위기는 있는데 이유는 없음’과 동일한 현상이다.

최근 버전이 업데이트 된 Gemini(3.0 Pro)에게 이에 대한 의견을 직접 물었다.

Q. 인공지능에게 이미지를 요청하면 특히 인물에 대해서, 미남 미녀 위주로 생산되는 확률이 높은 것 같은데 이에 대해서 어떻게 생각하니?
A. 네, 인공지능에게 인물 이미지를 요청했을 때 결과물이 대개 '예쁘고 잘생긴, 전형적인 미남미녀' 위주로 생성되는 경향이 있다는 것은 부인할 수 없는 사실입니다.
① AI는 인터넷에 공개된 수십억 장의 이미지를 보고 배웁니다. 그런데 사람들이 인터넷(SNS, 광고, 전문 사진 사이트 등)에 올리는 인물 사진들은 어떤가요?
② '고품질'에 대한 정의와 피드백 과정 AI 모델을 개발할 때 개발자들은 AI가 '더 좋은 품질'의 이미지를 만들도록 훈련시킵니다. 이때 '좋은 품질'을 판단하는 기준이 종종 문제가 됩니다.
③ 인간은 여러 사람의 얼굴을 합성한 '평균적인 얼굴'을 대칭적이고 결점이 없다고 느껴 더 매력적으로 인식하는 경향이 있습니다. AI가 그려내는 얼굴도 이러한 통계적 평균에 수렴하면서 자연스럽게 '매력적인' 얼굴이 되는 측면이 있습니다.
실제 Gemini의 응답 일부를 요약한 것이 위 내용이다. Gemini는 학습 가능한 데이터가 편향적임을 스스로 알고 있으며, 다양성의 결여는 자신을 포함한 인공지능 모델들이 해결해야 할 공통 문제로 본다는 의견을 성실히 설명했다. 또한, 프롬프트 입력자가 ‘현실적인’, ‘꾸밈없는’ 등의 구체적 요청을 더하면 덜 전형적인 결과를 도출하도록 모델이 조정되고 있다는 힌트도 줬다.

경험상 챗GPT는 유사 맥락의 질문에 보기 좋게 돌려 말하는 회피 성향이 큰 편인데, Gemini는 의외로 솔직해서 조금 놀라기도 했다. Gemini가 보내온 긴 전문을 재차 읽다 보니, ‘나는 수행할 뿐 의도가 없음. 그럼에도 문제의식이 있으며, 인간 또한 과거부터 축적해 온 역사를 거울처럼 마주하는 결과에서 일부는 책임이 있지 않겠나, 그러니 함께 노력해보자.’ 라는 의도가 느껴졌다. 이미 AI에게는 의도가 없음을 인지하고 있는데도 자꾸만 의도를 찾는 역설을 체감하는 순간이다.

이처럼 AI가 ‘나는 의도가 없다’고 말하는 순간에도, 우리는 그 대답에서 또 다른 해석을 찾으려 한다. 학생들의 에세이에서도 발견되었듯 인간은 늘 이유를 찾고, 맥락을 찾고, 구멍을 메우는 존재이기 때문이다. 지금의 생성형 AI가 만들어내는 ‘평균화된 근사함’이 이상하게 공허한 듯 느껴지는 이유 또한, 우리가 그 안에서 실제로는 존재하지 않는 의도를 찾으려는 기대가 작용하기 때문일지도 모른다.

처음 AI 활용 교육을 고민한 때는 ‘영상을 생성하는 AI가 현재 어떤 수준까지 잘 구현할 수 있는지’를 파헤치는 것에 주목했지만, 일련의 과정을 통해 다가올 학기에서 학생들과 함께 탐구할 주제를 더욱 확장할 필요가 있음을 느낀다. 학생들이 AI가 가진 ‘의도의 부재’를 제대로 체험함을 통해, 인간이 창작에서 무엇을 진짜 가치 있는 것으로 여겨왔는지 더 분명하게 보게 되길 바란다.

AI를 모르던 시절의 우리들은 콘텐츠에 대해 호와 불호의 감상을 나누는 정도면 충분했었다. 하지만 달라진 세상이 도래한 후 돌이켜보니, 우리 안에는 언제나 콘텐츠 매력의 깊은 근원을 이해하고자 하는 욕구가 자리해 있었다는 사실을 이제야 깨닫는다. 그리고 학생들이 직접 모은 의견을 통해 얻은 이러한 깨달음이 다시 학생들에게 전해지길 ‘의도’해본다. (끝)


작성일: 2025년 11월 27일

이수지 | 이화여대 학사, 카이스트 석사 졸업. 현재 한양대학교 문화콘텐츠학과에서 박사과정을 밟고 있다. 드라마, 영화를 연출하며 시청자 참여를 유도하는 영상 콘텐츠 기획을 연구하고 있다.