[분석] "생성형 AI, 일상에 스며들다"… 유통과 장비의 평준화 시대, 강력한 차별화 무기는 '창작'과 '스토리텔링 구사능력'

조 영 신 | SK브로드밴드 실장

생성형 인공지능(Generative AI)의 확산 속도는 그야말로 눈부시다. 오픈 AI의 ChatGPT가 출시 2개월만에 1억명의 사용자를 확보했다는 소식은 구문(舊聞)이다. 인스타그램이 2년, 페이스북이 4년이 걸렸다는 1억명 돌파를 했다며 사람들이 놀라워 했지만, 지금의 성장 속도에 놀라는 사람은 거의 없다. 너무도 당연하다는 듯이 받아들이는 상황 그 자체가 놀라울 지경이다.

고개를 돌려보면 많은 이들이 어떤 식으로든 생성형 AI를 이용하고 있는 것을 알 수 있다. 누구는 무료를, 누구는 유료를 사용하겠지만, 그리고 누구는 오디오에, 누구는 영상에, 누구는 이미지에 특화된 생성형 AI를 사용하겠지만, 어찌되었던 과거에는 사용하지 않았던 사람들이 사용하기 시작했고 그 숫자가 1년도 되지 않아 도처에서 확인할 수 있게 되었다.

물론 생성형 AI 이용량에 있어서 다른 나라 대비 낮다고 주장하기도 하지만 그건 순위 좋아하는 사람들의 이야기이자, 상대적 지표일 뿐이다. 강의 시간에 선생님의 질문에 ChatGPT 등을 검색해서 답변하는 것이 일상이 될 정도가 되었고, 기업에서도 무슨 새로운 정보가 나오면 ChatGPT에게 물어볼까요 하는 소리가 들릴 지경이다. 그렇게 우린 조금씩 생성형 AI에 익숙해져 가고 있다.

2023년 12월 기준 '일렉트로닉허브'가 선정한 ai 툴 활용 순위에서 한국이 보이지 않는다

생성형 AI를 사용해 본 경험이 있는 사람들은 확실히 속도와 품을 줄일 수 있다고 말한다. 지금 이 글을 쓰고 있는 와중에도 두번째 모니터에는 챗지피티(ChatGPT)와 끌로드(Claude)가 내가 무슨 요청을 할 지 대기 중이다. 작은 문서 하나 작성하는데, 이들 도구에 묻고, 확인하고, 정리하면 대충의 글이 완성된다. 얼마 전 새로운 AI 툴을 발견해서 이미지를 만든 뒤에 이것을 상업적으로 사용할 수 있는지 알아보고 싶었다.

약관을 일일이 다 읽고 확인하기에는 너무 많은 시간이 걸릴 것 같아서 약관을 복사해 ChatGPT에 붙이고, 상업적으로 이용할 수 있는지 여부를 판단할 수 있는 문장을 찾고 알려달라고 했다. 그랬더니 즉각 관련 조항을 보여주면서 "상업적 이용이 가능하다"라는 답변을 준다. 이 얼마나 명쾌한가? 내가 영문 약관을 읽고 해석하고 정리하려면 이보다는 수십배의 시간이 걸렸을 것이다. 이처럼 아직까지 생성형 AI를 사용하지 않는 사람들이 있을 지언정, 한번이라도 사용해 본 사람이라면 각자의 방식으로 활용할 것이라 확신한다.

상업적 이용도 가능

주관적 경험이 아닌 객관적인 판단으로도 이는 분명해 보인다. 용도 별로 너무도 다양한 툴이 넘쳐나고 있다. 대표적인 AI 목록 사이트인 There’s an AI for that (theresanaiforthat.com)엔 2024년 상반기 기준 1만 개가 넘는 Gen AI Tool이 등록되어 있을 정도다. 지금도 매주 수백개의 도구가 등장하고 있다.

텍스트 생성,이미지, 비디오 생성, 음악제작, 코드 작성은 물론이고 비즈니스 자동화 등 사실상 제작과 관련된 전분야에서 등장하고 있다. 2022년 11월 ChatGPT가 처음 모습을 드러낸 이후 채 2년도 되지 않아 현재까지 4번의 버전업이 이루어졌고, 이 때마다 시장은 들썩거렸다. 물론 이 시장도 조만간 분절되고 파편화된 서비스가 몇 개는 통합되고 완성된 서비스로 정리되겠지만 아직은 다들 조금씩 모자란 모습으로 서로를 채우고 있고, 그 채움의 시간이 갈수록 빨라지고 있어 ‘조만간’이 진짜 ‘조만간’이 될 것 같다.

언론이나 SNS 그리고 지인들의 경험치를 모아보면 대략 이런 이야기들이다. 기사나 광고 카피 같은 것을 고민하는 이들은 Jasper AI 류를 즐겨 사용하고 있다고 했다. 내용을 집어 넣으면 이 내용에 알맞은 헤드라인을 뽑아주거나, 그 내용을 기사 등으로 변형해서 정리해 준다.

일부 대기업에서는 독자적인 홍보 작성 Agent를 개발해 쓰고 있다. 혹자에 따르면 생산성이 두 배로 높아지고, 4~5시간 걸리던 블로그 포스트 등이 1시간 이내로 줄어들었다는 주장도 한다. 글 쓰는 것이 두려운 이들에겐, 글을 쓴다는 행위 자체가 장벽처럼 느껴지는 이들에게는 의미 있는 해결사가 등장한 것이다. 읽을 수 있고 판단할 수 있고 논리적으로 다듬을 수만 있으면 포맷이 갖춰진 글쓰기는 어렵지 않게 된 셈이다. 중요한 장벽이 허물어졌다.

똥손도 영상을

개인적으로도 재미있는 경험을 했다. 얼마 전 급한 강의 일정이 생겨서 어설프게 나마 숏폼 영상을 만들어야 했다. 한 두권의 책을 샀고, 거기에 맞추어 몇 개의 AI 프로그램을 설치해서 따라했다. ChatGPT(유료), ImagineArt(유료), Kling (무료), CapCut(무료), Runway(무료), SUNO(무료), ElevenLabs (무료)를 사용했다. 두 개의 프로젝트를 기획했다. 하나는 5인조 아이돌 그룹의 데뷰 홍보 영상물이고, 또 하나는 기후 변화의 심각성을 알리는 다큐멘터리 피칭 영상이다.

아래 이미지 (원래는 짧은 동영상이지만)는 Kling과 ImagineArt로 만든 그림이다. 5인조 아이돌 그룹을 만들기 위해서 각 멤버별로 서너줄의 프롬프트를 작성해 만들었다. 기후 변화의 심각성을 알리는 다큐멘터리를 만들기 위해서 빙하가 녹는 장면을 만들어 달라고 했다.

필자가 직접 시도해 본 5인조 아이돌과, 기후변화 다큐멘터리 영상

똥손인 필자가 손수 하려고 했다면 불가능한 작업이다. 수차례의 시행착오가 있긴 했지만, 그럭저럭 쓸만한 그림을 찾았다. (각 프로그램 별로 전형성이라는 것이 있어서 아시안의 얼굴이 비슷하다는 느낌 아닌 느낌. 이것도 Data가 쌓이면 개선될 터). 5인조 데뷰 영상을 만들려고 하니 5인의 멤버들을 한자리로 모아야 하는데, 각 멤버들의 모습을 단체 모습으로 변형시키는 건 찾지 못했다. 그래서 비슷하게 애니메이션으로 바꾸었더니 그럭저럭 비슷한 그림이 만들어졌다.

이젠 데뷰 음악이 필요했다. ChatGPT의 도움을 받아 이 아이돌에게 세계관을 부여했고, 이 세계관에 맞추어SUNO의 도움을 받아 <Cross the Line>이란 노래를 만들었다. 음악성에 대한 평가를 할 능력인 안되니 패스, 그러나 한번도 음악을 만들어 본 적이 없는 내가 AI TOOL 몇 개를 사용해서 작업을 해서 그럭저럭 모양새를 갖출 수 있다는 게 핵심이다.

CapCut을 이용해서 이들 영상들을 합치고 노래를 깔고, Canva를 활용해서 자막을 넣고 했더니 자연스럽게 1분 미만의 숏폼을 만들어 낼 수 있었다. 무료 버전인 관계로 카메라의 무브먼트(Camera movement) 등을 조정하지 못해서 비교적 단조로운 영상 밖에는 만들지 못했지만, 유료 버전을 이용하는 사람이라면 상황이 달라졌으리라. 유료 버전을 구입해야 해서 시도하지 못했지만, 내 목소리를 녹음(voice cloning)해서 쓸 수도 있고, 타국어로 전환도 가능하다.

개인적인 경험이지만, 이리 저리 뒤져보면 보편적 경험이라는 것을 알 수 있다. 캠페인 비주얼을 구상하는데 과거에는 아티스트에게 의뢰해 시안이 나오기까지 며칠이 걸렸다면, 이제는 미드저니(MidJourney)에 간단한 텍스트 프롬프트를 입력해 즉시 결과를 얻을 수 있게 되었다는 것은 신기하지도 않다. 비용적으로도, 시안 하나당 수 십만 원이 들어가던 작업이 몇 만 원 안팎의 소프트웨어 구독료로 해결되는 시대가 온 것이다.

예전에는 영상 편집을 위해 수 천만 원짜리 장비와 숙련된 편집자가 필요했지만, 이제는 Runway AI를 사용하면 초보자도 영화 수준의 특수 효과를 추가할 수 있게 되었다. 장면 전환에 사용하는 타임라인 편집도 AI가 자동으로 제안하거나 배치해주며, 이는 기존의 몇 시간짜리 작업을 10분 이내로 줄일 수 있게 되었다. 광고 제작사 대표인 친구의 이야기를 들어보면 전체 공정을 AI에 의존할 수는 없으나, 부분적으로 AI를 활용할 수 있는 여지가 높아지고 있고, 비용도 이전 대비 1/5 정도로 떨어졌다. 물론 광고주는 AI를 사용했으니, 비용을 1/10로 줄여야 한다고 주장하고 있어 오히려 손익은 나빠질 것 같지만, 체감적으로 시장은 빠르게 변하고 있다.

어떻게 변할까?

똥손이 창작가가 될 수 있는 세상이 된 것이다. 물론 여전히 똥손은 똥손일 뿐이다. 기술적 허들이 사라졌다는 것일 뿐일 뿐 전문가가 필요없다는 건 아닐 테니 말이다. 그러나 기술적 허들이 사라지고, 일반인들의 진입이 이루어지면 기준점과 역할이 구별되고 달라지기 시작한다. 스마트폰 보급 후 모든 이가 카메라 하나씩을 가지게 된 세상에서 사진기자의 위상과 역할이 어떻게 달라졌는지를 보면, Gen AI로 인해 세상 변화를 조금은 다른 시각으로 볼 수 있을 것이다.

사진기자는 진입 장벽이 높았던 영역 중 하나다. 소위 백통 혹은 대포라는 표현으로 알려진 고배율 줌렌즈는 수천만원대의 장비여서 신문사들도 제한적으로만 운영했다. 장비가 만들어 낸 가치가 있었기에 포토 저널리즘은 이들만의 리그였다. 그러나 스마트폰은 그 진입 장벽을 낮췄다. 웬만한 사진은 스마트폰의 고배율 줌으로 해결이 되는 상황이었다. 이제 사진 기자의 진입 장벽은 장비가 아니라 장소 접근권 뿐이었다. 예를 들어 경기장 가장 근거리에서 사진을 찍을 수 있는 권한일 뿐 더 이상 장비는 사진기자의 진입 장벽이 되지 못했다.

이 대목에서 LIFE지의 폐간과 사진 기자와 사진작가의 운명이 떠올랐다. 스마트폰의 품질이 좋아지기 시작하면서 세상 모든 이들이 카메라를 하나씩 가지고 있게 된 세상이 되었다. 2015년《포토닷》기사에 인용된 한 사진기자의 진술이 인상적이다.

“10년 전에 비해 지금의 보도사진은 오히려 후퇴했다고도 볼 수 있다. 과거에는 기사(텍스트)보다 사진 자체에 무게를 두는 보도형식도 있었지만 요즘은 기사 내용에 맞는 사진만 보도되는 형국이다. 특히 사진기획은 몇몇 신문사를 제외하고는 거의 사라져버렸다.”

이어지는 문장도 의미심장하다.

1990년대 초반과 IMF 위기 직전까지 최고조에 달했던 대다수 중앙일간지 사진기자 수가 고화질 사진 촬영이 가능한 스마트폰 보급 시기와 맞물리면서 2021년 현재 절반 정도로 줄어들었다. 2013년에는 미국 시카고선타임즈(Chicago Sun-Times)가 사진기자 전원을 해고한 사례가 있다. 2021년 10월 현재 한국사진기자협회에 등록된 사진기자 회원은 전국적으로 496명이다. 협회에 따르면 전체 회원 수는 20년 전과 별 차이가 없다고 한다. 일간지 사진기자가 줄어든 만큼 통신사 사진기자가 대폭 늘어났고 인터넷 매체도 늘어났기 때문이란 것이다.

통신사에서 공급하는 사진의 질이 일간지 사진기자가 찍는 사진보다 내용이 빈약하다고 단정할 수 없다. 다만 통신사는 속보성이 더 강하고 계약된 모든 매체에 동일한 사진을 보낼 수밖에 없다는 점이 중요하다. 또한 실험적이고 표현적인 양식보다는 설명적이고 관습적인 양식의 사진을 더 많이 보낸다는 것도 통신사의 특징이다. 중앙일간지 사진기자 숫자가 줄어든 만큼 사진은 통신사에 의존할 수밖에 없다. 또한 남아있는 사진기자들이 실험적이고 표현적인 양식의 사진에 더 시간과 노력을 투자하기도 힘든 실정이다.

두 줄 요약하면 이렇다. 스마트폰의 보급으로 사진이 들어간 기사, 즉 속보성 사진은 늘었다. 그러나 과거와 같은 포토저널리즘의 위세는 줄었다.

사진, 그 다음은 음악과 영상

영상 제작과 음악 등 콘텐츠 시장도 이와 유사한 전철을 밟을 개연성이 크다. Gen AI는 대포와 백통에 버금가는 장비의 장벽이 사라진 시장을 가져올 것이 분명하기 때문이다.

영상 제작과 음악 제작도 전형적인 전문가 과정이었다. 유튜브가 그 과정을 조금 낮추긴 했지만, 여전히 장벽은 존재한다. 물론 현재의 Gen AI가 완벽하지는 않다. 아직 일관성 이슈 등이 Gen AI가 해결해야 할 부분들이 있어서 당분간 롱폼 콘텐츠 시장에 미치는 영향은 제한적이겠지만, 숏폼 시장에서는 충분히 진입 가능하다. 또한 드라마 등 레거시 미디어 영역에서는 저작권이나 화면의 다양성 측면에서 Gen AI는 여전히 부수적인 역할을 수행하는 정도겠지만, 정보성 콘텐츠나 광고 콘텐츠 등은 충분히 현재의 수준으로도 극복이 가능해 보인다.

나노처럼 쪼개어 합성하는 형태의 콘텐츠라면 더더욱. 촬영부터 편집, 심지어 음악 추가까지도 AI가 해주는 환경이 되었으니, 자극적이고 도발적인 콘텐츠의 홍수가 일어나는 것은 당연하다. 마치 유튜브의 '렉카 문화'처럼, 사람들의 주목을 끌기 위한 과열 경쟁이 지금보다 더 심해 질 것도 뻔하다.

반면 좋은 콘텐츠는 시간이 흐를수록 더욱 많아질 것이다. 풍부한 상상력이 그대로 영상 창작으로 이어질 수 있으니까. 중요한 건 상상력과 창의력이다. 장비와 유통의 장벽이 사라진 시대에 콘텐츠 제작과 관련해서 유일하게 남은 영역이 바로 상상력과 엮는 능력이기 때문이다.

18세, 건강미가 넘치고 브라운 헤어, 둥근 얼굴에, 환하게 웃는 여성을 그려 달라고 하는 것은 Gen AI가 그려줄 수 있고, 만들어진 아바타에 다양한 카메라 워킹과 무브먼트를 요청해서 영상을 만들어 낼 수는 있지만, 그 영상 영상이 하나로 합쳐 완벽한 스토리가 되는 것은 순전히 프롬프터를 요청하는 사람의 몫이기 때문이다. 달리 이야기하면 오랜 학습과 경험을 요구했던 도구 접근권이 사라진 시대엔 역설적으로 뛰어난 안목, 그리고 이를 엮어내는 상상력이 가장 요구된다.

여전히 "인간"이 핵심

아무리 뛰어난 AI 도구가 있어도, 그 도구가 어떻게 사용될지 방향을 잡는 것은 여전히 인간의 몫이다. AI는 과거의 데이터를 바탕으로 작업을 하기 때문에 전혀 새로운 아이디어를 창출하는 데는 한계가 있다. 영상 편집에서 AI는 이전에 사용된 편집 스타일을 모방할 수 있지만, 완전히 새로운 시각적 스타일을 창조하는 일은 아직은 어렵다. 더욱이 저작권 문제를 해결하기 위해서라도 인간의 개입은 필수적이다(이 부분은 나중에 자세히). 결국 콘텐츠의 질을 결정짓는 요소는 AI가 아닌, 인간의 창의적 사고에서 나오는 기획력과 스토리텔링력이다.

이쯤에서 정리를 해 보자. 영상 시장은 크게 두 번의 혁명을 맞이했다. 첫번째 혁명은 인터넷 혁명이었다. 유튜브가 튀어 나왔다. 정부 허가를 받지 않은 (방송) 사업자가 등장한 것이다. 이로서 이제 누구나 자신만의 미디어(유통)를 가질 수 있었다. 숨은 용자들이 등장했다. 유튜브 계정 하나 없는 사람이 없다는 우스갯소리가 나올 정도가 되었다. 그러나 모두가 밥벌이를 할 수는 없었다. Tool을 다룰 수 있는 사람과 없는 사람 간의 간격이 있었기 때문이다.

두 번째 혁명이 시작되었다. 이제는 장비(tool)가 대거 풀렸다. 완벽하지는 않지만 전문가 뺨치는 카메라 무브먼트와 이미지를 약간의 지불만 하면 누구나 만들 수 있게 되었다. 지금보다 더 많은 사람들이 장비의 장벽에서 벗어나 자유로워졌다. 두 번째 콘텐츠 홍수(content abundnance)의 시대가 열렸다. 이른바 "New Age of Content Abundance"의 시대가 된 것이다.

그러나 이번에도 모든 이들이 성공하지도 주목받지도 못할 것이다. 미디어도 가졌고, 창작의 툴을 가지고 있더라도 반드시 필요한 것이 남았기 때문이다. 바로 사람들의 마음을 터칭할 수 있는 상상력과 스토리텔링 능력. 과거에는 상상력과 스토리텔링이 부족해도, 미디어를 핑계로, 툴을 핑계로 차이를 둘 수 있었지만, 이제는 온전히 상상력과 스토리텔링력간의 경쟁이 시작된 것이다.

순수 상상력의 시대가 시작되었다. (끝)

작성일 : 2024-10-13

조영신 | SK경영경제연구소에서 수년 동안 미디어 시장의 변화와 갈 길을 연구하다가, 2019년부터는 SK브로드밴드에서 미디어 사업의 실행을 고민하고 있다.