AI 시대 인간의 길은?

지금까지 인간 고유의 특징이라고 여겨온 언어·사고 능력을 기계가 갖게 되었습니다. 생성 인공지능의 파고가 닥친 세상에서 개인과 사회는 어떻게 대응해야 할까요? 매주 월요일 오후 3시 새 글이 올라옵니다.

“여러 마리의 거대한 털매머드가 눈덮인 들판을 밟으며 다가오고, 걸을 때 긴 털은 바람에 가볍게 날리고, 멀리서 눈 덮인 나무와 산, 한낮의 햇살과 뭉게구름, 저 멀리 높은 태양이 따뜻한 빛을 만들어내고, 낮은 카메라 시야는 아름다운 사진과 심도로 커다란 털매머드를 멋지게 포착합니다”라는 텍스트를 입력하자 소라가 만들어낸 동영상 이미지의 일부. 오픈AI 제공
“여러 마리의 거대한 털매머드가 눈덮인 들판을 밟으며 다가오고, 걸을 때 긴 털은 바람에 가볍게 날리고, 멀리서 눈 덮인 나무와 산, 한낮의 햇살과 뭉게구름, 저 멀리 높은 태양이 따뜻한 빛을 만들어내고, 낮은 카메라 시야는 아름다운 사진과 심도로 커다란 털매머드를 멋지게 포착합니다”라는 텍스트를 입력하자 소라가 만들어낸 동영상 이미지의 일부. 오픈AI 제공

생성 인공지능 이후 일주일이 멀다 하고 새로운 인공지능 서비스가 등장하고 있는데, 또하나의 놀라운 서비스가 나타났다. 미국 오픈에이아이(OpenAI)는 지난 15일(현지 시각) 텍스트로 명령어를 입력하면 고화질 동영상을 만들어내는 서비스 ‘소라(Sora)’를 홈페이지를 통해 공개했다.

지금까지 동영상을 만들어주는 인공지능의 결과물은 기껏해야 20초를 넘지 않았고 영상 품질도 높지 않아 한계가 있었다. 이번에 오픈에이아이가 공개한 소라는 이런 한계를 넘어섰다. 챗지피티를 사용하듯 텍스트를 입력하면, 최대 1분 길이의 고화질 영상을 신속하게 만들어낸다.

오픈에이아이는 “여러 캐릭터와 특정 유형의 동작, 복잡한 장면 등 최대 1분 길이의 동영상을 빠르게 만들어낼 수 있다”며 “언어를 깊이 이해하고 있어 요구사항을 정확하게 해석하고 생생한 감정을 표현하는 매력적인 캐릭터를 생성할 수 있다”고 밝혔다. 오픈에이아이는 “우리는 인공지능이 움직이는 물리적 세상을 이해하도록 가르쳐왔다”며, 개발팀은 일본어로 ‘하늘’을 의미하는 ‘소라’에 대해 “무한한 창의성을 떠올리게 하기 위해서”라고 밝혔다.

-놀랍도록 정교하고 생생…“픽사 수개월 작업내용 순식간에”

오픈에이아이는 소라가 만들어낸 일부 결과물을 프롬프트와 함께 공개했는데, 놀라울 정도로 생생하고 정밀해 충격과 함께 사회에 새로운 과제를 던진다.

광고

소라 서비스와 결과물은 홈페이지에 공개됐지만 오픈에이아이는 누구나 접근해 사용할 수 있도록 제품으로 출시하지 않았다. 오픈에이아이는 소라를 ‘위험기술(레드팀)’로 분류해, 오용 가능성을 연구하고 있으며 소수의 학자와 외부 연구자그룹에만 기술을 공유하고 있다고 밝혔다.

당장 애니메이션과 동영상 제작 업계엔 날벼락같은 소식이다. 미국의 정보기술매체 ‘와이어드’는 “픽사는 괴물의 동작을 표현할 때 털의 정교한 움직임과 질감을 표현하느라 수많은 애니메이터들을 고용해 여러 달 동안 작업해야 했다”며 “하지만 인공지능은 동일한 작업을 눈깜짝할 새 처리했다”고 보도했다.

아래는 오픈에이아이가 공개한 소라를 이용한 동영상들과 이를 만들어낸 명령어 텍스트(프롬프트)다.

<아름다운 도시에서의 서핑>

프롬프트 : “화려한 장식으로 유명한 문화유산 공간 속에서 거대한 파도가 높이 솟아올랐다가 부서지기 시작합니다. 순간을 포착한 두 명의 서퍼가 능숙하게 파도를 헤쳐나갑니다.” 오픈AI 제공

<눈 내리는 도쿄의 풍경>

광고
광고

프롬프트 : “눈 내리는 아름다운 도쿄가 북적거립니다. 카메라는 북적이는 거리를 따라 움직이며 눈 내리는 아름다운 날씨를 즐기고 근처 노점에서 쇼핑을 하는 사람들을 따라갑니다. 화려한 벚꽃잎이 눈송이와 함께 바람에 날리고 있습니다.” 오픈AI 제공

-“백문이 불여일견” “보는 게 믿는 것”인 인간 인지에 중대도전

정교한 이미지가 만들어낸 높은 현실감은 새로운 우려를 만들고 있다. 가장 먼저 영상, 홍보 분야에 종사하는 사람들의 일자리 불안이 우려되고 있지만, 그 영향의 범위는 특정 직군에 국한하지 않는다. 사람들은 대부분 시각적 이미지를 통해 사실성에 관한 정보를 받아들이고 이를 기반으로 판단과 결정을 내리는데, 지금까지 시각 이미지가 지니고 있던 기본적 신뢰성이 붕괴되는 상황이기 때문이다. “보는 게 믿는 것”이 인간 인지의 기본적 구조이고 이를 기반으로 사회 구조와 소통방법이 마련되었는데, 보이는 것을 그대로 믿으면 위험한 환경이 되고 있다.

미국의 정보기술매체 ‘기즈모도’는 지난 15일 “소라는 현실감이란 개념을 엿먹이는 서비스(OpenAI's Sora Is a Giant 'F*ck You' to Reality)”라고 보도했다. 이 매체는 “온라인 허위정보가 커뮤니티를 분열시키고, 선거를 조작하고, 수많은 사람의 이성을 잃게 만들어 큰 문제가 되고 있지만 실제 해결에 뛰어든 사람은 없다”며 “온라인 허위정보에 가장 큰 책임이 있는 기술기업들은 문제를 기하급수적으로 악화시키기 위해 가능한 모든 일을 하려는 의도를 지닌 것으로 보인다”고 비판했다.

인간의 시각적 현실감각을 위협하는 기술이 등장했지만 기술적 해결방안은 없는 상태다. 오픈에이아이는 인공지능이 생성했다는 ‘워터마크’를 소라의 모든 결과물에 삽입하겠다고 밝혔지만, 이 워터마크는 인위적으로 지워질 수 있다는 점도 인정했다.

해독제 없이 수많은 사람들에게 치명적일 수 있는 독극물이 개발된 셈이다. 오픈에이아이는 2019년 2월 자동으로 글쓰기를 하는 GPT2를 개발했을 때도, 2023년 3월 GPT4의 멀티모달 기능을 소개했을 때도 악용가능성에 대한 우려 때문에 일반 공개와 제품 출시를 유보했다. 하지만 부작용에 대한 근본대책이 없는데도 해당 기술들은 얼마 뒤 공개되고 출시됐다. 소라도 일시적 공개 유보 상태이지만, 조만간 출시될 것으로 예상되는 까닭이다.

문장으로 명령어를 입력하면 순식간에 할리우드 스튜디오 수준의 정교한 동영상을 만들어내는 기술이 보편화되는 상황은 시간문제이다. 오픈에이아이가 인정한 대로, 워터마크와 같은 기술적 노력은 다양한 우회기술로 인해 제대로 기능하지 못할 가능성이 높다.

-앞으론 스크린 속 이미지, 일단 의심해야 하는 세상 

소라와 같은 감쪽같은 동영상은 인류가 지금까지 ‘백번 듣는 것보다 한 번 보는 게 낫다’는 말처럼, 시각 이미지 기반으로 살아온 방식과 사회 구조를 근본적으로 위협한다. 지금까지 주로 텍스트와 조작 사진이 ‘탈진실’ 현상을 만들어왔다면, 앞으로는 정밀하고 사실적인 동영상이 역할을 대체하고 더 큰 영향을 끼칠 우려가 높다. 사람은 주로 시각 이미지를 통해 정보를 인식하고 판단해왔는데, 앞으로 이는 매우 위험한 성향이 된다. 모니터로 접하게 되는 거의 모든 영상을 의심해야 하는 상황이 되기 때문이다. 속임수와 사기, 거짓이 진실과 뒤섞이면서 사회 전체적으로 거대한 혼란 속에서 막대한 비용을 치를 수 있다. 인간이 인지구조와 사회적 시스템에 근본적이고 치명적인 영향을 끼칠 기술이 안전대책 없이 등장해, 개인과 사회를 위협하는 상황이 임박하고 있다.

구본권 사람과디지털연구소장 starry9@hani.co.kr