박원익 | 더밀크 뉴욕플래닛장
블루투스 이어폰을 낀 한 남자가 해변을 걷고 있다. 카메라가 달린 기기를 셔츠 주머니에 꽂은 채. 걷기를 멈추고 해변에 누운 남자. 그때 이어폰 너머로 아름다운 음악과 함께 매력적인 여성의 목소리가 흘러나온다. “곡을 하나 썼어. 당신과 함께 해변에 있는 기분을 표현한 곡이야.”
2013년 개봉작 ‘그녀’(Her)는 대필 작가 ‘테오도르’와 인공지능(AI·에이아이) ‘사만다’의 사랑을 그린 영화다. 고정관념을 깨고 인간과 인공지능이 사랑에 빠지는 과정을 설득력 있게 묘사했다. 사만다가 동시에 8316명의 인간과 대화를 나누고 그중 641명과 사랑에 빠졌다고 고백하는 장면은 이 영화의 백미다. 테오도르는 ‘아무리 사람처럼 느껴진다 해도 사만다는 결국 에이아이’라는 사실을 깨닫고 한 단계 성장한다.
놀라운 건 영화에나 등장하던 이런 기술이 현실에 출현하고 있다는 사실이다. 오픈에이아이가 지난 13일(현지시각) 공개한 ‘지피티 포오’(GPT-4o)가 대표적이다. 오픈에이아이는 미국 샌프란시스코에 위치한 본사에서 새로운 모델 ‘지피티 포오’를 공개하며 다양한 시연을 진행했다.
‘지피티 포오’ 기반으로 작동하는 새로운 챗지피티는 사람과 실시간으로 음성 대화를 나누며 적절한 답변을 기존 제품보다 더 빠르게 제시했다. 말하는 도중 끼어들어 다른 이야기를 해도 새로운 주제에 맞춰 원활하게 대화할 수 있고 휴대전화 카메라로 비춘 글자, 사물, 숫자, 수식 등을 이해하고 그것들을 소재로 대화를 나눌 수 있었다.
구연동화 하듯 목소리 연기를 하거나 실시간 통역을 할 수도, 카메라로 수학 문제를 보며 개인 교사처럼 차근차근 풀이법을 알려줄 수도 있다. 성능이 놀랍다고 칭찬하니 “그만해요. 얼굴 빨개지잖아요”(Oh stop it, you’re making me blush)라고 말한다.
구글도 비슷한 에이아이 기술 시연을 선보였다. 하루 뒤 14일 개최한 구글 아이오(I/O) 콘퍼런스에서 공개한 ‘프로젝트 아스트라’는 이용자가 스마트폰 카메라로 창밖을 비추며 “내가 지금 어디에 있는 것 같니”라고 묻자 “런던 킹스크로스 지역”이라고 정확히 대답했다.
코딩 화면을 보고 무슨 기능인지 맞히거나 정보를 기억해 답을 제시할 수도 있다. “안경이 어디에 있었지”라고 묻자 휴대폰 카메라로 비추며 지나간 탁자 위에 안경이 놓여 있었다는 걸 기억해내고 “빨간 사과 옆에 있다”고 알려줬다.
영화 속 에이아이 사만다와 흡사하다. 모바일 기기에 부착된 카메라와 음성, 텍스트 등을 복합적으로 이해하는 멀티모달(Multimodal, 다중 모드) 모델, 저지연성(실시간 의사소통), 기억 능력이라는 특성이 합쳐져 마치 사람처럼 듣고, 보고, 말할 수 있게 된 것이다.
이처럼 ‘인간 같은’ 에이아이는 유능한 비서, 친절한 학습 도우미, 외로움을 달래줄 가상의 친구가 될 수 있다. 그러나 동시에 여러 문제를 유발할 수 있는 양날의 칼이기도 하다. 사람이 만든 콘텐츠와 구별할 수 없는 가짜 뉴스, 딥페이크가 빈번히 유통되고 있으며 미국 대선 등 선거에 영향을 미치기 위한 각종 악용 사례도 등장한다.
한가지 희망적인 것은 에이아이가 인간과 비슷해지는 만큼 에이아이를 식별하는 기술도 함께 발전하고 있다는 사실이다. 구글이 개발한 디지털 워터마크 삽입 기술 ‘신스아이디(ID)’가 한 예다. 사람이 만든 디지털 콘텐츠와 에이아이가 만든 것을 구별할 수 있다면 피해를 예방하거나 최소화할 수 있을 것이다.
실리콘밸리는 영화 ‘그녀’의 배경이었던 2025년보다 1년 앞선 2024년 영화와 비슷한 수준의 에이아이를 선보였다. 이미 인류는 미증유의 영역에 진입한 셈이다. 우리 삶에 더 빠르고 강력하게 파고들 에이아이에 대응하기 위한 사회적 논의가 필요한 때다.