“생성형 AI의 큰 과제…지속적 ‘환각’ 문제, 상식 벗어난 답변”

6월12일 제3회 ‘한겨레 사람과디지털포럼’
기조연사 최예진 워싱턴대 교수 인터뷰

‘생성형 AI’ 데이터 좋을수록 훌륭
거대 기술기업 규모 확장 경쟁
소수 지배 인공지능 벗어나려면
역량 분산, 가치 다원주의 지원해야

수정 2024-05-30 11:55
등록 2024-05-30 11:44

기사를 읽어드립니다

0:00

지난 1월 미국 시애틀의 워싱턴대학에 있는 자신의 연구실에서 한겨레 인터뷰에 나선 최예진 교수의 모습. 임지선 기자

‘놀랍도록 똑똑하고, 충격적이게 어리석은’ 생성형 인공지능(AI)의 문제를 가장 날카롭게 파고드는 연구자라는 평가를 받는 최예진 미국 워싱턴대 교수가 올해 초에 이어 한겨레와 두번째 인터뷰에 나섰다. 지난 인터뷰에서 “거대 인공지능 기업들이 학습 데이터를 공개해야 한다”고 공론화 필요성을 강조했던 그는 이번 인터뷰에서 기업들의 데이터 공개 의지가 거의 없음을 지적하며 “학습 데이터의 저작권과 개인정보(프라이버시) 문제는 당분간 더 악화될 것”이라 내다봤다.

최 교수는 오는 6월12일 ‘사람 넘보는 인공지능, 인간 가치도 담아낼 수 있을까?’를 주제로 열릴 제3회 ‘한겨레 사람과디지털포럼’에 기조연사로 참여할 예정이다. 최 교수는 2022년 인공지능에 상식과 추론 능력을 불어넣는 연구로 천재들에게 준다는 맥아더 펠로상을 받았고, 지난해엔 ‘타임’이 발표한 ‘인공지능 100대 인물’에 한국인으로는 유일하게 포함됐다. 인터뷰는 전자우편으로 진행됐다.

―올해 생성형 인공지능의 확산 속도가 빨라지고 있다. 가장 시급하게 규제해야 할 대상은 어떤 문제라고 생각하나?

“시급한 문제를 하나만 꼽을 순 없다. 다가오는 미국 선거와 관련해 ‘페이크 뉴스’로 대표되는 가짜 미디어 문제, 개인정보 보호와 저작권에 대한 우려 증가, 인공지능 도입으로 인한 일자리 위협, 인공지능 모델에 만연한 편견과 윤리적 우려에 이르기까지 시급하고 중요한 문제가 많다.”

―치즈를 피자에 붙이는 방법을 물으니 접착제를 이용하라는 둥 구글 인공지능 검색의 위험하고 엉뚱한 답변이 논란이다. 인간의 능력을 뛰어넘는 범용인공지능(AGI)에 대한 논의는 어떻게 받아들여야 하나? 지금 우리가 경계해야 할 부분은 무엇인가?

“현재와 같은 형태의 생성형 인공지능에는 지속적인 ‘환각’ 문제, 놀랍도록 상식을 벗어난 답변, 윤리적 우려 등 주요 결함이 있다. 인공지능에 상식을 불어넣는 작업은 여전히 큰 과제로 남아 있다. 범용인공지능 얘기도 나오고 있지만 인공지능에 대한 불필요한 과장과 두려움을 조심해야 한다. 현재는 생성 인공지능의 기술(엔지니어링)적 발전에 비해 과학적 진보는 뒤처진 상황이라 과학자들 사이에서조차 침소봉대하는 ‘일반화의 오류’가 생겨나고 있다.”

―생성형 인공지능의 학습 데이터는 여전히 미스터리한 ‘블랙박스’로 남아 있다. 유명 배우 스칼릿 조핸슨도, 언론사 뉴욕타임스도 오픈에이아이(OpenAI)에 학습 데이터와 관련해 문제제기를 하는 상황이다. 학습 데이터의 법적·윤리적 문제를 안고 있는 생성형 인공지능이 계속 발전해 나가도 괜찮을까?

“생성형 인공지능은 훈련 데이터가 좋을수록 더 훌륭해진다. 그래서 학습 데이터 확보 경쟁은 불가피하다. 따라서 현재 개인정보와 저작권이 있는 데이터를 둘러싼 문제는 더 악화될 가능성이 크다. 적어도 예측 가능한 미래에는 그렇다. 인공지능 연구와 규제, 두 가지 방법을 통해 해답을 찾아가야 한다. 그러나 현재로서는 직접적 해결책은 없으며 여전히 어려운 과제로 남아 있다.”

―인공지능에 상식을 불어넣는 작업은 여전히 어렵고 윤리적 문제가 쌓여 있는데도 인공지능 기술이 광범하게 확산하고 있는 것은 아닌지 우려된다. 이에 대한 접근은 지난해보다 발전했는가?

“최근에 수행한 ‘다원적 정렬에 대한 로드맵’ 연구가 국제 인공지능학회(ICML)의 승인을 받았는데, ‘더 다양한 인간 가치와 관점을 이해하고 표현할 수 있는 시스템이 필요하다’는 내용이다. 합리적인 응답의 스펙트럼을 제시하는 모델, 특정 관점을 반영하도록 조종 가능한 모델, 주어진 인구 분포에 맞게 보정하는 모델 등 세 가지를 제시했다. 소수가 지배하는 인공지능이 되지 않기 위해서는 인공지능이 가치 다원주의를 지원해야 한다.”

―최근 마이크로소프트(MS) 등 빅테크 기업들이 거대언어모델뿐 아니라 작은 사이즈의 모델까지 내놓고 있다. 결국 초거대부터 소형까지 모든 사이즈의 인공지능 모델에서 빅테크의 영향력이 확대되는 양상을 어떻게 보는가?

“다양한 요구와 사용 사례를 충족하기 위해 서로 다른 규모의 인공지능 생태계가 출현하는 것을 막을 수 없다. 동시에 이를 두고 소수의 거대 기술기업들이 규모 확장 경쟁을 벌이는 것은 컴퓨팅 불평등(컴퓨터 자원이나 기술 사용의 불평등)의 위험을 안고 있다.”

―한겨레와 한 지난 인터뷰에서 인공지능 기업들이 학습 데이터에 대한 의혹을 해소하기 위해 ‘블랙박스’를 열어 보여야 한다고 지적했다. 이후 그러한 논의가 진행되고 있나?

“그러한 작업을 하게 되더라도 말할 수 있는 부분이 거의 없다. 다만 오픈에이아이와 같은 기업들이 자신들의 인공지능 모델 훈련에 쓴 데이터를 열어 보일 의지가 있는지 의심스럽다.”

―글로벌 빅테크와 미국 중심의 인공지능에 잠식되지 않으려 한국과 같은 나라는 매우 분주하고 또 조급하다. 국가적으로 인공지능 기업을 지원하려 하고 사전 규제를 최소화하려고 하다 보니 인공지능 기본법안 논의는 길어지고 있다. 한국형 규제에 대해 어떤 입장을 가져야 할까?

“규제는 매우 중요한 과제이며 아직까지 이에 대한 확실한 답을 제시한 국가가 없다는 점을 명심해야 한다. 인공지능뿐 아니라 인문학 전반에 걸친 학문 간 협업이 필요하다. 규제의 세부사항 부분에서는 유연성이 중요할 수 있다.”

―지난해 에릭 슈밋 구글 전 최고경영자, 그자비에 니엘 일리아드 창립자 등이 ‘유럽의 오픈에이아이’를 만들겠다고 나섰다. 여기에도 참여해 자문하고 있는 것으로 안다. 현재 유럽을 포함해 여러 지역에서 미국 중심을 벗어나 데이터 주권을 찾자는 ‘소버린 인공지능’(Sovereign AI) 움직임이 거세게 일어나고 있는데 어떻게 보나?

“시장을 주도하고 있는 인공지능의 주요 모델이, 미국에 기반을 둔 소수의 기술기업들에 의해 개발되고 소유되는 것은 매우 우려할 만한 상황이다. 곧바로 권력 집중으로 이어지기 때문이다. 인공지능 역량을 분산하는 것은 중요하며, 이 문제는 인공지능이 더욱 강력해짐에 따라 향후 몇년 동안 더욱 중요해질 것이다.”

―이번 포럼의 기조연설을 통해 한국의 청중에게 가장 전달하고 싶은 메시지가 있다면?

“전세계적인 인공지능 경쟁을 따라잡으려면 한국 정부와 산업계 모두의 막대한 투자와 지원이 필요하다. 인공지능의 기술적인 면을 발전시키는 것만큼 중요한 것은 인공지능 안전성에 대한 연구라는 이야기를 할 예정이다.”

최 교수는 포럼에서 ‘상식과 가치를 지닌 인공지능의 현재와 미래’를 주제로 기조연설을 한 뒤, 하정우 네이버 퓨처에이아이 센터장과 대담을 진행할 예정이다.

임지선 기자 sun21@hani.co.kr