[%%IMAGE1%%]구글·네이버·카카오 등 빅테크(대형 정보기술 기업)들이 검색과 블로그 등 대규모 서비스를 운영하며 쌓은 데이터를 인공지능 모델 학습 밑재료로 쓰는 것과 달리, 규모가 작은 스타트업은 인공지능 모델을 개발하고 싶어도 양질의 데이터 확보부터가 큰 과제다. 인공지능 챗봇 서비스 ‘아숙업’(AskUp)을 만든 스타트업 ‘업스테이지’(Upstage)가 최근 “저작권 걱정 없이 쓸 수 있는 한국어 텍스트 토큰(말뭉치 데이터) 1조개를 함께 모으자”며 언론사·기업·학계 등에 이른바 ‘<a href="https://www.upstage.ai/up-1-trillion-token-club" class="linkstyle-u" target="_blank" rel="noopener">1조 토큰 클럽</a>’ 조성을 제안한 이유다.[%%IMAGE2%%]많은 빅테크가 광범위한 데이터 학습 결과물인 거대언어모델(LLM)은 개방하더라도, 정작 그 모델이 어디에서 어떻게 데이터를 수집해 어떤 과정을 거쳐 학습했는지는 ‘영업 비밀’을 이유로 꽁꽁 숨긴다. 1조 토큰 클럽 조성 프로젝트를 이끄는 박찬준 업스테이지 거대언어모델 선임연구원(사진)은 지난달 23일 한겨레와 인터뷰에서 “빅테크는 자신이 보유한 데이터가 고유의 노하우라고 생각하겠지만 ‘폐쇄 일변도’로 대응하면 한국의 전체 인공지능 산업 발전이 더뎌진다”며 “애플리케이션 개발 도구(API) 개방을 넘어 학습 데이터까지 공유하는 문화가 자리 잡아야 상생이 가능하다”고 강조했다.박 연구원은 “남의 데이터를 공짜로 가져다 쓰겠다는 게 절대 아니다”며 데이터 기여자에 대한 보상 방법도 두 가지로 제시했다. 업스테이지는 우선 기업·기관들이 각자 필요한 생성형 인공지능 서비스를 만들 수 있도록, 거대언어모델을 애플리케이션 개발 도구(API) 형태로 개방하고 활용 가이드를 제공할 계획이다. 또 기여한 데이터양에 비례해 모델 사용료 일부를 면제할 방침이다. ‘수익 공유 ’도 약속했다 . 예를 들어 회원사들이 제공한 데이터로 만든 인공지능 모델로 업스테이지가 100억원을 벌게 되면 , 그중 절반인 50억원을 1조 토큰 클럽에 일종의 발전 기금 형태로 예치하고 , 이를 회원사들에 기여도에 따라 분배할 방침이다 .정인선 기자 <a href="mailto:ren@hani.co.kr">ren@hani.co.kr</a>

[사설] 2년 만에 성사된 윤-이 회담, ‘민심’ 받들고 ‘민생’ 위한 ‘협치’ 첫걸음 돼야

“이종섭 통화 날짜 기억 안 난다”는 김용원…“8월14일” 증언 나왔다

공수처, 채상병 사건 수사 본격화…‘키맨’ 유재은 불렀다

윤 겨누는 채상병 특검법, 우리 대통령 달라질까요? [공덕포차]

해병 수사외압 의혹

좀비보다 더 무서운 기후위기…SF드라마로 만드니 현실감 있네

아기도 청소년도 255명 기후소송…“온실가스 목표치 불충분”

51개국 2340건 ‘기후소송’…“탄소정책 불충분 위헌” “인권 침해” 판단 잇따라

기후 위기

의협 “의대 교수 털끝이라도 건드리면 똘똘 뭉쳐 싸울 것”

서울성모병원도 주 1회 휴진…빅5 병원 교수 모두 참여

울산대·서울아산병원 교수들, 다음달 3일 단체 휴진

의대 정원 확대

우리집 냉장고의 반정부 양배추 [아침햇발]

‘금테크’ 원하신다고요? 집 앞 편의점으로 오세요~

가격 폭등에 ‘검은 반도체’ 된 김…채소·과일처럼 계약재배할까

치솟는 물가

녹색정의당, 다시 정의당·녹색당으로…“뼈아픈 총선 결과 성찰”

민주, ‘채 상병 특검법’ 다룰 5월 임시국회 소집요구서 제출

‘찐명’ 박찬대 원내대표 단독 출마…찬반 투표 한다

22대 총선 이후

또 가자의 비극…응급 제왕 1.4㎏ 아기, 하늘나라 엄마 곁으로

미국, 가자 해안에 임시 부두 건설…“하루 200만끼 지원 가능”

“경찰이 고무탄 쐈다”…미 대학생 천막 농성 강경 진압 논란

중동 확전 기로

조국 “윤 대통령, 음주 자제하고 김건희 인맥 정리를”…10개 제안

‘이재명 엮으려고’…검찰, 이화영 ‘술판 회유’ 논란 일파만파

검사실서 사기범 통화 6번 방치…징계받은 ‘이화영 수사’ 지휘자

검찰 개혁

‘김건희 주가조작’ 언급만 하면…방심위·선방위 벌써 5번째 제재

민주 진성준 “윤, ‘칼춤’ 류희림 해촉하고 언론탄압 사과해야”

고민정·이준석·황운하 한목소리 “언론장악 세력 심판”

윤 정부 언론장악

‘굴착비용도 부풀려’…김건희 여사 오빠 사문서위조 혐의 재판 증언

대법, ‘김건희 녹취’ 공개한 서울의소리에 “1천만원 배상하라”

방심위, ‘김건희 주가조작’ 의혹 다룬 MBC 라디오도 징계

김건희 리스크

미 대법원 “트럼프 공적·사적 행위 구분해야”…재판 더 지연될듯

조현동 주미대사 “미국 대선 어떤 결과 나와도 동맹 변화 없어”

바이든은 ‘틱톡 강제 매각 법’ 서명했는데…선거캠프 계속 사용

미국 대선

상석 앉아 블링컨 만난 시진핑 “미·중은 협력자, 하지만…”

지원받을 땐 한국식, 봉양할 땐 미국식?…아들만 보면 화가 났다

서울엔 스위프트가 노래할 곳이 없다…대형 공연장 장기 공백

대학생 죽고, 전경은 일기 썼다 “진정한 분노의 대상 알아야”

머라이어 케리 발굴, 결별, 복수…주인공이고 싶었던 제작자

대만 해역서 5.0~6.1 지진 잇따라

‘의제 샅바싸움’ 접은 이 대표…‘모든 의제’ 떠안은 윤 대통령

해병대 수사외압 타임라인 총정리…특검이 밝혀야 할 ‘격노의 배경’ [논썰]

[단독] 한동훈 딸 ‘허위스펙’ 의혹 불송치 뒤집힐까…경찰, 다시 검토

“학생과 싸울 수 없다” 전경의 고백…‘열린 군대’의 씨앗이 되다

인공지능

거대언어모델

저작권

업스테이지

정인선

economy

AI 스타트업 ‘업스테이지’ 각계 제안 “데이터 공유로 상생…수익도 공유”

“한국어 데이터 토큰 1조개 함께 모으자”

계단 오르기만 꾸준히 해도 사망 위험 24% 줄인다

판문점 선언 6주년…문 “평화의 길로” 국힘 “망상 속 도보다리”

어른들 싸움 속에도…뉴진스 신곡 ‘버블검’ 뮤비 반일 만에 ‘500만 돌파’

캐머런 감독 “AI가 날 대체할 수도…배우 연기는 대신 못 해”

전체

홍준표 “행성이 주제 모르고 항성 이탈하면 우주 미아 될 뿐”

윤 대통령 직무 긍정평가 24%…“1%p 오른 건 반올림 때문” [갤럽]

홍준표 “한동훈, 국힘에 지옥 맛보게 해준 사람…용납 않을 것”

윤 대통령, 공수처장 후보에 판사 출신 오동운 변호사 지명

홍준표 “푸바오는 고향 간 판다에 불과…왜 집착하나”

심상정 정계 은퇴 선언 “통절한 마음으로 사죄드린다”

정치

경찰, 군 유가족 10명 검찰 송치…“검사 출신 김용원에 부화뇌동”

‘자두밭 청년’ 향년 29…귀농 7년은 왜 죽음으로 끝났나

에어컨 리모컨이 어딨더라…내일 대구 낮 최고 30도, 서울 29도

대법 “일용직 노동자 월 근로일수 산정…20일 초과 안 돼”

사회

7월 공개될 삼성 ‘갤럭시워치7’, 혈당 모니터링 기능 추가될 듯

전국 대중교통 환급 ‘K-패스’ 발급 시작…혜택 따져보세요

멤버십 58% 올린 쿠팡, 해지 방어에 쩔쩔

숏폼으로 “팔아요”…이제는 숏핑 시대

잘 나가는 구글, 사상 첫 배당 결정…주당 20센트

진로골드, 이제부터 ‘25도 빨간뚜껑’ 아닌 ‘15.5도 제로슈거’

정부 “일본의 ‘라인’ 지분 압박, 통상 문제로 갈 가능성 예의 주시 중”

김진아 한국외대 교수, 유엔사무총장 직속 군축자문위원 임명

레고랜드 사태, 정부도 늦었다…수백억 아끼려다 50조 투입

인수가 1조 ‘아시아나 화물’…후보 4곳 중 3곳은 자본잠식

경제

“참사 때마다 빨갱이 딱지 붙이는 거, 4·3이 시작이더라”

‘눈물의 여왕’, 웃음을 곁들인 눈물의 힘

가치관이 너무 안 맞네…일드 ‘부적절한 것도 정도가 있어’

독립 도색잡지 ‘젖은 잡지’ 들어보셨나요?

하이브, 민희진 오늘 고발…“‘뉴진스 계약 해지’ ‘빈껍데기 만들자’ 모의”

하이브 “뉴진스 홀대? 경영권 탈취는 농담?”…민희진 ‘격정 2시간’ 반박

민희진에 “K-직장인 애환 느껴졌다” “감정적 호소뿐”

[책&생각] 과학과 종교가 서로 충돌했다는 환상

문화

권력에 타협하지 않는 언론, 한겨레 후원회원이 되어주세요