일러스트레이션 김대중 mayseoul@naver.com
일러스트레이션 김대중 mayseoul@naver.com

빅데이터란?
대용량 데이터를 활용·분석하여 가치있는 정보를 추출하고, 생성된 정보를 바탕으로 능동적으로 대응하거나 변화를 예측하기 위한 정보화 기술.

한 남성이 화가 잔뜩 난 채로 대형마트에 들어서더니 “매니저 나와”라고 소리 질렀다. 손에는 이 대형마트가 딸에게 우편으로 보낸 아기 옷과 침대 등 유아용품 할인쿠폰이 들려 있었다. 남성은 “내 딸은 아직 고등학생인데 이런 쿠폰을 보내다니. 임신을 부추기는 거냐”고 따졌다. 영문을 몰랐던 매니저는 우선 남성을 진정시키고 돌려보냈다. 며칠 뒤 재차 사과를 하려고 전화를 건 매니저에게 뜻밖의 반응이 돌아왔다. 이 남성은 “딸이 임신을 한 걸 뒤늦게 알게 됐다”며 사과했다. 미성년 딸이 부모 모르게 아이를 가졌던 것이다. 대형마트 마케팅팀은 부모도 몰랐던 딸의 임신 사실을 어떻게 알아챘을까? 답은 ‘빅데이터 분석’에 있다. 이 얘기는 미국 대형마트 ‘타깃’의 미니애폴리스 점포에서 실제로 일어났던 일이다. <뉴욕 타임스>가 보도한 이 사례는 빅데이터 분석의 힘을 여실히 보여준다. 대형마트는 고객이 가족에게도 알리지 않은 비밀을 찾아내 앞으로 무엇이 필요할지 정확하게 예측해냈다.

타깃의 빅데이터 전문가들은 고객의 25가지 구매 행태를 분석하면 여성의 임신과 출산을 상당히 정확하게 예측할 수 있다는 사실을 확인했다. 예를 들어 향이 나는 로션을 사던 여성이 무향의 로션으로 바꾸거나, 평소 사지 않던 미네랄 영양제를 갑자기 사들이는 경우다. 타깃은 고객 데이터베이스에 이를 적용했고, 전국적으로 수만명의 임신 추정 여성들을 가려내 관련 할인쿠폰을 보냈다. 이를 통해 고객의 구매 행동을 이끌어낼 수 있기 때문이다.

광고

이처럼 빅데이터의 힘은 정보 수집과 분석을 통한 ‘미래 예측’에서 나온다. 무슨 로션을 사는지 따위의 하찮은 정보로 임신과 출산 같은 민감한 정보를 추론해내는 게 빅데이터 기술의 놀라운 속성이다. 각국 정부와 기업들이 빅데이터의 경제적 가치에 주목하는 이유도 여기에 있다.

미 고교생에 날아온 육아용품 쿠폰고객 구매행동 분석으로 알아채국내서도 ‘빅데이터’ 경제가치 주목정보인권 둘러싼 논쟁도 가열

그렇다면 국내는 사정이 어떤가? 현행 ‘개인정보보호법’은 대형마트를 비롯한 기업들이 당사자의 동의 없이 정보를 수집하는 것을 금지한다. 이에 따라 기업들은 포인트 혜택을 내건 회원 제도를 활용해 부분적으로 정보 수집과 활용에 대해 사전 동의를 끌어내고 있다. 그런데 최근 기업들이 사전 동의 규제를 완화해야만 빅데이터 산업이 발전할 수 있다고 목소리를 높이면서 개인정보 보호 등 ‘정보 인권’을 둘러싼 논쟁이 가열되고 있다.

광고
광고

우리 정부는 빅데이터 산업의 경제적 가치가 점점 커질 것이라고 보고 기업들의 요구에 호응해 개인정보 보호 법제를 뜯어고칠 채비를 서두르고 있다. 미래창조과학부 등 6개 부처는 최근 ‘창조경제와 문화융성’을 주제로 한 새해 합동 대통령 업무보고에서 ‘빅데이터 활성화’를 신성장 동력으로 제시하고 본격적인 지원에 나서겠다고 밝혔다. 지원의 핵심에는 기업이 개인정보를 가능한 한 쉽게 모아서 ‘빅데이터’를 형성할 수 있도록 관련 법을 바꾸는 내용이 자리잡고 있다.

광고

미국 시장조사업체 아이디시(IDC)는 지난해 11월 세계 빅데이터 시장이 연평균 23% 성장해 2019년에는 486억달러(59조원)에 이를 것으로 내다봤다. 이 업체가 말하는 빅데이터 시장이란 기업과 정부 등이 빅데이터 기술을 도입하는 데 필요한 소프트웨어, 서비스, 인프라 구축 등을 말한다. 이 분야 세계 선두 업체는 미국의 아이비엠(IBM), 새스(SAS) 등이다. 미래부는 올해 업무계획 보고에서 이러한 빅데이터 시장의 국내 규모가 2014년 2013억원에서 지난해 2623억원으로 30% 이상 빠르게 성장하고 있다고 집계했다.

사실 빅데이터 시장의 경제적 가치는 이에 한정되지 않는다. 컨설팅회사 매킨지는 빅데이터 기술을 적용하면 세계 의료, 공공행정, 소매, 제조 등 각 부문에서 저마다 1%의 생산성 향상을 이룰 수 있다고 전망했다. 이럴 경우 분야별로 1000억달러(121조원)에서 7000억달러(847조원)의 부가가치가 추가로 생산된다.

이처럼 빅데이터 시대에 대한 경제적 기대감은 상당하다. 하지만 다른 한편에선 아버지보다 딸의 사정을 더 잘 아는 대형마트 같은 사례가 불러올 사회적 위험에 대한 우려도 만만찮게 나온다. 앞으로 사물인터넷(IoT) 기술은 우리 삶을 더 촘촘히 기록하고 인공지능(AI)은 이런 데이터 뭉치를 더 효율적으로 분석할 것이다. 결국 빅데이터를 입맛대로 요리하는 기업은 나도 깨닫지 못하는 내 취향과 행동양식을 속속들이 짚어내고, 가장 가까운 사람도 모르는 내 비밀을 알아챌 수도 있다. 빅데이터 활성화에 대한 모색과 아울러 개인정보 보호 법제의 새판을 짜기 위해 정부와 시민사회, 기업, 전문가들이 범사회적 논의를 시작해야 할 이유가 여기에 있다.

빅데이터 시장 빠른 성장뒤엔나도 모르는 사이 내 비밀 아는빅브러더의 출현 막을 수 없어방통위 2014년 ‘비식별화’ 허용동의없이 정보 사용 가능케 해정부는 ‘빅데이터’ 신사업 선정일단 진흥뒤 사후약방문식 사고영국·일본·독일 정보보호가 우선빅데이터 산업 앞서가는 미국도규제 약하지만 사후견제는 강력

앞서 2011년 이명박 정부의 대통령 직속 국가정보화전략위원회는 차세대 정보기술(IT) 도입 전략의 큰 그림을 그리면서 빅데이터 기술을 주요 육성 대상에 포함시켰다. 이어 2012년부터 ‘스마트 국가 구현을 위한 빅데이터 마스터플랜’이 수립되어 빅데이터 산업 진흥에 대한 모색이 본격화했다. 이듬해 박근혜 정부가 출범하자 창조경제를 강조하는 국정 기조 아래 이러한 관심은 더 커진 상황이다.

광고

결국 방송통신위원회는 2014년 12월 빅데이터 기업이 성장할 밑돌을 놓는다면서 ‘빅데이터 개인정보 보호 가이드라인’을 발표하기에 이른다. 이는 기업에 ‘비식별화’라는 만능열쇠를 주어 어떤 보호장치든 열어젖힐 수 있게 한 것이다. 비식별화란 개인정보의 일부를 가리거나 바꾸어 개인을 특정하지 못하게 하는 기법이다. 예를 들어 홍길동이라는 고객의 이름을 ‘600618’ 같은 번호로 바꾼 뒤 정보를 수집해 활용하는 식이다. 방통위는 비식별화를 거친 개인정보는 이미 개인정보가 아니라고 보았다. 현행법 아래선 개인정보의 수집과 활용에 사전 동의가 필수인데, 비식별화를 할 경우 동의 없이 수집, 가공, 제3자 판매도 할 수 있다는 게 방통위의 유권해석이다. 하지만 비식별화는 다른 정보를 활용한 재식별화의 위험이 늘 뒤따른다. 그럼에도 올해 들어 정부는 앞서의 유권해석을 법 개정으로 아예 명문화하려 하고 있다.

개인정보 보호 법제를 문제삼는 이들은 “빅데이터 산업에서 한국이 외국보다 많이 뒤처졌다”고 한탄한다. 하지만 이 주장은 사실 ‘미국보다 많이 뒤처졌다’는 얘기다. 미국은 애초 기업의 개인정보 침해에 큰 문제의식이 없었다. 기업이 길거리나 온라인 같은 열린 공간에서 개인의 행동양식을 관찰하고 수집해, 데이터를 축적하는 데 큰 제한을 두지 않았다. 덕분에 기업들은 입맛대로 빅데이터 산업을 키울 수 있었다. 한국법제연구원이 2014년 펴낸 ‘빅데이터 법제에 관한 비교법적 연구’ 보고서를 보면, 영국·일본·독일 등 주요국들은 개인정보 수집에 앞서 사전 동의가 필수적이다. 미국만 유일하게 기업이 정보를 먼저 수집하고 당사자가 거부하면 삭제하는 사후거부제를 채택한 것으로 나타났다. 다만 미국도 최근 들어 기업들의 도가 지나치자 뒤늦게 대응 움직임을 강화하고 있다.

한국은 현재 대부분의 나라가 채택한 사전동의제에서 미국식 사후거부제로 급격한 방향 전환을 시도하고 있다. 하지만 우리 정부 등이 개인정보 보호 정책의 핸들을 급하게 꺾으면서 간과하는 지점이 있다. 미국은 사전 규제가 느슨하지만, 정보 주체에게 불리한 일을 벌였다간 기업이 망할 수도 있는 강력한 사후 견제 시스템이 있다는 사실이다. 페이스북은 2011년 프라이버시 규칙을 위반했다는 이유로 손해배상액이 최대 150억달러(18조원)에 이를 수 있는 소송을 당했다. 법원이 이를 기각했지만, 페이스북은 간담이 서늘할 만했다. 이는 피해자 일부만 소송을 해서 배상 판결을 받아내도 모든 피해자가 배상을 받는 집단소송제가 있기에 가능한 일이다. 우리는 이런 시스템이 없다. 개인이 기업을 상대로 한 소송에서 이기기도 힘들뿐더러, 기업이 물어야 할 배상액이 크지 않아 사후 규제의 실효성이 떨어진다. 홈플러스가 경품 행사로 모은 2400만건의 고객 정보를 보험사에 팔아넘겨 기소됐지만, 1㎜ 크기로 인쇄된 약관을 통해 사전 고지를 했다는 이유로 무죄 판결을 받은 게 최근 일이다.

우려는 이에 그치지 않는다. 대형마트로부터 딸의 임산부용 쿠폰을 받는 것보다 섬뜩한 일은 따로 있다. 아무 쿠폰도 받지 못하는 것이다. ‘구조화된 차별’은 빅데이터 시대의 가장 큰 위험으로 꼽힌다. 당신도 알지 못하는 사이에 당신의 경제적 사정에 대해 속속들이 알아차린 기업들이 대형마트 할인쿠폰과 같은 경제적 기회를 아예 박탈할 위험이 적지 않다. 유럽연합(EU) 산하 정보보호연구팀은 이런 위험에 대해 “일자리와 은행 대출 기회, 건강보험 상품 가입까지 영향을 미칠 수 있다”며 “알고리즘(컴퓨터 프로그램)에 의한 불공정하고 차별적인 판단들이 내려질 수 있다”고 우려했다.

우리 정부의 빅데이터 진흥 정책은 이를 막을 브레이크에 대한 고민 없이 한 방향으로 가속페달을 밟기 시작한 것으로 보인다. 강장묵 고려대 교수(컴퓨터공학)는 “지금껏 우리 정보기술 정책은 일단 진흥시키고 문제가 터지면 고치자는 식이었다. 그 부작용이 개인정보 대량 유출 사고다. 빅데이터 기술도 같은 길을 걷다간 문제가 걷잡을 수 없게 증폭될 것이다. 또한 인간을 배려하지 않는 육성 정책의 산물들은 더 이상 세계 경쟁력을 갖추기 힘들 것”이라고 말했다.

권오성 기자 sage5th@hani.co.kr