사람과디지털연구소

뉴스룸

HOME 뉴스룸

AI의 데이터 ‘무한 탐욕’…개인정보·저작권 침해 논란

작성일 23-11-29 조회수 2,924

본문

[챗지피티 6개월-AI의 두얼굴]
생성 AI, 대규모 데이터센터 필수
전력 공급·냉각수 소비도 엄청나
게티이미지, 영국 AI 기업에 소송
미드저니, 창작자들에게 소송당해

챗지피티와 같은 생성 인공지능은 검색창의 얼굴을 하고 있다. 인간은 그 얼굴에 주목하지만 답변이 생성되기까지, 검색창 너머에는 거대한 인공지능 생태계가 돌아가고 있다. 한쪽에서는 ‘먹잇감’인 데이터를 끊임없이 쏟아붓고, 다른 쪽에서는 대규모 데이터센터에 어마어마한 전력을 공급한다.

인공지능은 결코 혼자 힘으로 작동하지 않는다. 빅데이터와 전력 공급, 열 발생과 냉각이라는 돌고 도는 생태계의 끝에 ‘생성 인공지능’이 있다. 챗지피티가 탄생한 지 6개월, 이를 활용한 서비스가 폭발적으로 늘어나는 이때 인공지능 생태계의 문제를 지적하며 인류와 공존하는 법에 대한 논의도 시작되고 있다.

초거대 규모인 생성 인공지능의 데이터를 보관하고 처리하기 위해 24시간 가동되는 데이터센터는 인공지능 생태계의 핵심이다. 데이터센터는 막대한 전력과 냉각수가 필요하다. 지난 3월 미국 스탠퍼드대학의 ‘인간중심 인공지능 연구소’(HAI)는 ‘에이아이 인덱스 보고서’에서, 챗지피티의 기반인 거대언어모델 ‘지피티3’를 훈련하는 과정에 1287㎿h의 전기를 쓰고 502톤의 탄소를 배출한 것으로 추정된다고 밝혔다. 이는 미국의 120가구가 10년간 사용하는 전력과 맞먹는다.

미국 리버사이드 캘리포니아대학과 알링턴 텍사스대학 연구진은 챗지피티와 20~50개의 질문을 나눌 때마다 깨끗한 물 500㎖가 소비된다고 계산했다. 이는 생성 인공지능을 운영하는 빅테크 기업들이 데이터센터에서 발생한 열을 식히려 사용한 물의 양을 조사한 결과다. 연구진은 ‘지피티3’를 훈련하는 데도 70만리터의 물을 썼을 것으로 추정했다. 베엠베(BMW) 자동차 370대를 생산하는 데 쓰는 물의 양과 같다고 한다. 연구진은 만약 에너지 효율이 낮은 아시아의 데이터센터에서 ‘지피티3’를 훈련했다면 이보다 3배나 많은 물이 필요했을 것이라고 밝혔다.

국내의 데이터센터는 156곳(2020년 기준)으로, 2024년까지 24곳이 더 들어설 예정이다. 올 하반기 한국형 지피티를 내놓겠다고 밝힌 네이버와 카카오도 각각 별도의 데이터센터를 짓고 있다. ‘전기 먹는 하마’를 통제하고자 산업통상자원부는 지난 3월 전력 계통에 부담이 예상될 경우, 데이터센터에 전기 공급을 거부할 수 있도록 전기사업법 시행령을 고쳤다.

인공지능을 학습시키는 ‘데이터’는 권리침해와 양극화 문제를 안고 있다. 거대 빅테크 기업이 점유하고 있는 초거대 규모의 데이터에 비해 스타트업들이 접근할 수 있는 데이터는 초라하기만 하다. 자사의 인공지능이 학습할 ‘먹거리’를 구해다 주려 기업들은 분투하고 있다. 이 때문에 많은 기업인이 정부에 데이터 생태계 조성을 요청하고 있다.

데이터를 향한 인공지능의 탐욕은 개인정보와 저작권 침해 논란으로 이어진다. 세계 최대의 이미지·영상 플랫폼인 미국 게티이미지가 영국의 인공지능 이미지 생성 기업 ‘스태빌리티 에이아이’를 상대로, 미국 캘리포니아에서는 화가 등 창작자들이 ‘미드저니’ 개발사를 상대로 지식재산권 침해 소송을 제기했다. 개발자 커뮤니티 ‘스택 오버플로’도 최근 인공지능 제조사들이 자신들의 데이터를 무단으로 이용하는 것에 항의하며 데이터 유료화를 선언했다.

임지선 기자 sun21@hani.co.kr

AI의 데이터 ‘무한 탐욕’…개인정보·저작권 침해 논란 > 뉴스룸

인기검색어

뉴스룸

AI의 데이터 ‘무한 탐욕’…개인정보·저작권 침해 논란

페이지 정보

본문

관련링크

회원로그인