[IT 언더라인] 가트너 공동기획
고품질 데이터 습득전략➊ 
다양한 산업에 AI 활용 늘며
데이터 확보·관리 능력 중요
클라우드 활용 에코시스템
머신러닝 적용 엣지 AI 필요

# 대화형 인공지능(AI) 서비스 챗GPT의 등장으로 그 중추 역할을 하는 생성형 AI가 미래 산업의 대세로 떠올랐다. 생성형 AI가 각 산업군에 본격적으로 적용되기 시작하면서 양질의 데이터를 확보하고 관리하는 기업들의 능력도 중요해졌다. 

# 그러면서도 기업들은 넘쳐나는 데이터 속에서 옥석을 구분하고, 빠르게 오가는 정보의 보안을 철저히 해야 한다. AI가 사회적 규범과 윤리적 잣대를 벗어나지 않도록 할 책무도 있다. 더스쿠프가 가트너와 함께 기업이 AI 시대에 적응하고 살아남기 위한 방법론을 살펴봤다. 

생성형 AI가 산업 전반에 퍼지면서 데이터 사이언스와 머신러닝의 중요성도 커졌다.[사진=게티이미지뱅크]
생성형 AI가 산업 전반에 퍼지면서 데이터 사이언스와 머신러닝의 중요성도 커졌다.[사진=게티이미지뱅크]

스스로 데이터를 학습ㆍ분석하는 ‘생성형 인공지능(AI)’ 열풍이 좀처럼 가라앉지 않고 있다. 생성형 AI가 산업 전반에 퍼지면서 고품질 데이터를 좀 더 효율적으로 확보하려는 기업도 부쩍 늘어났다. 최근 데이터 사이언스-머신러닝(DSML) 분야가 가파르게 성장하고 있는 건 이런 이유에서다. AI의 시대, 기업이 고품질 데이터를 습득하기 위해선 어떻게 해야 할까. 더스쿠프와 가트너가 두편에 걸쳐 답을 찾아봤다.

챗GPT(ChatGPT)의 등장 이후 생성형 인공지능(AI)은 2023년을 대표하는 트렌드로 떠올랐다. 세상을 떠들썩하게 만든 오픈AI의 챗GPT 외에도 구글 바드(Baard), 네이버의 하이퍼클로바X가 출격하며 빅테크 기업간 경쟁이 본격화했다.

이 때문인지 AI의 핵심 요소인 ‘데이터 품질’을 중요하게 여기는 이들이 늘어났다. 다양한 기업과 산업에서 머신러닝을 채택하고 있는 건 이를 잘 보여주는 사례다. 

데이터 품질을 끌어올리는 ‘데이터 사이언스 및 머신러닝(Data Science and Machine LearningㆍDSML)’ 역시 지나칠 수 없는 화두가 됐다. 이처럼 DSML 분야로 시선을 돌리고 있는 기업들을 위해 AI시대에 꼭 필요한 고품질 데이터를 습득하는 방법을 살펴봤다. 

■ 방법➊ 데이터 에코시스템 = 첫번째 방법은 클라우드 데이터 에코시스템이다. 데이터 에코시스템은 말 그대로 데이터 생태계다. 기업이 각종 정보를 수집→저장→분석→활용하는 데 사용하는 인프라를 통칭한다. 프로그래밍 언어, 패키지(함수ㆍ데이터ㆍ코드ㆍ문서 묶음), 알고리즘, 클라우드 컴퓨팅 서비스 등이 여기에 해당한다. 

기존 데이터 에코시스템이 독립형 소프트웨어였다면, AI 시대로 접어든 지금은 클라우드 네이티브 솔루션 형태로 변화하고 있다. 쉽게 말해, 클라우드의 이점을 최대로 활용할 수 있는 전용 기술, 툴(toolㆍ도구), 프로세스를 이용해 앱 환경을 구축한다는 거다. 가트너는 “내년까지 클라우드 내 새로운 시스템 배포 중 50% 이상이 이런 응집력 있는 데이터 에코시스템을 기반으로 이뤄질 것”으로 보고 있다. 

챗GPT가 촉발한 생성형 AI 열풍이 지속하고 있다.[사진=게티이미지뱅크]
챗GPT가 촉발한 생성형 AI 열풍이 지속하고 있다.[사진=게티이미지뱅크]

데이터 에코시스템이 데이터 관리 전략의 핵심이 될 것으로 예상하는 만큼, 기업들은 데이터 에코시스템의 품질을 평가하는 데 공을 들여야 한다. 분산된 데이터 문제를 해결할 능력이 있는지, 외부에 있는 데이터 소스에 접근해서 이를 통합할 수 있는지 여부를 꼼꼼히 확인해야 할 것이다. 

■방법➋ 엣지 AI = 고품질 데이터를 얻기 위한 두번째 방법은 엣지 AI(Edge AI)다. DSML이 더욱 역동적인 분야로 진화한다는 건 머신러닝을 더 다양한 환경에서, 더 많은 방법으로 활용하는 게 가능하다는 뜻이다. 머신러닝을 더 정확하게 만드는 새로운 기술 중 하나가 바로 엣지 AI다. 

엣지 AI는 인터넷이나 클라우드 같은 중앙집중형 서버에 연결할 필요가 없는 AI를 말한다. AI 알고리즘이 기기에서 생성한 데이터를 사용해서 머신러닝 모델을 실행하기 때문에 통신 지연이나 대역폭으로 인한 성능 제한이 없다.

또한, 데이터가 만들어지는 시점부터 바로 처리를 할 수 있어서 기업은 실시간으로 인사이트를 얻고 빠르게 새로운 패턴을 감지할 수 있다. 엄격한 개인정보 보호 요구사항을 충족할 수 있는 건 물론이다. 

이런 장점 덕분에 엣지 AI의 수요는 급증하고 있다. 가트너는 2025년까지 심층신경망(DNNㆍ딥 러닝에 사용하는 인공신경망)을 이용한 모든 데이터 분석의 55% 이상이 엣지 시스템에서 발생할 것으로 예측한다. 2021년 10% 미만이었던 수치와 비교하면 엄청난 성장이다. 

당연히 기업들은 이런 변화의 흐름에 뒤처지지 않도록 해야 한다. 가령, 사물인터넷(IoT) 기술을 활용하는 기업이라면 엔드포인트(서버에 실행명령을 요청하는 커뮤니케이션 채널의 한쪽 끝) 근처를 엣지 환경으로 전환할 필요가 있다.

엔드포인트와 가까운 곳에 엣지컴퓨팅 인프라를 구축하면 데이터 전송 비용과 지연 시간을 줄일 수 있기 때문이다. 이를 위해 기업은 엣지 환경 조성을 위한 애플리케이션을 마련하고 AI 학습 및 추론 과정을 파악해야 한다.  AI 시대에 살아남기 위한 또다른 데이터 습득법은 2편에서 소개해보겠다. 

박동배 가트너 시니어 어드바이저

윤정희 더스쿠프 기자
heartbring@thescoop.co.kr

저작권자 © 더스쿠프 무단전재 및 재배포 금지

개의 댓글

0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400

내 댓글 모음