구글 클라우드, 버텍스 AI에서 동영상 생성 모델 ‘비오’와 이미지 생성 모델 ‘이마젠 3’ 제공

  • 박현아
  • 발행 2024-12-05 10:41
비오, 간단한 텍스트·이미지만으로 고화질 동영상 빠르게 생성… 마케팅 및 제작 프로세스 획기적 단축
디지털 워터마킹, 안전 필터, 데이터 거버넌스 등 엔터프라이즈급 보안 및 안전성 지원


구글 클라우드가 구글의 최신 동영상 생성 모델인 비오(Veo)와 최고 품질의 이미지 생성 모델인 이마젠 3(Imagen 3)를 버텍스 AI(Vertex AI)를 통해 고객에게 제공한다고 밝혔다.

구글 클라우드는 3일부터 비오를 버텍스 AI에서 프라이빗 프리뷰(private preview)로 제공한다. 비오는 고객이 간단한 텍스트나 이미지 프롬프트를 통해 고품질 동영상을 손쉽게 생성할 수 있도록 지원한다. 구글 클라우드는 이미지 기반 동영상 생성(image-to-video) 모델을 제공하는 최초의 하이퍼스케일러(hyperscaler) 기업으로서, 동영상 제작 워크플로를 간소화하고 기업이 기존의 크리에이티브 자산을 역동적인 영상 콘텐츠로 전환하며 창의적 표현의 새로운 가능성을 열 수 있도록 지원한다.

또한 다음 주부터 이마젠 3를 모든 버텍스 AI 고객에게 제공한다. 이마젠 3는 단순한 텍스트 프롬프트를 통해 사실적인 고품질의 이미지를 생성하고, 이전 버전 대비 뛰어난 디테일과 조명 표현, 아티팩트 감소량을 자랑한다.

버텍스 AI는 기업 고객이 AI 모델을 간편하게 커스터마이징하고, 성능을 평가하며, 주요 인프라에 배포할 수 있도록 지원하는 오케스트레이션 플랫폼을 제공한다. 버텍스 AI에서 제공되는 비오와 이마젠 3의 개발 및 배포는 구글의 AI 원칙에 따라 디지털 워터마킹, 안전 필터, 데이터 거버넌스와 같이 기본으로 제공되는 보호 기능을 통해 안전과 책임을 우선시하도록 설계됐다.

고성능 동영상 생성 모델 ‘비오’를 이제 버텍스 AI에서

구글 딥마인드(Google DeepMind)에서 개발한 비오는 텍스트 또는 이미지 프롬프트를 기반으로 다양한 영화적, 시각적 스타일의 고화질 동영상을 빠르게 생성한다. 비오는 자연어와 시각적 의미에 대한 뛰어난 이해를 바탕으로 프롬프트와 밀접하게 부합하는 동영상을 생성해 사람, 동물, 사물이 영상 전반에서 사실적으로 움직이도록 일관성 있고 자연스러운 영상을 제작할 수 있다.

비오는 기존 이미지 또는 AI가 생성한 이미지를 기반으로 영상을 생성한다.

기업은 버텍스 AI에서 비오를 활용해 간단한 텍스트 또는 이미지 프롬프트로 고품질 비디오를 손쉽게 생성할 수 있다. 이를 통해 제작 시간을 단축하고 비용을 절감하면서도, 비디오 콘텐츠를 빠르게 시범 제작하거나 반복할 수 있다. 비오의 기술력은 작업자가 더 높은 수준의 작업에 집중할 수 있게 돕고, 동영상 제작 과정의 지루하거나 반복적인 작업을 AI로 처리할 수 있게 도와준다. 이러한 기술력을 바탕으로 인간의 창의성을 위한 훌륭한 파트너의 역할을 제공한다. 눈길을 끄는 SNS 게시물을 제작하는 마케터나, 설득력 있는 프레젠테이션을 만드는 영업팀, 혹은 새로운 콘셉트를 모색하는 제작팀에게 비오는 워크플로를 간소화하고 시각적 스토리텔링의 새로운 가능성을 열어주는 파트너가 돼 준다.

버텍스 AI에서 최고 품질의 이미지 생성 모델 이마젠 3 정식 제공

이마젠 3는 최고 품질의 텍스트 기반 이미지 생성 모델로, 뛰어난 수준의 디테일을 갖춘 사실적이고 생생한 이미지를 제작할 수 있으며, 시각적 오류 역시 이전 모델 대비 크게 감소했다. 다음 주부터 모든 구글 클라우드 고객은 버텍스 AI에서 이마젠 3를 사용할 수 있으며, 이를 통해 간단한 텍스트 프롬프트로 고해상도 이미지와 동영상을 생성할 수 있다.

나아가 구글 클라우드는 고객이 비즈니스 요건에 맞게 이미지를 편집하고 맞춤 설정하도록 지원하는 새로운 기능을 허용 목록(allowlist)에 등록된 고객을 대상으로 제공한다고 밝혔다. 이마젠 3는 모든 이미지를 다듬고 맞춤화할 수 있는 강력한 편집 기능을 사용자 친화적인 방법으로 제공한다. 간단한 텍스트 프롬프트로 사진을 편집하거나 제품의 배경 업데이트를 포함해 마스크 기능을 기반으로 이미지의 일부만 편집하거나 필요한 크기에 맞춰 이미지를 확대 조정할 수 있다.

또한 이마젠 3의 커스터마이즈(Customization) 기능을 통해 더욱 강력한 제어 기능을 제공하며 모델이 원하는 특성을 가진 이미지를 생성하도록 설정할 수 있게 지원한다. 고객은 새로운 이미지를 생성할 때 브랜드, 스타일, 로고, 주제 또는 제품 특징을 직접 입력할 수 있으며, 이를 통해 광고 및 마케팅 자산의 마케팅 프로세스를 강화하고 개발을 가속화해 새로운 창의적 가능성을 개척할 수 있다.

엔터프라이즈 수준의 안전성과 보안

구글 클라우드는 신뢰할 수 있고 안전하며 책임감 있는 AI를 설계하고 개발하는 것을 최우선으로 한다. 이러한 구글 클라우드의 AI 원칙에 따라 버텍스 AI의 비오와 이마젠 3는 안전성을 핵심 근간으로 개발됐다.

· 디지털 워터마킹(Digital watermarking): 구글 딥마인드의 신스ID(SynthID)는 이마젠 3와 비오가 생성하는 모든 이미지와 프레임에 보이지 않는 워터마크를 삽입해 잘못된 정보나 출처가 표시되는 상황을 미연에 방지한다.
· 안전 필터(Safety filters): 비오와 이마젠 3에는 모두 유해 콘텐츠 생성을 방지하고 구글의 책임감 있는 AI 원칙을 준수하는 안전장치가 내장돼 있다. 구글 클라우드는 모델의 안전성과 개인정보보호를 향상하기 위해 새로운 기술 개발에 지속적으로 투자하고 있다.
· 데이터 거버넌스(Data governance): 구글 클라우드는 자사의 데이터 거버넌스와 개인정보 관리 정책에 따라 고객 데이터를 모델 학습에 사용하지 않는다. 고객 데이터는 오직 고객이 허용한 범위에 따라 관리된다.
· 저작권 면책(Copyright indemnity): 구글 클라우드는 업계 최초로 저작권 문제에 안심할 수 있는 생성형 AI 면책 조항을 제공하고 있다.

다양한 글로벌 기업 고객이 버텍스 AI에서 비오와 이마젠을 활용해 가치를 창출하고 있다. 글로벌 마케팅 및 커뮤니케이션 서비스 그룹 WPP는 자사의 마케팅 혁신을 위한 AI 기반 운영 체제인 ‘WPP 오픈(WPP Open)’의 이미지 생성에 이마젠 3를 활용하고 있다. 곧 WPP는 동영상 생성 과정에도 비오를 통합해 콘텐츠의 아이디어 구상 및 제작 과정을 간소화할 예정이다. 이러한 도입 확장을 통해 WPP는 더 높은 수준의 창의성과 효율성을 실현할 수 있게 됐다.

글로벌 디지털 여행 플랫폼 아고다(Agoda)는 버텍스 AI에서 이마젠과 비오를 시각 콘텐츠 제작을 위해 테스트하고 있다. 여행지의 고유한 이미지를 생성하고 이를 동영상 제작에 활용한다. 아고다는 비오와 이마젠을 사용해 홍보 동영상을 제작했으며, 이를 통해 제작 시간을 크게 단축했다.

글로벌 스마트 기기 공급업체인 아너(Honor)는 현재 수백만 대의 스마트폰에 이마젠을 탑재해 사용자가 직접 AI 이미지 생성 기능을 사용할 수 있도록 제공하고 있다. 이를 통해 사용자는 아웃페인팅(outpainting) 및 스타일(stylization) 같은 기능을 사용해 손쉽게 사진을 편집하고 수정할 수 있다.

<저작권자 ⓒ 더뉴스프라임, 무단 전재 및 재배포 금지>

박현아 기자 다른기사보기