[AI기술]마우스의 드래그와 클릭만으로 이미지를 편집하는 DragGAN

생성 AI의 시대가 본격적으로 열리고 이미지를 조작하는 AI 도구의 기능은 계속 발전하고 있습니다. 최근에 선보인 또 하나의 놀라운 기술은 아직 논문과 간단한 데모 수준이지만, 사용자가 이미지 속의 객체를 드래그하여 모양을 마음대로 변경할 수 있는 매우 인상적인 것입니다.

간단한 마우스 클릭과 드래그만으로 자동차의 크기를 변경하거나 미소를 찡그린 얼굴로 조작할 수 있을 뿐만 아니라, 사진의 피사체를 마치 3D 모델처럼 회전하여 인물이 향하는 방향을 변경할 수도 있습니다. 한 데모에서는 사용자가 몇 번의 클릭만으로 호수의 반사와 산맥의 높이를 조정하는 모습도 볼 수 있습니다.

이 기술에 관심이 가는 것은 사용자가 최종 산출물에 대한 더 많은 통제권을 가질 수 있기 때문입니다. 사실적인 이미지를 생성하기 위해 DALL-E나 미드저니 같은 생성 AI 도구를 많이 사용하지만, 사용자의 의도와 100% 일치하는 결과를 얻기는 쉽지가 않습니다. 예를 들면 프롬프트로 “마스크를 하늘로 던지면서 즐거워하는 사람들의 사진을 만들어줘”라는 문장을 입력하면 멋진 이미지가 만들어지지만, 내가 원하는 포즈나 필요한 장면이 아닐 경우가 많습니다.

DragGAN이라는 이름의 이 모델은 이에 대한 명확한 해결책을 제시합니다. 인터페이스는 기존의 사진 편집 프로그램에 있는 이미지 워핑 기능과 완전히 동일하지만, 이 모델은 단순히 기존 픽셀을 번지거나 뭉개는 대신 피사체를 새롭게 생성합니다. DragGAN을 통해 누구나 픽셀의 위치를 정밀하게 제어하여 이미지를 변형할 수 있으므로 다양한 범주의 포즈, 모양, 표현 및 레이아웃을 조작할 수 있습니다

물론 현재로서는 우리가 볼 수 있는 것이 데모일 뿐이라서 기술의 완성도를 평가하는 것은 가능하지 않습니다. 예를 들어 최종 이미지가 얼마나 사실적일지는 사이트에 올린 저해상도 동영상만으로는 판단할 수 없습니다. 그렇지만, 하지만 이미지 조작에 대한 접근성을 높인 새로운 시도로 평가받을만 합니다. 트위터에 이 기술로 만든 영상들이 급속히 확산되고 있어서 많은 사람들의 관심을 받고 있는 것으로 보입니다.

사이트와 논문을 다운 받을 수 있는 곳의 주소는 다음과 같습니다.

사이트: https://vcai.mpi-inf.mpg.de/projects/DragGAN/

논문 다운로드: https://arxiv.org/pdf/2305.10973.pdf

인쇄하기