Stable Diffusion 이미지 생성 모델

Stable Diffusion 모델은 Stability AI 에서 오픈소스로 공개한 이미지 생성 모델(text-to-image)입니다. Dall-e2나 구글의 Imagen과 같은 기존 모델들보다 필요 컴퓨팅자원을 대폭 줄여 VRAM 4GB이하의 환경에서도 구동이 가능합니다.

이 게시물에서는 Stable-Diffuwion의 간략한 사용방법과 네피리티에서 제공하는 테스트환경에(클라우드) 대해 소개합니다.



Stable Diffusion 프로세스(출처 : https://namu.wiki/w/Stable%20Diffusion)

Stable Diffusion 소개, 간단한 사용 방법

기본적으로 프롬프트(Prompt)와 네거티브 프롬프트(Negative Prompt)라는 텍스트 키워드를 사용해 이미지를 생성하는데 각 키워드들의 입력 순서에 영향을 받습니다.

입력된 프롬프트에 적절한 다수의 후보 이미지를 생성하고 네거티프 프롬프트의 키워드에 맞게 제거와 채택하는 디노이징(Denoising) 과정을 통해 결과 이미지를 생성합니다.

  • 이미지의 그림체는 생성시 모델에 가장 큰 영향을 받습니다. 기본적으로 사용되는 모델은 v1-5-pruned-emaonly이며 추가로 다운로드하여 적용 가능합니다.
  • 디노이징 과정에서 Seed라는 토큰을 이용해 어떤 이미지를 제거하고 채택했는지 작업 스타일을 저장합니다. 유사한 스타일의 이미지를 얻고싶다면 해당 이미지를 생성하는데 사용된 모델과 생성된 토큰을 동일하게 사용하여 유사한 결과물을 얻을 수 있습니다.
  • Step수를 조정해 이미지 생성 주기를 조절할 수 있으며 배치 사이즈와 카운트를 조정하여 한번에 생성되는 이미지 수를 설정할 수 있습니다.

그외 인물의 포즈를 지정해 주는 Controlnet과 Openpose-editor, 프롬프트 작성 시 태그 자동 완성과 같은 플러그인(extension)을 추가로 설치하여 더 편리하게 사용할 수 있습니다.

ContraoNet 플러그인을 활용한 이미지 생성(입력 이미지(좌)/ 결과 이미지(우), 출처 : https://huggingface.co/blog/controlnet)



Stable Diffusion 테스트 환경 제공

    네피리티는 설치 및 기본 설정이 완료되어 바로 사용이 가능한 Stable Diffusion 모델의 클라우드 서비스를 제공합니다.

    우측 상단의 문의하기 메뉴를 통해 요청바랍니다.



    네피리티
    No Comments

    Sorry, the comment form is closed at this time.