Stable Diffusion 이미지 생성 모델

10 4월

Stable Diffusion 이미지 생성 모델

Stable Diffusion 모델은 Stability AI 에서 오픈소스로 공개한 이미지 생성 모델(text-to-image)입니다. Dall-e2나 구글의 Imagen과 같은 기존 모델들보다 필요 컴퓨팅자원을 대폭 줄여 VRAM 4GB이하의 환경에서도 구동이 가능합니다.

이 게시물에서는 Stable-Diffuwion의 간략한 사용방법과 네피리티에서 제공하는 테스트환경에(클라우드) 대해 소개합니다.

Stable Diffusion 프로세스(출처 : https://namu.wiki/w/Stable%20Diffusion)

Stable Diffusion 소개, 간단한 사용 방법

기본적으로 프롬프트(Prompt)와 네거티브 프롬프트(Negative Prompt)라는 텍스트 키워드를 사용해 이미지를 생성하는데 각 키워드들의 입력 순서에 영향을 받습니다.

입력된 프롬프트에 적절한 다수의 후보 이미지를 생성하고 네거티프 프롬프트의 키워드에 맞게 제거와 채택하는 디노이징(Denoising) 과정을 통해 결과 이미지를 생성합니다.

이미지의 그림체는 생성시 모델에 가장 큰 영향을 받습니다. 기본적으로 사용되는 모델은 v1-5-pruned-emaonly이며 추가로 다운로드하여 적용 가능합니다.
디노이징 과정에서 Seed라는 토큰을 이용해 어떤 이미지를 제거하고 채택했는지 작업 스타일을 저장합니다. 유사한 스타일의 이미지를 얻고싶다면 해당 이미지를 생성하는데 사용된 모델과 생성된 토큰을 동일하게 사용하여 유사한 결과물을 얻을 수 있습니다.
Step수를 조정해 이미지 생성 주기를 조절할 수 있으며 배치 사이즈와 카운트를 조정하여 한번에 생성되는 이미지 수를 설정할 수 있습니다.

그외 인물의 포즈를 지정해 주는 Controlnet과 Openpose-editor, 프롬프트 작성 시 태그 자동 완성과 같은 플러그인(extension)을 추가로 설치하여 더 편리하게 사용할 수 있습니다.

ContraoNet 플러그인을 활용한 이미지 생성(입력 이미지(좌)/ 결과 이미지(우), 출처 : https://huggingface.co/blog/controlnet)

Stable Diffusion 테스트 환경 제공

네피리티는 설치 및 기본 설정이 완료되어 바로 사용이 가능한 Stable Diffusion 모델의 클라우드 서비스를 제공합니다.

우측 상단의 문의하기 메뉴를 통해 요청바랍니다.

Tags:

Stability AI,Stable-Diffusion,Stable-Diffusion2,text-to-image