Stable Diffusion Web UI 설치 및 사용법

그래서 스테이블 디퓨전을 써보려고 물어물어(사실 유튜브 봤음)

깔아봤습니다.

그걸 정리해보면

가장 많이 사용하고 있는 무료 오픈소스를 활용해서 시작해 보겠습니다.

아래 링크를 눌러주시면.

GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI

Stable Diffusion web UI. Contribute to AUTOMATIC1111/stable-diffusion-webui development by creating an account on GitHub.

github.com

요런 사이트에 접속됩니다. 아래로 스크롤을 내려주시면

Installation and Running부분이 나옵니다. 온라인 구글 드라이브(구굴은 정말 좋은 친구)를 이용할 것이기에

파란색 글씨로 List of Online Services를 클릭해줍니다.

구글 코랩에 다섯가지가 보입니다. 어떤걸 이용해도 상관없다고 합니다만 다 첫번째껄 설명하더라고요.

구글 코랩은 파이썬코드를 온라인 환경에서도 실행할 수 있게 구글에서 컴퓨터를 빌려주는 서비스입니다.

여러분이 좋은 성능의 컴퓨터가 없어도 심지어 스마트폰에서도 이 코드를 실행할 수 있습니다.

이서비스를 실행하기 위해선 구글 로그인을 해야 합니다. 모두들 구글 아이디는 하나쯤 있으시죠?

처음 커넥트 구글 드라이브라고 보이는데 한마디로 구글 드라이브로 연결한다는 뜻이기 때문에 구글 드라이브에 있는 자료가 해킹당하는 위험이 있을 수도 있습니다. 따라서 먼저 체크해보시고 사용하시면 좋을 것 같습니다.

로그인 하시고 Drive로 복사를 누르시면

이코드의 사본파일이 내 구글 아이디의 드라이브로 저장되어 이 코드를 실행 시킬 수 있습니다.

그리고 런타임 > 런타임 유형변경 > 하드웨어 가속기 > GPU로 선택해줍니다.

다음 코드를 실행시켜주는데요. 앞부분 플레이버튼같이 생긴 버튼을 눌러줍니다.

그러면 실행됩니다. 그러면 연결중이라고 보여지면서 시간이 조금 걸리고 연결되면 아래와 같은 팝업이 뜹니다.

파란색 google drive에 연결을 눌러줍니다. 로그인할 계정 리스트가 나오면 선택해주고 허용버튼을 눌러줍니다.

녹색 완료되었다는 메시지가 보입니다.

왼쪽에 폴더를 누르면 위에 이미지 처럼 gdrive와 sample_data란 폴더가 생성되어 연결이 잘된 것을 알수 있습니다.

순차적으로 다운받아주시고

Model Download/Load에서는 3가지 방식이 있습니다.

1. 별도로 다운받아 둔 모델이 없거나 처음이신분들은 여기서 다운받으시면 됩니다.

2. 다운받은 모델이 있으시면 두번째에 구글드라이브에 올려놓은 파일경로를 입력 해주시면 됩니다.

3. 다른 구글 드라이브에 있는 모델 파일도 가져 올 수 있습니다. 예) https://druve,giigke,cin/file/d/.....

1번으로 진행하면

모델 버전은 1.5으로 선택하고 redownload_the_original_model을 체크해줍니다.

그리고 왼쪽 플레이버튼 클릭

나머지 다 플레이 눌러주고

마지막 에 Running on public URL이 파란글씨로 링크가 연결되있는 것을 클릭

위와 같은 웹UI로 연결

프롬프트는 A cool but cute 40-year-old man with gray hair glasses 라고 적어봤네요.

파파고 이용해서 번역하시면 쉽게 가능하고요.

주황색 Generate버튼을 클릭하니 아래 이미지가 생성되었습니다.

밑에 다운로드 파란글씨를 클릭해서 다운받으셔도 되고

구글드라이브에 들어가셔서 sd> stable-diffusion-web-ui> outputs> txt2img-images> 생성날자 폴더에 들어가셔서 확인하셔도 됩니다.

메뉴 및 기능 소개

먼저 구글드라이브에서 stable-diffusion-webui> models> Stable-diffusion폴더에 다양하게 파인튜닝한 여러가지 모델들 ckpt파일을 넣고 원하는 스타일을 선택해서 사용할 수 있습니다.

선택은 맨왼쪽 상단을 클릭하여 원하시는 모델을 사용할 수 있습니다.

처음탭 txt2img는 말그대로 텍스트를 이미지로 변경해줍니다.

첫번째 칸은 prompt로 원하는 이미지를 묘사하는 텍스트를 입력해주면되고, 아래칸인 negative prompt는 반대로 원하지 않는 이미지(ugly나 bad finger같은)를 묘사하는 텍스트를 입력해주면 됩니다.

sampling steps는 노이즈에서 디노이즈로 갈때 단계를 말하며 기본은 20으로 설정되있고 스텝수가 적을수록 그림이 뭉개지는 경향이 있고 반대일경우 더 디테일한 경향이 있습니다.

smapling method는 어떤 방업을 쓸지 정해주는 것이고 크게 차이는 없지만 다양한 느낌으로 변화를 줄 수 있습니다.

varation정도로 보면 좋을 것 같습니다. 많은 데이터를 뽑아보면 그 차이를 알지 싶은데 아직은 잘 모르겠다고요.

batch count, size는 한번에 얼마나 생성할 거냐? size를 누르면 갯수가 많아집니다.

카메라 이름이나 렌즈 이름을 적으면 더 리얼하게 카메라로 찍은것 처럼 나온다고 합니다.

width , height는 결과물의 가로 세로 길이고요. 기본은 512x512에 맞춰있기 때문에 요사이즈에 최적화 있다고 보시면 됩니다.

Restore faces는 얼굴이 이상하게 나온 것을 한번 보정해줍니다.

Tiling은 생성한 이미지들을 타일로 여러개 배치 했을 때 괜찮게 나올 수 있게 만들어주는 것입니다.

Highres fix는 512x512보다 큰이미지를 만들때 이상한 요소들이 생성되는 것을 방지해 주는 역할을 한다고 합니다.

batch count는 이미지를 생성하는 횟수이고 batch size는 한번 생성시에 몇개를 생성할지 정해줍니다.

결과값은 이두개의 곱으로 결과값을 생성합니다.

CFG scale은 프롬트와 연관이 있는데요. 값이 높을수록 프롬프트에 최적화 돼서 뽑아지고 값이 적을 수록 창의적이게 뽑아집니다.

seed값은 기본으로 -1(랜덤값)로 정해져있는데요. 이미지를 생성하고 나면 아래 seed값이 보여집니다. 이seed값을 그대로 seed난에 입력하면 유사한 이미지로 생성이 가능합니다.

script중 prompt matrix는 여러가지 프롬프트를 실험해 보고 싶을 때

a busy city street in a modern city/illustration/cinematic lighting 이런식으로 구분해서 입력하면 케이스들에 대해 표의 형태로 비교해 볼수있고 결과를 아래와 같이 보여줍니다.

prompts from file or textbox를 클릭하면 여기에 프롬프트가 적힌 파일(메모장 등)을 끌어 올 수 있습니다.

마지막으로 x/y plot을 선택하면 x,y축을 정해서 다양한 옵션들을 시험해 볼 수 있습니다.

PNG info는 AI로 생성된 png의 프롬프트 및 정보들을 출력해줍니다.

하지만 stable diffusion으로 생성된 이미지만 정보를 보여주는 것 같습니다.

그밖에도 다양한 기능을 설명드리고 싶었으나 더 사용을 할 수 가 없더라고요.

이유는 구글드라이브 너무 많이 쓴다고 유료로 쓰라고 하더라고요. ㅜㅜ

그래서 제컴에 깔아서 쓰려고 하는데 유튜브 보면서 순서대로 잘 따라했는데 안되더라고요. ㅜㅜ

GPU도 분명 4기가 이상이라고 했는데 이것저것 유튜브를 찾아보니 AMD제품은 안된다네요. ㅜㅜ

역시 엔비디아여야 했어요. ㅜㅜ

엔비디아 주식사러 갑니다. ㅜㅜ

AI시대 즐기기

Stable Diffusion Web UI 설치 및 사용법

티스토리툴바