DALL-E 3 프롬프트 작성법 (이미지 분석, 스타일 추출, 명령어 생성)
ChatGPT로 이미지를 만들어보려고 했는데 막상 어떤 말을 써야 할지 막막하셨던 적 있으신가요? 저도 처음에는 "멋진 풍경 그려줘" 정도로만 요청했다가 전혀 원하지 않는 결과물을 받고 당황했던 기억이 있습니다. DALL-E 3가 ChatGPT에 통합되면서 한글로 명령어를 입력할 수 있게 되었지만, 원하는 이미지를 정확히 만들려면 프롬프트(prompt)라고 부르는 명령어 작성 기술이 필요합니다. 프롬프트란 AI에게 원하는 결과물을 설명하는 지시문을 뜻하는데, 쉽게 말해 AI와 대화하는 방식이라고 보시면 됩니다. 오늘은 제가 직접 써보면서 찾은 가장 쉬운 방법을 공유해드리겠습니다.
마음에 드는 이미지를 ChatGPT에 올려보셨나요?
프롬프트를 처음부터 글로 작성하는 건 생각보다 어렵습니다. 특히 미술이나 디자인 쪽 공부를 하지 않으신 분들은 "어떤 스타일로", "어떤 구도로", "어떤 색감으로" 같은 표현 자체가 낯설 수밖에 없죠. 그래서 저는 완전히 다른 방식으로 접근했습니다.
일단 마음에 드는 이미지를 하나 골라서 ChatGPT 기본 창에 업로드합니다. 화면 왼쪽 상단에 있는 이미지 아이콘을 클릭하거나, 파일을 드래그해서 채팅창에 끌어다 놓으면 됩니다. 이미지가 올라간 게 보이면 업로드 성공입니다. 그 다음 이렇게 입력하시면 됩니다. "비슷한 이미지를 만들고 싶어. DALL-E 3에게 이미지를 만들어 달라고 명령할 거야. 알맞은 명령어를 적어주고 내가 이해할 수 있게 한글로 번역도 적어줘."
저는 MidJourney에서 만든 석양 도시 풍경 이미지를 올려봤습니다. ChatGPT는 이 이미지를 분석해서 "create an image similar to a cityscape during sunset with reflections on water"라는 영문 명령어를 만들어줬고, "해질 녘 물에 반사되는 도시 풍경과 비슷한 모습을 만들어줘"라고 한글 번역까지 친절하게 달아줬습니다. 이 과정을 이미지 프롬프팅(image prompting)이라고 부르는데, 쉽게 말해 이미지를 보고 그 특징을 글로 추출하는 기술입니다(출처: OpenAI).
프롬프트를 복사해서 DALL-E 3에 넣어보셨나요?
이제 ChatGPT에서 새 창을 열고 상단에서 GPT-4를 선택한 다음, 맨 아래에 있는 DALL-E 3를 클릭합니다. 참고로 DALL-E 3는 현재 유료 회원만 사용할 수 있으니 이 점은 미리 알아두시면 좋습니다. 명령어를 붙여넣기 전에 화면 비율을 선택할 수 있는데, 정사각형·가로·세로 세 가지 옵션이 있습니다.
저는 세로 비율로 이미지를 만들어 달라고 요청했습니다. 아까 복사한 영문 명령어를 붙여넣고 뒤에 "세로 비율로 만들어줘"라고 덧붙였더니, 4개의 이미지가 한 번에 생성됐습니다. 퀄리티가 정말 훌륭했는데, 솔직히 이 정도 수준이 나올 거라고는 예상 못했습니다. 제가 직접 써봤는데 정말 쓸 만합니다.
여기서 한 가지 더 나아가봤습니다. "나는 4번 이미지가 참 마음에 들어. 그런데 밤에 아름다운 야경의 풍경을 그렸으면 좋겠고 빌딩 수는 조금 더 적었으면 좋겠어"라고 추가 요청을 했더니, 빌딩 수가 줄어들고 야경으로 바뀐 이미지가 다시 나왔습니다. 이처럼 DALL-E 3는 대화형 인터페이스(conversational interface)를 지원하는데, 쉽게 말해 계속 대화하면서 이미지를 수정할 수 있다는 뜻입니다. 한 번에 완벽한 결과물을 기대하기보다는, 여러 번 대화를 주고받으면서 원하는 방향으로 조정하는 방식이 훨씬 효율적입니다.
강아지 표정을 바꾸는 것도 가능할까요?
저는 실험 삼아 강아지 이미지로도 시도해봤습니다. 기존 강아지 얼굴 이미지를 선택한 다음 "우는 강아지 얼굴로 그려줘"라고 요청했더니, 정말 눈물을 글썽이는 듯한 표정의 강아지 이미지가 나왔습니다. 영상을 찍으면서 시연할 때는 잘 안 됐는데, 평소에는 이렇게 잘 작동합니다. 이건 제 경험상 좀 재미있었던 부분입니다.
프롬프트를 구체적으로 넣으면 예상 가능한 범위 내에서 이미지가 나오고, 단순하게 넣으면 여러 가지 스타일로 다양하게 나옵니다. 만약 "구체적으로 어떻게 써야 할지 모르겠어"라고 생각되신다면, ChatGPT에게 직접 물어보시면 됩니다. 예를 들어 "30대 남자 직장인을 그리고 싶은데 어떤 프롬프트가 좋을까?"라고 물으면, ChatGPT가 아래처럼 옵션을 제안해줍니다.
- 로우앵글(low angle) - 아래에서 위로 올려다보는 구도로 인물을 강조하는 촬영 기법
- 파스텔 톤(pastel tone) - 부드럽고 연한 색감으로 따뜻한 분위기를 연출하는 색 조합
- 사이버펑크(cyberpunk) - 미래적이고 기술 중심적인 암울한 도시 분위기를 담은 장르
- 황혼(twilight) - 해가 지는 시간대의 부드러운 빛과 색감을 표현하는 시간대 설정
이렇게 옵션이 나오면 그중에서 마음에 드는 몇 가지만 골라서 조합하면 됩니다. 저는 "귀여운 강아지인데 일본 애니메이션 스타일, 크레용 느낌으로, 와이드스크린 비율로 만들어줘"라고 요청했더니 두 개의 이미지가 한 번에 나왔습니다. 그런데 크레용 느낌이 별로 마음에 안 들어서, 이미지 배경 부분만 선택한 다음 "크레용은 삭제하고 이미지 배경과 통일감 있게 만들어줘"라고 다시 요청했더니 훨씬 자연스러운 결과물이 나왔습니다.
제 경험상 이 방식이 가장 효율적이었습니다. 처음부터 완벽한 프롬프트를 쓰려고 하지 말고, 일단 만들어보고 마음에 안 드는 부분만 콕 집어서 수정 요청하는 게 훨씬 빠릅니다. DALL-E 3는 부분 수정 기능(inpainting)을 지원하기 때문에, 이미지 전체를 다시 만들지 않고도 특정 영역만 바꿀 수 있습니다. 쉽게 말해 포토샵 없이도 AI와 대화만으로 이미지를 편집할 수 있다는 뜻입니다.
확실히 DALL-E 3로 할 수 있는 게 점점 늘어가는 것 같습니다. 처음에는 "이게 될까?" 싶었던 기능들도 실제로 써보니 대부분 잘 작동했습니다. 무엇보다 한글로 대화하면서 이미지를 만들 수 있다는 점이 가장 큰 장점입니다. 영어 프롬프트를 외우거나 번역기를 돌릴 필요 없이, 그냥 생각나는 대로 말하듯 입력하면 ChatGPT가 알아서 해석해서 이미지로 만들어줍니다. 앞으로도 계속 업데이트될 기능들이 기대되고, 여러분도 한 번쯤 직접 시도해보시면 생각보다 쉽게 원하는 이미지를 만드실 수 있을 겁니다.
--- 참고: https://www.youtube.com/watch?v=nVNxZPCXoe8