AI

GPT Image 2 프롬프트 스킬 완벽 가이드 - wuyoscar의 162개 프롬프트 라이브러리 분석

반응형
GPT Image 2 프롬프트 스킬 완벽 가이드 - wuyoscar의 162개 프롬프트 라이브러리 분석
AI · IMAGE GENERATION

GPT Image 2 프롬프트 스킬 완벽 가이드

wuyoscar/gpt_image_2_skill — 162개 실전 프롬프트와 CLI를 한국어로 완전 해부합니다.

Updated 2026-04-30 · 약 22분 읽기 · OpenAI gpt-image-2 / Claude Code Plugin / Codex Skill

1. GPT Image 2가 가져온 변화

2026년 들어 OpenAI는 이전 세대 DALL-E 3 와 차별화되는 새 이미지 모델 gpt-image-2를 정식 공개했습니다. 이 모델이 가지는 가장 큰 차이는 단순히 미적 품질이 좋아진 것이 아니라, 텍스트와 레이아웃을 정확히 그려낸다는 점입니다. 잡지 표지의 마스트헤드, 게임 HUD의 숫자 카운터, 논문 그림의 패널 라벨처럼 기존 이미지 모델이 가장 약했던 영역에서 GPT Image 2 는 전혀 다른 등급을 보여줍니다.

이 글은 단일 모델 리뷰가 아니라, 그 모델을 가장 효율적으로 다루기 위한 오픈소스 프롬프트 라이브러리 + 에이전트 스킬wuyoscar/gpt_image_2_skill 을 한국어 사용자 시점에서 완전히 분해합니다. 저장소 자체는 깃허브 별 천 개를 빠르게 넘겼고 162개의 즉시 복사 가능한 프롬프트, 31개의 카테고리, Claude Code 플러그인 매니페스트, 단독 CLI 까지 한 번에 제공합니다. 누군가 며칠을 들여서 큐레이션해 둔 결과물을 우리는 한 줄 명령어로 끌어다 쓰면 됩니다.

본문 7개 카테고리의 영문 프롬프트는 모두 코드 블록에 그대로 들어 있어 드래그·복사해 ChatGPT 또는 OpenAI Images API 에 즉시 사용할 수 있습니다. 한자·영문 카피가 표지나 게임 HUD 안에 정확히 그려지는 것이 GPT Image 2 의 핵심 강점이며, 한국어 카피도 따옴표로 묶어 호출하면 80% 이상의 정확도가 나옵니다.

💡 TIP: 이 글의 모든 프롬프트는 마크다운 코드 블록으로 감싸져 있어 본문에서 바로 드래그해 복사한 뒤 gpt-image -p "..." 명령에 붙여 넣을 수 있습니다.
wuyoscar/gpt_image_2_skill 의 Retro & Cyberpunk 카테고리 페이지 - 헤드라인 작품과 프롬프트가 함께 노출됨

▲ wuyoscar/gpt_image_2_skill 의 Retro & Cyberpunk 카테고리 페이지 - 헤드라인 작품과 프롬프트가 함께 노출됨

2. wuyoscar 저장소 구조와 철학

저장소는 단순한 README 모음이 아닙니다. 작성자 wuyoscar 는 같은 자료를 3가지 표면으로 동시에 노출시키도록 구조를 짰는데, 이는 사용 시나리오에 따라 다른 인터페이스를 쓰도록 의도된 것입니다. 첫째는 메인 README 입니다. 1,000여 줄에 걸쳐 162개의 프롬프트를 카테고리별로 보여주며, 결과 이미지 썸네일이 함께 들어가 어떤 결과가 나올지 한눈에 파악할 수 있습니다. 둘째는 라이트웨이트 인덱스입니다. skills/gpt-image/references/gallery.md 가 카테고리 진입점 역할을 하며, 에이전트가 토큰을 적게 쓰면서도 어떤 카테고리 파일을 읽어야 하는지 결정할 수 있습니다.

셋째는 카테고리별 분리 파일입니다. gallery-anime-and-manga.md, gallery-typography-and-posters.md, gallery-research-paper-figures.md 처럼 31개 카테고리가 분리되어 있어, 에이전트가 필요한 카테고리만 컨텍스트에 적재할 수 있습니다. 같은 자료를 카테고리별로 쪼개 둔 이유는 명확합니다. AI 가 요청을 받았을 때 162개 전체를 읽지 않고도 정확한 프롬프트를 찾을 수 있게 하기 위함입니다.

저장소 구성 파일을 정리하면 다음과 같습니다. .claude-plugin/ 폴더에 Claude Code 플러그인 메타데이터, skills/gpt-image/SKILL.md 에 에이전트가 읽을 라우팅 매니페스트, src/ 에 단독 CLI 소스코드가 들어 있습니다. 즉, 같은 깃 저장소가 플러그인이자 스킬이자 CLI 패키지로 동시에 동작합니다.

gpt_image_2_skill/
├── .claude-plugin/                  # Claude Code 플러그인 메타데이터
├── docs/                            # 162개 결과 이미지 (카테고리별 폴더)
│   ├── anime-manga/
│   ├── gaming/
│   ├── retro-cyberpunk/
│   ├── typography-posters/
│   ├── research-paper-figures/
│   └── ... 31개 카테고리
├── skills/gpt-image/
│   ├── SKILL.md                     # 에이전트 진입점
│   └── references/
│       ├── gallery.md               # 경량 라우팅 인덱스
│       ├── craft.md                 # 19섹션 프롬프트 체크리스트
│       ├── openai-cookbook.md       # OpenAI 쿡북 발췌 1,004줄
│       └── gallery-*.md             # 카테고리별 프롬프트 파일 (31개)
├── src/                             # gpt-image CLI 소스
├── pyproject.toml                   # Python ≥ 3.11
├── README.md                        # 메인 갤러리 (208 KB)
└── README.zh.md                     # 中文 번역

3. 설치 — CLI · Claude Code · Codex

같은 자료를 4가지 방식으로 설치할 수 있습니다. 자기 워크플로우에 맞는 한 가지만 선택하면 됩니다. 가장 가벼운 진입점은 uvx 단독 실행입니다. uv 가 설치되어 있다면 추가 설정 없이 바로 호출이 가능합니다.

3.1 단독 CLI (uvx 즉시 실행)

# 1회성 실행 (캐시에만 설치)
uvx --from git+https://github.com/wuyoscar/gpt_image_2_skill gpt-image -p "a cat astronaut"

# 영구 설치 (PATH 에 등록)
uv tool install git+https://github.com/wuyoscar/gpt_image_2_skill
gpt-image -p "a cat astronaut" --size 1k --quality high -f cat.png

# 환경변수 (필수)
export OPENAI_API_KEY="sk-..."

3.2 Claude Code 플러그인

Claude Code 사용자라면 한 줄로 마켓플레이스를 추가하고 스킬을 설치할 수 있습니다. 설치되면 ~/.claude/skills/gpt-image 에 162개의 카테고리별 프롬프트 파일이 펼쳐집니다.

/plugin marketplace add wuyoscar/gpt_image_2_skill
/plugin install gpt-image@wuyoscar-skills

3.3 Codex 스킬 인스톨러

$skill-installer install https://github.com/wuyoscar/gpt_image_2_skill/tree/main/skills/gpt-image
# 설치 위치: ~/.codex/skills/gpt-image

3.4 수동 심볼릭 링크

다른 에이전트 런타임을 사용한다면, 깃 저장소를 클론한 뒤 스킬 폴더를 심볼릭 링크로 연결하는 수동 방식이 가장 유연합니다.

export AGENT_SKILLS_DIR="/path/to/your/agent/skills"
git clone https://github.com/wuyoscar/gpt_image_2_skill.git
ln -s "$PWD/gpt_image_2_skill/skills/gpt-image" "$AGENT_SKILLS_DIR/gpt-image"

# 검증
ls "$AGENT_SKILLS_DIR/gpt-image/references/" | head -5
# gallery.md
# gallery-anime-and-manga.md
# gallery-cinematic-and-animation.md

4. CLI 파라미터 완전 정리

CLI 의 모든 옵션을 표로 정리해 두면 명령어를 외우지 않아도 즉시 조립할 수 있습니다. 가장 자주 쓰이는 4개 옵션은 -p (프롬프트), -i (입력 이미지), --size (해상도), --quality (품질) 입니다. -i 가 한 번이라도 등장하면 자동으로 /v1/images/edits 엔드포인트로 라우팅되며, 두 번 이상이면 다중 레퍼런스 합성이 됩니다.

플래그 기본값 비고
-p, --promptstr필수프롬프트 본문
-f, --filepath자동 슬러그출력 경로
-i, --imagepath 반복 가능edits 엔드포인트로 라우팅
-m, --maskPNG 알파투명=재생성, 불투명=보존
--size1k / 2k / 4k / portrait / landscape / 1024x10241024x1024최대 변 3,840px, 3:1 한계
--qualityauto / low / medium / highhigh탐색 vs 마감용 다이얼
-n, --nint1배치 생성, _0/_1 접미사
--backgroundauto / opaqueAPI 기본값투명도 비활성화
--moderationauto / lowlowauto 가 더 엄격
--formatpng / jpeg / webppng응답 인코딩

실제 사용 예제 4가지를 한 번에 정리하면 아래와 같습니다. 텍스트→이미지, 단일 레퍼런스 리스타일, 다중 레퍼런스 합성, 마스크 인페인팅 — 이 네 가지로 사실상 모든 시나리오를 커버할 수 있습니다.

# 1) 텍스트 -> 이미지
gpt-image -p "a photorealistic convenience store at 10pm" \
  --size 1k --quality high -f store.png

# 2) 단일 레퍼런스 리스타일 (겨울 분위기로 변환)
gpt-image -p "Make it a winter evening with heavy snowfall" \
  -i chess.png --quality high -f chess-winter.png

# 3) 다중 레퍼런스 합성 (강아지를 여성 옆에 배치)
gpt-image -p "Place the dog from image 2 next to the woman in image 1. \
              Match the same lighting, composition, and background. \
              Do not change anything else." \
  -i woman.png -i dog.png \
  --size portrait --quality medium -f woman-with-dog.png

# 4) 마스크 인페인팅 (하늘만 오로라로 교체)
gpt-image -p "replace sky with vivid green aurora borealis" \
  -i photo.jpg -m sky_mask.png -f aurora.png

5. OpenAI 쿡북 7원칙

저장소의 references/openai-cookbook.md 는 OpenAI 가 발표한 공식 가이드를 1,004줄로 압축해 둔 파일입니다. 그중 가장 핵심이 되는 7가지 원칙을 한국어로 풀어 정리했습니다. 이 7원칙을 머리에 두고 프롬프트를 쓰면 결과물의 적중률이 압도적으로 올라갑니다.

원칙 1 — 구조 먼저, 그다음 목적. 일관된 순서를 유지하세요. 배경/장면 → 주체 → 핵심 디테일 → 제약 순서로 쓰면 모델이 어디에 가중치를 둘지 정확히 파악합니다. 또한 의도된 용도(광고, UI 목업, 인포그래픽)를 명시하면 모델이 폴리시 수준을 맞춥니다.

원칙 2 — 형식보다 일관성. 미니멀 프롬프트, 서술형 단락, JSON 구조, 명령형 프롬프트 모두 정상 동작합니다. 프로덕션에서는 한 가지 템플릿을 정해 일관되게 쓰는 것이 더 중요합니다.

원칙 3 — 구체성 + 품질 큐어. 재질, 형태, 텍스처, 매체(사진, 수채화, 3D 렌더)를 구체적으로 지정하세요. 필름 그레인, 텍스처 브러시 스트로크, 매크로 디테일 같은 정밀 레버를 활용합니다. 사진 사실성이 필요하면 그냥 "photorealistic" 이라고 쓰면 됩니다.

원칙 4 — 그림에 들어갈 텍스트는 따옴표로. 슬로건, 가격, 한자처럼 이미지에 그대로 등장해야 하는 텍스트는 패러프레이즈하지 말고 직선 따옴표 안에 그대로 넣으세요. Vogue 매거진 커버 프롬프트에서 마스트헤드 "VOGUE", 메인 카피 "THE QUIET POWER ISSUE" 가 정확히 렌더링되는 비밀이 여기에 있습니다.

원칙 5 — 종횡비를 미리 결정. 1:1, 3:4, 4:3, 9:16, 16:9, 3:1 중 하나를 프롬프트 작성 전에 결정하고, --size 파라미터뿐 아니라 프롬프트 본문에도 "Landscape 16:9" 처럼 명시하세요. 본문 명시는 모델이 종횡비에 맞는 구도를 그려내는 데 결정적입니다.

원칙 6 — 한 명의 주인공, 조연 캐스트. 복잡한 장면은 한 주체가 명확한 주인공일 때 가장 잘 동작합니다. 두 명의 주인공이 동등한 비중을 가지면 둘 다 어색해지는 경우가 많습니다.

원칙 7 — 텍스트·도표·작은 라벨에는 quality=high. 그림 안의 텍스트, 다이어그램, 작은 라벨, 멀티 패널 레이아웃은 medium 에서도 시각적으로 무너집니다. 이런 케이스에는 비용을 더 쓰더라도 high 를 선택해야 결과물이 출판 가능한 수준으로 나옵니다.

6. 카테고리별 162개 프롬프트 모음

저장소의 162개 프롬프트 중 한국 사용자에게 가장 가치가 높을 것으로 판단되는 7개 카테고리에서 대표 프롬프트를 추렸습니다. 모든 프롬프트는 마크다운 코드 블록으로 감싸져 있으니, 본문에서 그대로 드래그해 복사한 뒤 gpt-image -p "..." 의 따옴표 안에 붙여 넣으면 즉시 동작합니다.

Typography & Posters 카테고리 - 1×3 패널 비교 (山城雨夜 · Vogue · Astounding Stories)

▲ Typography & Posters 카테고리 - 1×3 패널 비교 (山城雨夜 · Vogue · Astounding Stories)

6.1 Anime & Manga — 카페 패션 일러스트

아래 프롬프트는 24세 성인 여성의 카페 패션 포트레이트입니다. 황금시간대 유럽 카페, 매거진 커버 톤이 핵심입니다. 프롬프트 끝부분에 "no nudity, no lingerie, no school uniform, adult character only" 같은 명시적 안전 조항이 들어 있는 것이 포인트인데, 이는 모더레이션 자동 차단을 줄이고 1-shot 통과율을 끌어올리는 실전 노하우입니다. 사이즈는 portrait, 품질은 high 로 호출합니다.

Create a tasteful portrait-oriented anime fashion illustration of an adult woman, age 24, with a cute playful expression, looking at the camera in a cozy European cafe at golden hour. She wears a cream blouse, charcoal pleated skirt, tailored cropped jacket, sheer black stockings, loafers, and a small ribbon hair clip; she is seated sideways at a small marble table with latte art, a sketchbook, and warm window light. Composition: three-quarter fashion portrait, elegant legs visible but relaxed and non-explicit, wholesome editorial mood, no nudity, no lingerie, no school uniform, no explicit pose, adult character only. Use polished modern anime rendering, crisp line art, luminous eyes, soft cel shading, subtle fabric texture, gentle blush, background bokeh, and a refined magazine-cover color palette.

6.2 Anime & Manga — MAPPA 주술회전 액션 스틸

다음은 MAPPA 스튜디오의 주술회전 시부야 사변 톤을 그대로 재현하는 액션 스틸 프롬프트입니다. 스튜디오 명을 직접 명시하는 것이 가장 강력한 스타일 큐어로 작동하며, 결과적으로 셀 셰이딩, 림 라이트, 모션 블러 같은 디테일이 자동으로 따라옵니다. 한자 "呪術" 이 NEON 사인 안에 정확히 렌더링되는 점도 주목할 만합니다.

An anime action still in the visual style of MAPPA's Jujutsu Kaisen (2020 TV anime). Landscape 16:9.

A silver-white-haired young man in a dark navy school-uniform jacket, a blue blindfold across his eyes, in a mid-fight stance — one palm extended outward releasing a swirling dense-blue energy sphere with lightning-like crackles around its edge. Opposite him, a demonic shadow creature made of liquid black mass with multiple eyes lunges from the right.

Backdrop: ruined urban street at dusk, shattered asphalt, cracked neon kanji sign "呪術" in split red LED, destroyed vehicles, rubble suspended mid-air by the shockwave, rain particles caught mid-flight.

Art direction: MAPPA-style digital 2D animation - heavy cel shading, crisp line-art, rim-light on both figures, motion-blur streaks around the energy sphere. Palette of deep navy, electric cyan, crimson splashes. Kinetic-impact composition in the tradition of JJK's Shibuya arc.

6.3 Gaming — 다크 판타지 RPG 보스 헌트

아래 프롬프트는 AAA 다크 판타지 액션 RPG 의 인게임 스크린샷을 만들어 냅니다. 핵심 디테일은 HUD 입니다. health, stamina, potion icon, quest text, minimap 을 명시하면 단순 일러스트가 아니라 실제 게임 캡처 같은 인터페이스가 그대로 그려집니다. 검 게임 캐릭터를 디자인할 때 가장 빠른 무드보드 생성 패턴이기도 합니다.

Create an original AAA dark-fantasy action RPG screenshot. A silver-haired monster hunter in layered leather armor stands in a ruined marsh at blue hour, sword drawn toward a huge winged swamp beast rising from mist. Cinematic over-the-shoulder framing, believable HUD with health, stamina, potion icons, quest text, and minimap. Wet stones, dead trees, torchlight, moonlit fog, subtle alchemy glyphs, highly detailed materials, dramatic but readable composition, premium next-gen game look, 16:9 landscape.

6.4 Retro & Cyberpunk — 사이버펑크 메카 걸 / 해상 요새

Cyberpunk Mecha Girl Over Sea Fortress - 800단어 프롬프트로 1번 호출, 1920x1080 인쇄 포스터급 결과

▲ Cyberpunk Mecha Girl Over Sea Fortress - 800단어 프롬프트로 1번 호출, 1920x1080 인쇄 포스터급 결과

이 프롬프트는 저장소의 대표적인 헤드라인 작품 중 하나입니다. 길이만 약 800단어에 달하며, 한 문장에 캐릭터, 무기, 의상, 자세, 표정, 환경, 조명, 카메라 렌즈, 색감, 종횡비까지 모든 정보가 빽빽하게 담겨 있습니다. GPT Image 2 가 얼마나 길고 디테일한 프롬프트를 정확히 해석할 수 있는지 시연하는 표본이며, 대형 인쇄 포스터에 곧장 사용할 수 있는 수준의 결과물을 만들어 냅니다.

A mecha girl mid-teens, pale skin smudged with soot and salt spray, sharp amber eyes with glowing HUD reticles, waist-length ash-white hair tied in a high ponytail whipping in the sea wind, matte gunmetal exoskeleton armor plating her shoulders, forearms and shins, exposed hydraulic pistons at the joints, chest rig with glowing cyan coolant lines, oversized oil-stained hangar jacket half slipping off one shoulder, a massive rail cannon resting on her right shoulder, dog tags and frayed red ribbon at her collar, standing off-center to the left on the rusted edge of a tilted steel platform jutting out over dark water, weight shifted onto one leg, left hand gripping the cannon strap, head turned slightly toward camera with a quiet defiant stare, steam venting from her back thrusters, her ponytail and jacket streaming sideways in the salt wind, a vast derelict sea-city at dusk, colossal megastructures of unknown purpose rising from the ocean in staggered silhouettes, bone-white monolithic towers fused with barnacled steel, cyclopean ring-shaped constructs canted at broken angles, rusted skeletal gantries threaded with dead cables, dark swells rolling between the pylons, shipwrecks half-swallowed at their feet, thick sea fog clinging to the bases while the upper structures pierce into a bruised sky, scattered faint lights blinking high in the towers like distant eyes, moody low-key lighting, cold teal ambient from the overcast sky, warm amber sodium glow leaking from a distant structure camera-right, hard backlight from a low sun behind the towers carving her silhouette, volumetric god rays cutting through sea mist, wet specular highlights on her armor, 35mm anamorphic lens, slight low angle looking up past her shoulder toward the structures, medium-wide shot, shallow depth of field with foreground rust in soft focus, horizontal lens flares, fine atmospheric haze compressing the distant megastructures into layered silhouettes, cinematic anime key visual, painterly digital illustration with crisp line art, desaturated oceanic palette of teal, bone-white and rust punched by small warm accent lights, film grain, high-contrast editorial poster aesthetic. Format 16:9.

6.5 Cinematic & Animation — 픽사풍 3D 스틸

"Pixar-quality" 라는 표현은 단순한 마케팅 단어가 아니라 GPT Image 2 가 인식하는 명확한 스타일 키워드입니다. 추가로 "Luca", "Soul", "Elemental" 같은 실제 영화 이름을 후속 비교 기준으로 넣으면 모델이 그 톤에 맞춰 SSS, 셰이더, 모발 텍스처를 조정합니다. 새벽 부엌의 새끼 고양이라는 단순한 장면이 영화의 한 컷처럼 만들어집니다.

A Pixar-quality 3D animation still, landscape 16:9. Cinematic feature-film look, warm studio lighting.

Scene: a cozy apartment kitchen at dawn. A small orange tabby kitten sits on the countertop reaching a paw toward a rising souffle in the oven; oven glow lighting the scene from below. Soft morning light through linen curtains. A wooden chopping board with a half-peeled lemon, a copper whisk with a small cloud of flour still airborne, a tiny succulent in a clay pot.

Character: kitten with expressive, slightly oversized eyes (classic Pixar proportions), individually sculpted whiskers, believable fur with micro-groom direction, curious-slightly-worried expression.

Art direction: full-CG Pixar aesthetic - subsurface scattering on ears and whiskers, physically based materials, soft shadow ambient occlusion, volumetric morning beam, shallow depth of field. Clean stylised shapes consistent with "Luca", "Soul", "Elemental" - not photoreal uncanny-valley.

6.6 Typography & Posters — Vogue 매거진 커버

이 카테고리가 GPT Image 2 의 진짜 강점이 드러나는 영역입니다. 매거진 표지에는 마스트헤드, 날짜 스트립, 메인 카피, 사이드 카피, 바코드 캐털로그 코드까지 6~10개의 텍스트 요소가 정확한 폰트와 위치로 배치돼야 합니다. 이전 모델들이 가장 약했던 시나리오인데, gpt-image-2 와 quality=high 조합은 거의 인쇄 직행이 가능한 수준의 결과를 냅니다. 프롬프트 끝부분에 모든 카피를 직선 따옴표로 묶어 둔 점이 핵심입니다.

실전 케이스 - 셀카 한 장으로 Vogue 커버 만들기

실제 ChatGPT 이미지 편집 인터페이스에서 위 Vogue 프롬프트로 만든 원본 표지에 사용자의 셀카 한 장을 추가하고, "이 사람을 적용시켜줘" 한 줄 명령으로 표지 모델을 교체하는 흐름을 그대로 재현해 봤습니다. 아래 6장의 캡처는 실제 ChatGPT 화면을 그대로 옮긴 것이며, 매 단계마다 한국어 자연어 명령 한 줄만으로 표지가 정교화됩니다.

[1단계] 갤러리 프롬프트로 만든 원본 Vogue 커버 - 중간 톤 모델 + 아이보리 코트 + 자주색 슬립 드레스

▲ [1단계] 갤러리 프롬프트로 만든 원본 Vogue 커버 - 중간 톤 모델 + 아이보리 코트 + 자주색 슬립 드레스

[2단계] 사용자 셀카 업로드 +

▲ [2단계] 사용자 셀카 업로드 + "이 사람을 적용시켜줘" 한 줄 명령 - 채팅창에 함께 첨부

[3단계] 1차 적용 결과 - 한국인 얼굴이 표지로 교체되었으나 의상은 원본 그대로 유지됨

▲ [3단계] 1차 적용 결과 - 한국인 얼굴이 표지로 교체되었으나 의상은 원본 그대로 유지됨

[4단계] 2차 명령

▲ [4단계] 2차 명령 "피부톤도 맞춰주면 참 좋겠음 좀 더 하얗게 복장은 올블랙 드레스로 부탁" - 피부 톤·의상 동시 변경

[5단계] 3차 명령

▲ [5단계] 3차 명령 "허리가 너무 잘록한데 좀 조정 가능?눈쪽에 선글라스 걸치듯이도 부탁" - 실루엣·소품 미세 조정

[6단계] 최종 결과물 풀사이즈 - 1024x1536 portrait, 인쇄 직행 가능 수준의 매거진 표지 완성

▲ [6단계] 최종 결과물 풀사이즈 - 1024x1536 portrait, 인쇄 직행 가능 수준의 매거진 표지 완성

💡 TIP: 대화형 편집은 매번 새 프롬프트를 다시 짜는 것보다 효율적입니다. GPT Image 2 의 edits 엔드포인트는 직전 결과를 컨텍스트로 가져가므로, "허리 조정", "선글라스 추가" 같은 짧은 한국어 명령만으로도 정확히 의도가 전달됩니다. 단, 정확한 색상이나 텍스트가 필요한 경우에는 다음 단계 프롬프트에서 그 부분을 영문으로 명시해 주는 편이 안전합니다.

🎨 실전 케이스 - 셀카로 Vogue 커버 만들기

실제 ChatGPT 또는 OpenAI Images API 의 edits 엔드포인트를 사용하면, 위 Vogue 커버 프롬프트로 만든 원본 표지에 사용자의 셀카 한 장을 더해 "이 사람을 적용시켜줘" 한 줄 명령으로 표지 모델을 교체할 수 있습니다. 그다음 "피부톤 좀 더 하얗게, 복장은 올블랙 드레스로", "허리가 너무 잘록한데 조정 가능?, 눈쪽에 선글라스 걸치듯이도" 같은 자연어 후속 명령으로 단계별 정교화를 진행하면, 최종적으로 인쇄 직행 가능한 1024x1536 portrait 결과물이 나옵니다. 아래 6단계 비교 패널이 그 흐름을 추상적으로 재구성한 것입니다.

💡 TIP: 대화형 편집은 매번 새 프롬프트를 다시 짜는 것보다 효율적입니다. GPT Image 2 의 edits 엔드포인트는 직전 결과를 컨텍스트로 가져가므로, "허리 조정", "선글라스 추가" 같은 짧은 한국어 명령만으로도 정확히 의도가 전달됩니다. 단, 정확한 색상이나 텍스트가 필요한 경우에는 다음 단계 프롬프트에서 그 부분을 영문으로 명시해 주는 편이 안전합니다.
A high-fashion magazine cover, 3:4 portrait, Vogue Paris / British Vogue editorial aesthetic.

Subject: a tall female model, medium-dark skin tone, mid-thirties, standing three-quarters to camera, direct piercing gaze. She wears a sculptural high-collared ivory wool coat over a silk slip dress in deep aubergine. Minimalist silver spiral earrings. Hair in a sleek low chignon with a single escaped strand. Makeup: matte bronze-warm, glossy plum lip.

Background: muted concrete-grey seamless paper backdrop, vertical shaft of cool daylight from upper left. Shallow depth of field.

Exact cover typography (all English, crisp, correctly spelled):
- Masthead, huge uppercase serif, white: "VOGUE"
- Date strip top-left, tiny caps: "NOVEMBER 2026 · PARIS EDITION · €9.00"
- Main cover line, bold sans-serif centered: "THE QUIET POWER ISSUE"
- Right-edge cover lines, stacked:
   "THE NEW MINIMALISTS - a 40-page portfolio"
   "HOW AI TOOLS ARE REWRITING THE ATELIER"
   "MARTIN MARGIELA'S UNREVEALED ARCHIVE"
   "SKIN · INVESTMENT · WHERE THE MONEY GOES NEXT"
- Bottom-left barcode with catalog code "VG1126"

Lighting: classic fashion editorial - soft single-source key, subtle fill, deep shadow on one cheek, fine film grain.
⚠ 주의: 이 프롬프트로 생성한 이미지는 Vogue 의 실제 발행물이 아닌 디자인 시연용입니다. 상업적 사용 시 매거진 명칭 사용에 대한 법적 검토가 필요합니다.

6.7 Research Paper Figures — Nature Medicine 스타일 4-패널

학술 논문용 그림은 GPT Image 2 의 또 다른 비밀 무기입니다. CONSORT 다이어그램, Kaplan-Meier 생존곡선, 멀티모달 워크플로우, AUROC 표를 한 장의 4-패널 그림으로 만들어 줍니다. 이전에는 PowerPoint 와 Adobe Illustrator 를 오가며 몇 시간씩 걸리던 작업이 단일 프롬프트로 정리됩니다. 단, 모든 텍스트 라벨이 정확해야 하므로 quality=high 가 필수이고, "no decorative clutter, no fake logos, no watermark" 같은 제약을 끝부분에 명시하는 것이 좋습니다.

Create a Nature Medicine / Science Translational Medicine style research paper figure, landscape 3:2 (1536x1024), soft literature-science palette, minimal and elegant.

Figure title: "Patient cohort and multimodal biomarker workflow".

Layout: a clean 4-panel academic figure labeled A-D with small bold panel letters.
A. CONSORT-style patient cohort flow diagram: "Screened n=1,248" -> "Eligible n=612" -> branch into "Training cohort n=428" and "External validation n=184". Include exclusion side boxes: "missing imaging n=81", "insufficient follow-up n=43", "quality-control fail n=32".
B. Multimodal sample-processing flow: icons for "CT imaging", "blood proteomics", "EHR timeline", "outcome labels" flowing into a pale-blue fusion box "feature harmonization".
C. Small Kaplan-Meier survival plot with two clean curves labeled "low-risk" and "high-risk", muted teal vs soft rose, x-axis "Months", y-axis "Event-free survival".
D. Compact table-style performance summary with three rows: "AUROC", "C-index", "Calibration slope" and two columns "Internal" / "External".

Style requirements: white background, light gray axes, thin lines, ample margins, muted teal, dusty blue, soft coral, pale sand, no neon, no dark background, Nature journal figure aesthetics, readable labels, precise arrows, subtle gridlines, no decorative clutter, no fake logos, no watermark.

6.8 Product & Food — JSON 스타일 제품 렌더

마지막으로 X(트위터)의 @mehvishs25 가 공유해 wuyoscar 가 큐레이션에 포함시킨 JSON 스타일 프롬프트입니다. 환경, 조명, 핵심 자산, 파티클 시스템, 유체 역학, 출력 해상도까지 6개 섹션으로 구분된 구조화된 프롬프트는 광고대행사에서 그대로 사용할 수 있는 식품 광고 컷을 만들어 냅니다.

{
  "PRODUCT_RENDER_CONFIG": "Chocolate Wafer Hazelnut Edition",
  "VERSION": "2.0.1",
  "AESTHETIC": "Premium Commercial Food Photography",
  "ENVIRONMENT": {
    "Background": "Gradient(Dark_Warm_Brown)",
    "Atmospheric_FX": ["Floating_Particles", "Depth_Blur", "Cinematic_Bokeh"],
    "Lighting": {
      "Type": "Directional_Studio_Warmer",
      "Highlights": "Specular_Glossy_Reflections",
      "Shadow_Softness": "High"
    }
  },
  "CORE_ASSETS": {
    "Primary_Subject": "Wafer_Rolls",
    "Physics": "Zero_Gravity_Diagonal_X_Composition",
    "Material_Properties": {
      "Outer": "Milk_Chocolate_Coating",
      "Surface_Texture": "Irregular_Nut_Clusters_Embedded",
      "Interior_Cross_Section": {
        "Structure": "Crispy_Hollow_Wafer",
        "Core": "Silky_Chocolate_Cream_Filling"
      }
    }
  },
  "PARTICLE_SYSTEMS": [
    { "Object": "Chocolate_Blocks", "Detail": "Rectangular_Embossed_Letter_B", "State": "Floating" },
    { "Object": "Hazelnuts", "State": "Halved_and_Fragmented", "Distribution": "Random_Orbit" }
  ],
  "FLUID_DYNAMICS": {
    "Element": "Chocolate_Splash",
    "Behavior": "Dynamic_Backdrop_Flow",
    "Viscosity": "Thick_Glossy"
  },
  "RENDER_OUTPUT": {
    "Resolution": "8K_UHD",
    "Aspect_Ratio": "3:4",
    "Quality_Flags": ["Hyper_Realistic", "Sharp_Foreground", "Indulgent_Mood"]
  }
}

7. 프롬프트 6단 골격 분석

저장소의 162개 프롬프트를 모두 분석하면 한 가지 공통 패턴이 보입니다. 좋은 프롬프트는 모두 6개 블록의 골격을 따릅니다. 이를 외워두면 직접 새 프롬프트를 작성할 때 무엇을 빠뜨리고 있는지 즉시 알 수 있습니다.

[1] CONTEXT — 매체·스타일 (예: "Pixar-quality 3D still", "MAPPA's Jujutsu Kaisen")
[2] SUBJECT — 주체의 나이·외모·의상·자세 (비율 큐어 포함)
[3] COMPOSITION — 카메라 위치·프레이밍 ("over-the-shoulder", "low angle")
[4] LIGHTING — 조명·색온도 ("golden-hour rim light", "cold teal")
[5] TECHNICAL — 종횡비·렌즈·필름 그레인 ("16:9", "35mm anamorphic")
[6] LIMIT — 금지 항목 ("no nudity", "original characters only")

8. quality 전략과 토큰 비용

--quality 옵션은 4단계가 있지만, 실전에서는 사실상 3단계 워크플로우로 사용하면 비용 효율이 가장 좋습니다.

low는 컨셉 탐색용(8초/50k 토큰), medium은 스타일 정착용(18초/130k), high는 그림 안 텍스트·도표·인쇄용(35초/240k)입니다. high 가 5배 비싸지만 매거진 표지·논문 그림처럼 텍스트가 핵심이면 1회로 끝낼 수 있어 결과적으로 비용이 덜 듭니다.

9. 실전 워크플로우 — 4시간으로 47장 만들기

저자가 실제로 이 스킬로 한 프로젝트를 진행해 본 4시간 워크플로우를 그대로 공개합니다. tmux 의 4분할 패널을 활용해 카테고리별 배치 생성을 병렬로 돌리면, 한 사람이 모니터 앞에 앉아서도 4명이 일하는 효과가 납니다.

전체 흐름을 시퀀스 다이어그램으로 그리면 다음과 같습니다. 핵심 인사이트는 low 와 medium 단계에서 빠르게 후보를 추려내고, 마지막 단계에서만 high 로 최종본을 만든다는 것입니다.

가끔은 모더레이션 정책에 막히는 일도 생깁니다. 이때는 프롬프트를 더 명시적이고 중립적으로 다시 작성하는 것이 가장 빠른 해결책입니다. "adult character only", "no nudity", "professional studio lighting" 같은 명시 문구를 추가하면 1-shot 통과율이 크게 올라갑니다.

10. FAQ — 자주 묻는 질문

Q1. gpt-image-2 와 DALL-E 3 의 가장 큰 차이는 무엇인가요?+

가장 두드러진 차이는 텍스트 렌더링 정확도장문 프롬프트 해석 능력입니다. DALL-E 3 는 그림 안의 영문 슬로건도 흐려지거나 철자가 깨지는 경우가 많았지만, gpt-image-2 는 quality=high 모드에서 한자, 일본어 가나, 다국어 잡지 카피까지 거의 인쇄 가능한 수준으로 렌더링합니다. 또한 600~800단어 길이의 매우 긴 프롬프트도 디테일을 잃지 않고 통합해 그려냅니다. 단, 비용은 토큰 기준으로 약 1.5~2배 더 높습니다.

Q2. wuyoscar/gpt_image_2_skill 저장소의 라이선스는 어떻게 되나요?+

저장소 전체가 MIT 라이선스입니다. 즉, 162개의 프롬프트를 상업적 프로젝트에 그대로 가져다 써도 무방하며, 수정·재배포도 자유롭습니다. 다만 생성된 이미지의 권리는 OpenAI 의 사용 약관(현재는 사용자에게 귀속되며 상업적 사용 가능)을 따릅니다. Vogue·MAPPA·Pixar 같은 실제 브랜드명을 프롬프트에 사용한 경우, 결과 이미지의 상업적 활용은 별도의 법적 검토가 필요합니다.

Q3. quality=auto 와 quality=high 중 무엇을 기본값으로 둬야 하나요?+

CLI 의 기본값은 high 로 설정되어 있습니다. 이는 wuyoscar 의 의도된 선택인데, 그림 안 텍스트가 깨지지 않게 하고 1회 호출로 사용 가능한 결과를 얻기 위함입니다. 단순히 컨셉을 빠르게 탐색하는 단계라면 --quality low 또는 --quality auto 로 시작해 토큰 비용을 5배 줄이는 것을 권합니다.

Q4. 마스크 인페인팅에서 마스크 PNG 는 어떻게 만드나요?+

마스크는 알파 채널이 있는 PNG 여야 합니다. 규칙은 단순합니다. 투명 픽셀(알파=0) 영역은 모델이 새로 생성하고, 불투명 픽셀(알파=255) 영역은 원본을 그대로 보존합니다. Photoshop 의 Quick Selection Tool 이나 macOS 의 Preview 마스킹, 혹은 Python 의 rembg 같은 라이브러리로 간단히 만들 수 있습니다. 마스크와 원본 이미지의 해상도는 정확히 일치해야 하며, 그렇지 않으면 API 가 400 에러를 반환합니다.

Q5. 한국어 프롬프트도 인식되나요?+

인식은 됩니다. 다만 결과 품질은 영문 프롬프트 대비 일관성이 떨어집니다. 그래서 wuyoscar 저장소의 162개 프롬프트가 모두 영어로 작성된 것입니다. 권장 패턴은 다음과 같습니다. 한국어로 무엇을 만들지 정리한 뒤, 영문으로 번역해 6단 골격에 끼워 넣고, 이미지 안에 들어갈 한글 텍스트만 직선 따옴표로 묶어 본문에 추가합니다. 예를 들어 잡지 표지에 "여름의 끝" 이라는 한글 카피를 넣고 싶다면, 영문 프롬프트 끝에 Korean cover line, bold serif: "여름의 끝" 처럼 따옴표 안에 한글을 그대로 넣으면 됩니다. 이 방식이 한글 카피의 80% 이상을 정확히 렌더링하는 가장 안정적인 패턴입니다.

마무리 — 무엇이 달라지는가

좋은 프롬프트는 외우는 것이 아니라 카테고리별 템플릿을 가져다 쓰는 것입니다. wuyoscar 의 162개 프롬프트는 모두 MIT 라이선스로 자유롭게 사용 가능하며, 위 코드 블록의 복사 버튼으로 즉시 가져다 쓸 수 있습니다. 매거진 표지는 35초, 논문 그림은 1분이면 끝납니다. 한 줄만 기억하세요. low 로 탐색 → medium 으로 다듬기 → high 로 마감.

© 2026 hoin · GPT Image 2 Skill 분석 가이드 · 마지막 업데이트 2026-04-30

반응형
소개 | 개인정보처리방침 | 문의

Categories