미드저니 얼굴 일관성: 같은 인물이 자꾸 달라질 때 고정하는 순서

미드저니 얼굴 일관성은 프롬프트를 더 길게 쓰는 문제보다, 무엇을 고정하고 무엇을 바꿀지 먼저 나누는 문제에 가깝습니다. 기준 얼굴 한 장, 짧은 식별 문장, --ow 비교값만 먼저 정해도 같은 인물이 다시 잡히는 경우가 많습니다. 장면과 표정까지 한 번에 흔들기보다, 얼굴 유지용 루틴을 따로 만들어 두는 쪽이 훨씬 안정적입니다.

미드저니 얼굴 일관성: 같은 인물이 자꾸 달라질 때 고정하는 순서 대표 이미지

한눈에 보기

한눈에 보기 내용을 설명하는 이미지

한눈에 보기

미드저니 얼굴 일관성은 프롬프트를 더 길게 쓰는 문제보다, 무엇을 고정하고 무엇을 바꿀지 먼저 나누는 문제에 가깝습니다. 기준 얼굴 한 장, 짧은 식별 문장, --ow 비교값만 먼저 정해도 같은 인물이 다시 잡히는 경우가 많습니다. 장면과 표정까지 한 번에 흔들기보다, 얼굴 유지용 루틴을 따로 만들어 두는 쪽이 훨씬 안정적입니다.

같은 얼굴이 자꾸 달라지는 이유는 묘사 부족보다 기준 충돌이 더 큽니다

같은 얼굴이 자꾸 달라지는 이유는 묘사 부족보다 기준 충돌이 더 큽니다 내용을 설명하는 이미지

같은 얼굴이 자꾸 달라지는 이유는 묘사 부족보다 기준 충돌이 더 큽니다

미드저니에서 같은 인물을 여러 장 뽑다 보면 첫 장에서는 분명 같은 사람 같았는데, 두 번째부터는 전혀 다른 모델처럼 보일 때가 많습니다. 이때 많은 분들이 얼굴 특징을 더 길게 적으려고 하지만, 실제로는 묘사가 부족해서가 아니라 고정 기준이 계속 바뀌기 때문인 경우가 더 많습니다. 기준 이미지는 달라지고, 조명 문장은 매번 바뀌고, 표정과 의상까지 한 번에 흔들리면 모델이 무엇을 유지해야 하는지 읽기 어려워집니다.

그래서 얼굴 일관성을 잡을 때는 프롬프트를 풍성하게 만들기보다 먼저 기준을 줄여야 합니다. 바뀌면 안 되는 요소를 다섯 개 안팎으로 정리하고, 바뀌어도 되는 요소는 장면 변수로 따로 분리하는 식입니다. 이 기본 구조를 먼저 이해해 두면 미드저니 레퍼런스 이미지 완전 정복에서 설명한 --iw, --sref, --oref 역할도 훨씬 덜 섞이게 됩니다.

기준 얼굴은 예쁜 컷보다 식별 포인트가 읽히는 컷이 유리합니다

기준 얼굴은 예쁜 컷보다 식별 포인트가 읽히는 컷이 유리합니다 내용을 설명하는 이미지

기준 얼굴은 예쁜 컷보다 식별 포인트가 읽히는 컷이 유리합니다

기준 얼굴 한 장을 고를 때 가장 흔한 실수는 화보처럼 멋진 컷을 고르는 것입니다. 하지만 얼굴 일관성의 기준 이미지는 보기 좋은 사진보다 식별 포인트가 선명한 사진이 더 좋습니다. 얼굴형, 눈매, 눈썹 모양, 코선, 헤어 라인처럼 다시 만들어야 할 신호가 또렷해야 하고, 액세서리나 강한 역광처럼 얼굴 인식을 방해하는 요소는 적을수록 유리합니다.

실무에서는 정면에 가까운 컷 하나, 살짝 3/4 각도의 컷 하나 정도만 따로 모아 두면 충분합니다. 다만 처음 실험에서는 한 장만 쓰는 편이 좋습니다. 기준이 두 장 이상 들어가면 어떤 요소를 따라야 하는지 다시 분산될 수 있기 때문입니다. 특히 블로그 썸네일, 브랜드 모델 컷, 캐릭터 소개 이미지처럼 계속 재사용해야 하는 얼굴일수록, 첫 기준 이미지를 단순하게 고르는 쪽이 나중에 시간을 덜 씁니다.

얼굴 고정은 oref가 맡고, 장면 변화는 본문 프롬프트가 맡아야 덜 흔들립니다

얼굴 고정은 oref가 맡고, 장면 변화는 본문 프롬프트가 맡아야 덜 흔들립니다 내용을 설명하는 이미지

얼굴 고정은 oref가 맡고, 장면 변화는 본문 프롬프트가 맡아야 덜 흔들립니다

V7 기준으로 사람이나 사물을 직접 붙잡아 두고 싶다면 --oref가 가장 실전적인 도구입니다. 하지만 여기서 중요한 건 --oref가 모든 요소를 복사하는 버튼이 아니라는 점입니다. 얼굴 고정은 --oref가 맡고, 장소나 표정, 카메라 거리 같은 장면 변화는 본문 프롬프트가 맡는 식으로 역할을 나눠야 합니다. 이 구분이 안 되면 얼굴을 바꾸고 싶은 건지, 장면을 바꾸고 싶은 건지 모델 입장에서도 모호해집니다.

portrait of the same woman, oval face, soft straight brows, short black bob, calm gaze, natural skin texture,
quiet cafe window seat, soft daylight, editorial portrait --oref [reference image] --ow 140 --ar 3:4

여기서 핵심은 얼굴 설명과 장면 설명이 한 덩어리처럼 섞이지 않는 것입니다. 인물 프롬프트 구조가 아직 약하다면 미드저니 인물 사진 프롬프트 템플릿 모음 쪽을 먼저 보고, 표정·거리·구도를 어떤 순서로 조합할지 감을 잡는 편이 훨씬 빠릅니다.

ow는 세게 잠그는 값이 아니라 비교하면서 찾는 다이얼에 가깝습니다

ow는 세게 잠그는 값이 아니라 비교하면서 찾는 다이얼에 가깝습니다 내용을 설명하는 이미지

ow는 세게 잠그는 값이 아니라 비교하면서 찾는 다이얼에 가깝습니다

Midjourney 문서 기준으로 --ow는 기본값이 100이고, 1에서 1000 사이에서 조절할 수 있습니다. 숫자만 보면 크게 올릴수록 더 잘 고정될 것 같지만 실제로는 그렇지 않습니다. 값이 너무 낮으면 기준 얼굴이 약하게 반영되고, 너무 높으면 표정과 헤어, 심지어 배경 톤까지 경직될 수 있습니다. 그래서 얼굴 일관성은 정답 값을 한 번에 찍는 문제가 아니라, 내 기준 이미지와 작업 목적에 맞는 범위를 찾는 문제에 더 가깝습니다.

가장 실용적인 방법은 세 값만 먼저 비교하는 것입니다. 예를 들어 80, 140, 220처럼 세 단계만 나눠도 어느 지점부터 얼굴은 잘 붙고 장면은 여전히 움직이는지 감이 잡힙니다. Midjourney 공식 문서도 일반적으로는 400 이하에서 다루는 편을 권장하고 있어, 처음부터 과한 값으로 밀어붙일 이유가 많지 않습니다. 얼굴이 유지되지 않는다고 바로 500 이상으로 올리기보다, 기준 이미지를 더 정리하거나 장면 변수를 덜어내는 쪽이 더 잘 풀리는 경우도 흔합니다.

배경, 표정, 거리, 의상은 한 번에 하나씩만 넓혀야 원인을 읽을 수 있습니다

배경, 표정, 거리, 의상은 한 번에 하나씩만 넓혀야 원인을 읽을 수 있습니다 내용을 설명하는 이미지

배경, 표정, 거리, 의상은 한 번에 하나씩만 넓혀야 원인을 읽을 수 있습니다

같은 인물을 여러 장면으로 확장할 때 결과가 무너지는 가장 큰 이유는 바꾸는 항목이 너무 많기 때문입니다. 예를 들어 카페 장면에서 성공한 프롬프트를 바로 지하철 플랫폼, 야간 조명, 측면 얼굴, 전신샷, 다른 의상으로 한 번에 바꾸면 어느 요소가 얼굴 붕괴를 만들었는지 읽을 수가 없습니다. 이때는 프롬프트를 더 손보는 것보다 변수를 나눠서 테스트하는 순서를 먼저 만들어야 합니다.

가장 안정적인 순서는 보통 이렇습니다.

  1. 표정만 바꾼 4장 비교
  2. 카메라 거리만 바꾼 4장 비교
  3. 배경만 바꾼 4장 비교
  4. 의상이나 소품을 마지막에 추가

이 비교 루틴은 실전 프롬프트 워크플로에서 다루는 반복 개선 방식과도 잘 맞습니다. 핵심은 잘 나온 한 장을 더 멋지게 바꾸는 것이 아니라, 무엇을 건드렸을 때 얼굴이 무너지는지 기록하는 것입니다. 그렇게 해야 다음 프로젝트에서도 같은 인물을 다시 꺼내 쓸 수 있습니다.

얼굴 일관성용 프롬프트 시트를 따로 만들어 두면 다음 작업이 빨라집니다

얼굴 일관성용 프롬프트 시트를 따로 만들어 두면 다음 작업이 빨라집니다 내용을 설명하는 이미지

얼굴 일관성용 프롬프트 시트를 따로 만들어 두면 다음 작업이 빨라집니다

얼굴 일관성은 결국 한 번 잘 뽑는 기술보다, 다음에도 다시 꺼내 쓸 수 있는 운영 문서를 남기는 기술에 가깝습니다. 실무에서는 기준 이미지 파일명, 식별 포인트 5개, 자주 쓰는 장면 세트, --ow 비교값, 실패했던 패턴만 정리해 둬도 다음 작업 속도가 확실히 빨라집니다. 시리즈 썸네일이나 브랜드 모델 컷은 얼굴을 한 번만 잘 만드는 것보다 다음 주에도 같은 사람을 다시 만들 수 있는지가 더 중요하기 때문입니다.

identity anchors
- oval face
- short black bob
- soft straight brows
- calm gaze
- natural skin texture

tested ow
- 80: too loose
- 140: balanced
- 220: stable but slightly stiff

지금 바로 해볼 루틴

지금 바로 해볼 루틴 내용을 설명하는 이미지

지금 바로 해볼 루틴

먼저 기준 얼굴 한 장만 고르고, 바뀌면 안 되는 식별 포인트를 다섯 개 안팎으로 정리해 보세요. 그다음 같은 프롬프트에서 --ow만 80, 140, 220으로 나눠 세 번 돌리고, 가장 균형이 좋은 값을 고릅니다. 그 뒤에는 표정, 거리, 배경을 한 번에 하나씩만 넓혀 보면서 어느 단계에서 흔들리는지 기록하면 됩니다.

여기까지 해보면 얼굴 일관성은 더 이상 막연한 감이 아니라, 다시 따라갈 수 있는 루틴이 됩니다. 이미 비슷한 인물 프롬프트를 여러 개 써 봤다면, 오늘은 새 프롬프트를 만들기보다 기준 문장과 변수 문장을 나누는 작업부터 먼저 해보는 것을 추천합니다.

얼굴 고정이 잘되다가도 특정 컷에서만 무너진다면 실패 지점을 따로 기록해야 합니다

얼굴 고정이 잘되다가도 특정 컷에서만 무너진다면 실패 지점을 따로 기록해야 합니다 내용을 설명하는 이미지

얼굴 고정이 잘되다가도 특정 컷에서만 무너진다면 실패 지점을 따로 기록해야 합니다

얼굴 일관성이 특히 어려운 이유는 성공과 실패가 섞여 나타나기 때문입니다. 같은 기준 이미지, 같은 식별 문장, 비슷한 --ow 값을 썼는데 어떤 컷은 놀랄 만큼 잘 붙고 어떤 컷은 갑자기 다른 사람처럼 흐트러집니다. 이럴 때는 오늘 컨디션이 안 좋았나 보다 식으로 넘기지 말고, 어느 변화에서 붕괴가 시작됐는지를 체크해야 합니다. 얼굴 붕괴는 대체로 세 가지 축에서 자주 시작됩니다. 광원 방향이 급격히 바뀌었거나, 카메라 거리가 크게 달라졌거나, 포즈와 표정이 동시에 흔들린 경우입니다.

예를 들어 정면 반신 샷은 잘 붙는데 측면 전신샷에서만 무너진다면, 문제는 --oref 자체가 아니라 거리와 각도 조합일 수 있습니다. 또 실내 자연광에서는 안정적이지만 네온 야간 조명에서만 다른 얼굴이 나온다면, 얼굴 고정보다 조명 문장이 더 강하게 결과를 끌고 있다는 뜻일 수 있습니다. 이런 식으로 실패 컷을 버리지 말고 남겨 두면 다음 비교가 훨씬 빨라집니다. 좋은 AI 이미지, 막연히 예쁘다 말고 7가지 평가 기준으로 고르는 법 같은 평가 기준 글과 같이 보면 무엇이 무너졌는지 언어로 적기도 쉬워집니다.

실전에서는 아래처럼 실패 원인을 아주 짧게 적어 두는 방식이 가장 오래 갑니다.

failed case notes
- side profile + full body: jawline changed too much
- neon night scene: skin tone and eye shape drifted
- strong laugh expression: brow shape became inconsistent
- heavy wind hair motion: bob silhouette collapsed

이렇게만 적어도 다음 번에는 같은 인물인데 왜 자꾸 달라지지?라는 막연한 답답함 대신, 측면 + 전신 + 강한 조명 조합을 조심해야 한다는 식으로 다시 실행 가능한 규칙이 남습니다.

기준 문장은 길게 묘사하기보다 식별 신호만 남기는 편이 더 안정적입니다

기준 문장은 길게 묘사하기보다 식별 신호만 남기는 편이 더 안정적입니다 내용을 설명하는 이미지

기준 문장은 길게 묘사하기보다 식별 신호만 남기는 편이 더 안정적입니다

얼굴 일관성 글을 쓰거나 강의를 보다 보면 눈매, 코선, 피부 톤, 입술, 헤어, 분위기를 전부 길게 적는 예시를 많이 만나게 됩니다. 물론 그런 문장이 잘 먹히는 경우도 있습니다. 하지만 시리즈 썸네일, 브랜드 인물, 반복 생성 작업에서는 오히려 긴 문장이 충돌을 만들 때가 많습니다. 미드저니는 묘사를 잘 읽는 편이지만, 같은 줄 안에 너무 많은 성격의 정보가 들어오면 무엇을 우선으로 붙잡아야 할지 흐려질 수 있습니다.

그래서 기준 문장은 길게 설명하는 대신, 사람을 알아보게 만드는 신호만 추리는 방식이 더 실전적입니다. 얼굴형, 눈썹 방향, 헤어 실루엣, 시선 인상, 피부 질감 정도면 충분한 경우가 많습니다. 반대로 세련된, 감성적인, 도회적인 같은 해석형 형용사는 얼굴 고정에는 도움이 적고 장면 분위기 쪽으로 빠질 가능성이 큽니다. 그런 문장은 스타일 문장이나 장면 문장으로 빼 두는 편이 낫습니다.

예를 들면 아래처럼 나누는 편이 안정적입니다.

identity line
oval face, short black bob, soft straight brows, calm gaze, natural skin texture

scene line
quiet bookstore aisle, warm indirect light, shallow depth of field, candid editorial portrait

이 구분이 생기면 다음 실험도 쉬워집니다. 얼굴이 무너지면 identity line부터 다시 보고, 분위기가 안 맞으면 scene line만 바꾸면 되기 때문입니다. 실전 프롬프트 워크플로에서 설명한 반복 개선 방식도 결국 이런 분리 위에서 더 잘 작동합니다.

썸네일·브랜드 컷처럼 반복 사용해야 하는 얼굴은 기준 세트로 관리하는 편이 낫습니다

썸네일·브랜드 컷처럼 반복 사용해야 하는 얼굴은 기준 세트로 관리하는 편이 낫습니다 내용을 설명하는 이미지

썸네일·브랜드 컷처럼 반복 사용해야 하는 얼굴은 기준 세트로 관리하는 편이 낫습니다

얼굴 일관성이 한두 번의 생성으로 끝나는 작업이라면 비교 루틴만으로도 충분할 수 있습니다. 하지만 블로그 시리즈 썸네일, 브랜드 모델 컷, 서비스 소개 카드처럼 여러 주 동안 같은 얼굴을 계속 써야 한다면 이야기가 달라집니다. 이 경우에는 기준 이미지 하나만 믿기보다, 작업용 기준 세트를 따로 운영하는 편이 훨씬 안전합니다. 정면에 가까운 기준 컷 하나, 3/4 각도 컷 하나, 가장 잘 맞았던 --ow 구간 기록, 자주 쓰는 장면 두세 개 정도를 묶어 두는 방식입니다.

이렇게 세트를 만들어 두면 새 글을 쓸 때마다 얼굴을 처음부터 다시 찾지 않아도 됩니다. 예를 들어 실내 자연광 버전, 차분한 스튜디오 버전, 야외 소프트 라이트 버전 정도만 먼저 확보해 두면 다음에는 주제에 맞게 장면만 바꾸면 됩니다. 썸네일용 인물을 계속 유지해야 한다면 미드저니 썸네일 시리즈를 한 팀처럼 맞추는 법과 함께 운영하면 더 좋습니다. 얼굴만 같고 레이아웃은 흔들리면 시리즈 자산으로서 힘이 약해지기 때문입니다.

결국 얼굴 일관성은 한 장 잘 뽑기가 아니라 같은 사람을 다시 호출하는 시스템 만들기에 더 가깝습니다. 오늘 한 번 잘 나온 얼굴이 다음 달에도 그대로 나올 수 있게 하려면, 예쁜 결과물보다 기준 세트와 기록 방식을 먼저 남겨 두는 편이 훨씬 강합니다.

얼굴 일관성 점검표를 따로 두면 다음 프로젝트에서 훨씬 덜 흔들립니다

얼굴 일관성 점검표를 따로 두면 다음 프로젝트에서 훨씬 덜 흔들립니다 내용을 설명하는 이미지

얼굴 일관성 점검표를 따로 두면 다음 프로젝트에서 훨씬 덜 흔들립니다

같은 얼굴을 여러 번 써야 하는 사람일수록, 결과물을 고르는 기준도 프롬프트만큼 중요합니다. 아래처럼 아주 짧은 점검표를 만들어 두면 다음 프로젝트에서 판단이 훨씬 빨라집니다. 얼굴형이 유지됐는지, 눈매와 눈썹 방향이 유지됐는지, 헤어 실루엣이 남았는지, 조명 변화가 과했는지 정도만 체크해도 충분합니다. 핵심은 느낌으로 비슷하다를 말하는 대신, 어느 요소가 유지됐고 어느 요소가 무너졌는지 빠르게 말할 수 있게 만드는 것입니다.

얼굴 일관성은 결국 생성 기술이면서 동시에 선별 기술입니다. 오늘 한 장을 더 만드는 것보다, 최근에 잘 나온 얼굴 4장과 애매한 얼굴 4장을 나란히 놓고 무너진 항목을 체크표로 표시하는 작업을 해 보세요. 그 표가 쌓이면 다음에는 프롬프트를 처음부터 새로 짜지 않아도 어디를 건드려야 하는지 훨씬 빨리 보이게 됩니다.

결국 미드저니 일관성 작업은 프롬프트를 멋지게 쓰는 문제라기보다, 어떤 값을 고정했고 어떤 변수를 바꿨는지 다시 설명할 수 있는 시스템을 만드는 일에 가깝습니다. 오늘 바로 완벽한 결과가 나오지 않아도 괜찮습니다. 중요한 것은 비교한 기준과 실패한 조합, 다시 쓸 수 있는 문장을 남겨 두는 일입니다. 그 기록이 쌓이면 다음 생성은 훨씬 덜 흔들리고, 같은 시리즈를 계속 이어 가는 힘도 분명히 커집니다.

자주 묻는 질문

자주 묻는 질문 내용을 설명하는 이미지

자주 묻는 질문

미드저니에서 같은 인물을 유지하려면 기준 이미지는 몇 장이 적당한가요?

처음에는 한 장이면 충분한 경우가 많습니다. 정면에 가깝고 얼굴형, 눈매, 헤어 라인이 선명한 컷 하나를 먼저 잡고, 그 기준으로 표정과 각도만 넓혀 가는 편이 더 안정적입니다.

oref를 높이면 얼굴이 무조건 더 잘 고정되나요?

항상 그렇지는 않습니다. --ow가 너무 높으면 헤어, 표정, 분위기까지 굳어서 장면 변화가 둔해질 수 있습니다. 먼저 80, 140, 220처럼 몇 단계만 비교하는 편이 안전합니다.

얼굴이 유지되다가 특정 장면에서만 무너지면 무엇부터 봐야 하나요?

대부분은 조명, 거리, 포즈가 한 번에 많이 바뀐 경우입니다. 배경, 표정, 카메라 거리 중 하나만 원래 값으로 되돌려 보고 어느 축에서 흔들리는지부터 확인하는 편이 빠릅니다.