미드저니 캐릭터 일관성: sref와 oref를 나눠 써야 덜 무너집니다
미드저니 캐릭터 일관성은 예쁜 한 장을 고르는 문제보다, 무엇이 스타일이고 무엇이 캐릭터 정보인지 분리하는 문제에 가깝습니다. --sref는 화풍과 분위기를 붙잡고, 캐릭터의 식별 포인트는 별도 문장과 기준 이미지로 잡아야 설정 붕괴가 줄어듭니다. 헤어, 실루엣, 핵심 액세서리처럼 캐릭터를 알아보게 만드는 신호를 먼저 줄여 놓는 것이 시작점입니다.
한눈에 보기

한눈에 보기
미드저니 캐릭터 일관성은 예쁜 한 장을 고르는 문제보다, 무엇이 스타일이고 무엇이 캐릭터 정보인지 분리하는 문제에 가깝습니다. --sref는 화풍과 분위기를 붙잡고, 캐릭터의 식별 포인트는 별도 문장과 기준 이미지로 잡아야 설정 붕괴가 줄어듭니다. 헤어, 실루엣, 핵심 액세서리처럼 캐릭터를 알아보게 만드는 신호를 먼저 줄여 놓는 것이 시작점입니다.
캐릭터가 자꾸 무너지는 이유는 스타일 정보와 캐릭터 정보가 한 문장에 엉키기 때문입니다

캐릭터가 자꾸 무너지는 이유는 스타일 정보와 캐릭터 정보가 한 문장에 엉키기 때문입니다 예시 1
캐릭터 작업에서는 멋진 한 장이 생각보다 쉽게 나옵니다. 문제는 두 번째, 세 번째 장부터 시작됩니다. 첫 장에서는 잘 나왔는데 다른 포즈로 바꾸는 순간 헤어가 달라지고, 액세서리가 사라지고, 표정까지 전혀 다른 캐릭터처럼 풀리는 식이죠. 이때 가장 흔한 원인은 모델이 못 알아듣는 것이 아니라, 스타일 정보와 캐릭터 정보가 한 문장에 너무 많이 섞여 있는 것입니다.
캐릭터 일관성은 분위기, 화풍, 질감, 색감을 잡는 문제와, 실제로 누구인지 알아보게 만드는 문제를 나눠야 풀립니다. 전자는 --sref가 잘하는 영역이고, 후자는 기준 이미지와 짧은 식별 포인트 문장이 맡는 편이 안정적입니다. 이 구분이 안 되면 fantasy watercolor anime dreamy cinematic 같은 스타일 언어가 캐릭터 묘사를 덮어 버리기 쉽습니다.
sref는 분위기를 잡고, 캐릭터 식별은 별도 문장이 맡아야 합니다

sref는 분위기를 잡고, 캐릭터 식별은 별도 문장이 맡아야 합니다
Midjourney 문서도 Style Reference를 사람이나 사물 자체를 복제하는 기능이 아니라, 전체적인 시각 스타일을 가리키는 기능으로 설명합니다. 그래서 --sref를 쓴다고 해서 캐릭터의 헤어 길이, 실루엣, 액세서리 위치까지 자동으로 고정되지는 않습니다. 캐릭터가 계속 같은 캐릭터로 보이게 하려면 스타일 레퍼런스와 별개로 식별 포인트를 직접 써 주는 구조가 필요합니다.
young courier character, short silver hair, oversized navy jacket, orange messenger strap,
narrow eyes, calm but alert expression --sref [style reference] --sw 150
이때 캐릭터 특징은 길게 쓰지 않는 것이 오히려 도움이 됩니다. 헤어, 대표 의상, 액세서리, 얼굴 인상처럼 없어지면 다른 캐릭터처럼 보이는 요소만 먼저 남겨 두는 편이 좋습니다. 스타일 언어가 아직 정리되지 않았다면 미드저니 레퍼런스 이미지 가이드를 같이 보는 편이 훨씬 이해가 빠릅니다.
sw는 강도를 올리는 값이지 정체성을 만들어 주는 값은 아닙니다

sw는 강도를 올리는 값이지 정체성을 만들어 주는 값은 아닙니다
Midjourney 문서 기준으로 --sw 기본값은 100이고, 0에서 1000까지 조절할 수 있습니다. 하지만 숫자가 높을수록 캐릭터가 더 잘 유지된다고 보기는 어렵습니다. --sw는 캐릭터 정체성 자체를 고정하는 값이 아니라 스타일 반영 강도에 가깝기 때문에, 값이 너무 높으면 화풍은 강해지지만 포즈와 구도 선택이 경직되면서 결과물이 단조로워질 수 있습니다.
캐릭터 작업에서는 --sw를 올리는 것보다 먼저 스타일 레퍼런스 자체가 명확한지, 그리고 캐릭터 식별 문장이 충분히 짧고 단단한지를 보는 편이 좋습니다. 보통은 80, 150, 250 정도만 비교해도 스타일이 어디까지 들어오는지 감이 생깁니다. --sref가 먹는 부분과 캐릭터 문장이 먹는 부분을 따로 읽어야, 이후에 의상이나 장면을 넓혀도 덜 무너집니다.
캐릭터 시트는 헤어, 실루엣, 액세서리, 대표 색만 먼저 남기는 편이 좋습니다

캐릭터 시트는 헤어, 실루엣, 액세서리, 대표 색만 먼저 남기는 편이 좋습니다 예시 1
캐릭터를 길게 설정할수록 더 잘 유지될 것 같지만, 실제로는 반대인 경우가 많습니다. 키워드가 많아질수록 서로 충돌할 가능성도 커지고, 매 장면마다 빠지는 요소가 생깁니다. 그래서 캐릭터 시트의 첫 버전은 복잡할 필요가 없습니다. 헤어, 실루엣, 핵심 액세서리, 대표 색 네 축만 먼저 정해도 충분한 경우가 많습니다.
예를 들어 short silver hair, oversized navy jacket, orange messenger strap, cool gray-orange palette처럼 정리해 두면, 장면이 바뀌어도 무엇이 빠졌는지 바로 눈에 들어옵니다. 반대로 urban fantasy cinematic manga gritty painterly dreamy 같은 스타일 언어를 먼저 길게 쓰기 시작하면, 캐릭터를 유지하려는 작업인지 분위기 이미지를 만들려는 작업인지 스스로도 흐려질 수 있습니다.
포즈와 표정은 마지막에 넓히고, 먼저는 정면·반신·3/4만 비교하는 편이 좋습니다

포즈와 표정은 마지막에 넓히고, 먼저는 정면·반신·3/4만 비교하는 편이 좋습니다
캐릭터 일관성도 결국 비교 순서가 중요합니다. 처음부터 전신 동작, 액션 포즈, 옆모습, 극단적인 감정 표현까지 한 번에 넓히면 어느 지점에서 설정이 무너졌는지 읽기가 어렵습니다. 그래서 초반에는 정면 또는 반정면, 반신, 3/4 정도만 먼저 테스트하고, 그 안에서 헤어와 액세서리, 표정 변화가 어디까지 유지되는지 보는 편이 좋습니다.
이 비교 루틴을 만들어 두면 나중에 캐릭터 카드, 웹툰형 컷, 썸네일형 비주얼로 확장할 때도 훨씬 편합니다. 실전 프롬프트 워크플로처럼 결과를 한 줄씩 기록해 두면, 어떤 스타일 세트가 잘 맞았고 어떤 포즈에서 무너졌는지 다음 작업에서 그대로 재사용할 수 있습니다.
캐릭터 작업도 결국은 프롬프트보다 운영 문서를 남기는 쪽이 오래 갑니다

캐릭터 작업도 결국은 프롬프트보다 운영 문서를 남기는 쪽이 오래 갑니다
캐릭터 일관성은 감각 좋은 한 장을 뽑는 기술보다, 다음에도 같은 캐릭터를 다시 꺼낼 수 있는 기록을 남기는 기술에 가깝습니다. 캐릭터 식별 포인트, 쓴 --sref 또는 style code, 테스트한 --sw 값, 잘 먹힌 포즈, 자주 무너지는 부분만 따로 저장해 두면 이후 작업 속도가 확실히 달라집니다. 특히 시리즈 썸네일이나 연속 이미지처럼 캐릭터를 반복 사용해야 할 때는 결과물보다 기록이 더 큰 자산이 됩니다.
identity anchors
- short silver hair
- oversized navy jacket
- orange messenger strap
- calm narrow eyes
tested style range
- sw 80: light influence
- sw 150: balanced
- sw 250: strong style, lower pose flexibility
지금 바로 해볼 루틴

지금 바로 해볼 루틴
먼저 캐릭터를 알아보게 만드는 요소를 네 줄 안쪽으로 줄여 보세요. 그다음 같은 본문 문장에 --sref만 유지한 채 --sw를 80, 150, 250으로 비교합니다. 이후에 반신, 3/4, 전신 순서로만 넓혀 보고, 어떤 단계에서 헤어나 액세서리가 무너지기 시작하는지 기록하면 됩니다.
지금까지는 스타일 키워드를 계속 늘리는 방식으로 해결하려 했다면, 오늘은 반대로 스타일과 캐릭터 정보를 분리하는 작업부터 먼저 해보는 것을 추천합니다. 이 기준만 잡혀도 캐릭터 작업의 흔들림이 훨씬 줄어듭니다.
캐릭터가 자주 무너지는 건 화풍이 바뀌어서가 아니라 식별 포인트가 너무 많거나 너무 적어서입니다

캐릭터가 자주 무너지는 건 화풍이 바뀌어서가 아니라 식별 포인트가 너무 많거나 너무 적어서입니다
캐릭터 작업을 오래 해 보면 늘 같은 딜레마가 생깁니다. 설정을 자세히 적으면 더 잘 붙을 것 같지만, 실제로는 너무 긴 설정이 서로 충돌하고 결과를 불안하게 만들 때가 많습니다. 반대로 설명을 너무 줄이면 누구나 될 수 있는 평범한 캐릭터가 됩니다. 그래서 캐릭터 일관성의 핵심은 문장을 늘리는 것이 아니라, 캐릭터를 알아보게 만드는 최소 식별 포인트를 고르는 일입니다.
보통은 네 가지 축이면 충분합니다. 헤어 실루엣, 얼굴형 또는 눈매, 핵심 액세서리, 대표 색입니다. 이 네 가지가 명확하면 의상 디테일이나 자세가 조금 바뀌어도 같은 캐릭터처럼 읽힐 가능성이 커집니다. 반대로 팔찌, 자수, 레이스, 작은 장식까지 전부 고정하려 들면 장면을 넓힐수록 쉽게 무너집니다.
예를 들어 아래처럼 식별 포인트를 간단히 잡을 수 있습니다.
character anchors
- short silver bob with blunt ends
- narrow amber eyes
- asymmetrical messenger strap
- deep teal accent color
이런 식으로 핵심을 먼저 잡아 두면 --sref가 스타일을 강하게 끌고 가더라도 캐릭터 자체는 덜 흔들립니다. 미드저니 인물 사진 프롬프트 템플릿 모음을 이미 보신 분이라면, 인물 프롬프트에서 식별 포인트를 고르는 감각을 캐릭터 시트에도 그대로 옮긴다고 생각하면 됩니다.
sref와 oref를 같이 쓸 때는 무엇이 그림체이고 무엇이 대상인가를 명시적으로 나눠야 합니다

sref와 oref를 같이 쓸 때는 무엇이 그림체이고 무엇이 대상인가를 명시적으로 나눠야 합니다
--sref와 --oref를 함께 쓰는 순간 많은 분들이 기대하는 것은 분명합니다. 원하는 화풍도 그대로, 같은 캐릭터도 그대로 나와 주길 바라는 것입니다. 문제는 이 둘이 잡는 층위가 다르다는 점입니다. --sref는 전반적인 스타일과 분위기를 끌고 오고, --oref는 대상 자체를 유지하는 쪽에 더 가깝습니다. 그런데 프롬프트 본문까지 스타일 형용사와 캐릭터 설정이 엉켜 있으면, 어느 줄이 스타일이고 어느 줄이 캐릭터 정보인지 다시 모호해집니다.
그래서 실전에서는 세 줄로 나누는 방식이 좋습니다.
character line
young courier with short silver bob, narrow amber eyes, asymmetrical strap
style line
muted graphic illustration, matte texture, restrained palette, editorial sci-fi tone
scene line
walking through a narrow transit corridor, soft backlight, medium shot
이렇게 나누면 --sref를 바꾸었을 때 흔들리는 것은 화풍 축인지, --oref를 올렸을 때 강해지는 것은 캐릭터 축인지 읽기가 쉬워집니다. 반대로 한 문장 안에 스타일과 캐릭터와 장면을 모두 섞어 두면, 무너졌을 때 어디서 다시 잡아야 하는지 판단이 훨씬 어려워집니다.
캐릭터 시트는 완성 설정집보다 반복 생성용 운영 카드에 가까워야 합니다

캐릭터 시트는 완성 설정집보다 반복 생성용 운영 카드에 가까워야 합니다
캐릭터 일관성을 위해 설정집을 길게 쓰는 경우가 많습니다. 세계관, 성격, 장비, 상징, 표정 습관까지 정리하는 방식은 분명 도움이 됩니다. 하지만 미드저니에서 반복 생성에 실제로 직접 쓰이는 것은 그 전체 서사보다, 반복 생성용 운영 카드에 더 가깝습니다. 다시 말해 지금 당장 이미지를 다시 만들 때 필요한 핵심만 남기는 편이 더 유용합니다.
운영 카드에는 아래 정도가 있으면 충분한 경우가 많습니다.
- 식별 포인트 4개
- 금지 요소 3개
- 잘 맞는
--sref와--sw구간 - 잘 나온 구도 2~3개
- 무너졌던 상황 메모
예를 들어 긴 머리로 변형되면 안 됨, 실버 대신 백금발로 치우치지 않게 주의, 액세서리가 과하게 늘어나면 다른 캐릭터처럼 보임 같은 금지 요소를 미리 적어 두면 훨씬 강합니다. 캐릭터 유지력은 좋아하는 요소를 더하는 일 못지않게, 무너지게 만드는 요소를 미리 빼는 일에 달려 있기 때문입니다.
포즈와 표정은 초반에 넓히기보다 중간 단계 테스트를 거치는 편이 시리즈 작업에 유리합니다

포즈와 표정은 초반에 넓히기보다 중간 단계 테스트를 거치는 편이 시리즈 작업에 유리합니다
캐릭터 작업에서 가장 재미있는 단계는 다양한 포즈와 표정을 늘려 가는 순간입니다. 그런데 너무 초반부터 액션 포즈, 극단적인 감정, 복잡한 배경까지 한 번에 넓히면 캐릭터 붕괴가 빨라집니다. 이럴 때는 욕심을 조금 줄이고, 중간 단계 테스트를 거치는 편이 좋습니다. 정면 반신, 3/4 반신, 가벼운 보행 포즈 정도만 먼저 통과시켜 보면 캐릭터의 구조적 안정성이 어느 정도인지 알 수 있습니다.
이렇게 중간 단계를 밟아 두면 나중에 썸네일, 카드 뉴스, 시리즈 커버처럼 다양한 곳에 캐릭터를 응용할 때도 훨씬 편합니다. 미드저니 썸네일 시리즈를 한 팀처럼 맞추는 법과 연결하면 캐릭터는 유지하면서 레이아웃만 달리하는 흐름도 만들기 쉽습니다.
캐릭터 일관성은 결국 한 장의 분위기가 아니라, 다른 장면에서도 같은 캐릭터로 남아 있는지가 핵심입니다. 오늘은 새 설정을 더 붙이는 대신, 지금 쓰는 캐릭터를 식별하게 만드는 네 가지 신호와 세 가지 금지 요소부터 적어 보세요. 그 카드가 생기면 다음 이미지부터 붕괴를 읽는 속도가 확실히 달라집니다.
캐릭터 시리즈는 설정집보다 금지 규칙 카드가 있을 때 훨씬 오래 버팁니다

캐릭터 시리즈는 설정집보다 금지 규칙 카드가 있을 때 훨씬 오래 버팁니다
캐릭터 작업을 반복할수록 느끼게 되는 점은, 좋아하는 설정을 더하는 것보다 무너지게 만드는 요소를 막는 쪽이 더 중요하다는 것입니다. 긴 머리로 변형되면 안 되는지, 대표 액세서리가 사라지면 안 되는지, 색상이 바뀌면 다른 캐릭터처럼 보이는지를 카드 형태로 남겨 두면 다음 생성에서 훨씬 덜 흔들립니다. 이 금지 규칙 카드가 있어야 팀이 바뀌어도 캐릭터가 계속 같은 인물로 남습니다.
그래서 오늘은 새 설정을 더 붙이기보다, 현재 캐릭터에서 절대 바뀌면 안 되는 세 가지를 먼저 적어 보세요. 그 세 줄만 정리돼도 --sref와 --oref를 같이 쓸 때 어디까지 허용하고 어디서 멈춰야 하는지가 훨씬 또렷해집니다.
캐릭터도 마지막에는 좋아 보이는가보다 이 캐릭터로 바로 알아보이는가를 먼저 확인해야 합니다. 설정이 조금 부족해 보여도 식별이 유지된다면 그 카드가 더 강한 기준일 때가 많습니다. 시리즈 작업일수록 이 판단이 훨씬 중요해집니다.
결국 미드저니 일관성 작업은 프롬프트를 멋지게 쓰는 문제라기보다, 어떤 값을 고정했고 어떤 변수를 바꿨는지 다시 설명할 수 있는 시스템을 만드는 일에 가깝습니다. 오늘 바로 완벽한 결과가 나오지 않아도 괜찮습니다. 중요한 것은 비교한 기준과 실패한 조합, 다시 쓸 수 있는 문장을 남겨 두는 일입니다. 그 기록이 쌓이면 다음 생성은 훨씬 덜 흔들리고, 같은 시리즈를 계속 이어 가는 힘도 분명히 커집니다.
자주 묻는 질문

자주 묻는 질문
sref만 쓰면 캐릭터도 자동으로 고정되나요?
아닙니다. --sref는 기본적으로 스타일과 분위기를 붙잡는 쪽에 가깝습니다. 캐릭터 자체를 유지하려면 식별 포인트 문장이나 대상 기준 이미지를 함께 써야 안정적입니다.
캐릭터 설정이 자꾸 무너질 때는 무엇부터 줄여야 하나요?
헤어, 얼굴형, 핵심 액세서리, 대표 색처럼 캐릭터를 알아보게 만드는 요소부터 남기고, 장식성 설명은 나중으로 미루는 편이 좋습니다. 설명이 길수록 서로 충돌할 가능성도 커집니다.
sw 값을 높이면 화풍이 더 잘 유지되나요?
그럴 수 있지만 무조건 좋은 것은 아닙니다. --sw가 너무 높으면 스타일은 강해지지만 포즈와 구도 선택이 경직될 수 있어, 보통은 중간값부터 비교하는 편이 다루기 쉽습니다.