[KANANA 429] 나만의 카나나 템플릿 프롬프트 만들기 워크숍 후기

2026. 6. 9. 09:22코딩 도구/카카오 AI 앰배서더 KANANA 429

반응형

AI 템플릿은 프롬프트가 아니라 경험을 설계하는 일이었다

 

2026년 5월 28일 목요일, 카카오 판교아지트에서 열린 KANANA 429 오프라인 밋업에 다녀왔다.

이번 밋업의 주제는 “나만의 카나나 템플릿 프롬프트 만들기 워크숍”이었다. 이름만 보면 단순히 프롬프트를 잘 작성하는 방법을 배우는 자리처럼 보일 수 있다. 하지만 실제로 참여해보니 이번 워크숍은 단순한 프롬프트 작성 수업이 아니었다.

 

AI 템플릿은 단순히 좋은 이미지를 만드는 기능이 아니라 사람들이 반복적으로 사용하고 친구에게 공유하고 싶어지는 경험을 설계하는 일이다.

행사 일정

이번 밋업은 저녁 6시부터 8시 30분까지 진행됐다. 전체 흐름은 다음과 같았다.

18:10부터 18:30까지는 카나나 템플릿 소개 세션이 진행됐다.
18:30부터 18:50까지는 Kanana-kinema 모델 소개 세션이 이어졌다.
18:50부터 19:10까지는 Q&A 시간이 있었다.
19:10부터 20:10까지는 나만의 카나나 템플릿 프롬프트 만들기 워크숍이 진행됐다.
20:10부터 20:30까지는 결과 발표와 공유 시간이 이어졌다.

 

나는 이번 밋업에 가기 전부터 어떤 프롬프트를 만들면 좋을지 고민했다.

처음에는 증명사진을 웃긴 엽사처럼 바꾸는 아이디어, 미국 하이틴 졸업사진 느낌으로 바꾸는 아이디어 그리고 사람 얼굴을 보고 닮은 동물상으로 바꿔주는 아이디어를 생각했다.

최종적으로는 세 번째 아이디어인 “AI 동물상 프로필 생성기” 방향으로 잡았다.

요즘 고양이상, 강아지상, 햄스터상, 여우상 같은 표현이 익숙하기도 하고 친구끼리 사진을 넣고 결과를 비교하기 좋은 소재라고 생각했다.

 

Session 1. 카나나 템플릿은 어떻게 서비스가 되었나

첫 번째 세션에서는 카나나 템플릿이 어떻게 기획되고 서비스로 만들어졌는지 들을 수 있었다. 

 

가장 인상 깊었던 부분은 AI 영상 서비스를 만들 때 고려해야 할 현실적인 문제였다.

AI 영상은 단순히 “멋진 결과물을 만들자”로 끝나지 않는다. 영상 생성에는 GPU가 필요하고 GPU는 비싸고 한정된 자원이다. 결국 서비스 입장에서는 생성 시간, 영상 품질, 비용 사이에서 균형점을 찾아야 한다.

예를 들어 사용자가 영상을 만들기 위해 몇 분까지 기다릴 수 있을지 예측해야 한다. 어떤 사람은 1분도 길다고 느낄 수 있고 어떤 사람은 10분도 기다릴 수 있다. 또 어떤 사람은 정말 원하는 결과라면 1시간도 기다릴 수 있다고 생각할 수 있다. 하지만 서비스는 모든 사용자를 대상으로 운영되어야 한다. 그래서 평균적인 사용 경험과 비용 구조를 함께 고려해야 한다.

이 부분이 굉장히 현실적으로 다가왔다. 나는 보통 AI 서비스를 사용할 때 결과물이 잘 나오는지만 본다. 하지만 실제 서비스를 만드는 입장에서는 “이 기능을 하루에 몇 명이 사용할 것인가”, “GPU를 몇 장 준비해야 하는가”, “품질을 높이면 비용이 얼마나 올라가는가” 같은 문제를 계속 예측해야 한다.

결국 AI 서비스는 모델 성능만으로 만들어지는 것이 아니었다. 비용, 대기 시간, 안정성, 사용자 기대치가 모두 맞물려 있었다.

 

안전하게, 보수적으로, 사고 없이

카나나 템플릿 팀은 초기 서비스 오픈 과정에서 “안전하게 나가자”, “보수적으로 나가자”, “사고가 나지 않게 하자”는 원칙을 세웠다고 한다.

그래서 유저가 직접 자유롭게 프롬프트를 입력하는 구조가 아니라 운영자가 작성한 시스템 프롬프트를 기반으로 고정된 방식의 영상이 생성되도록 설계했다. 또 부적절한 이미지가 들어오면 영상 생성 자체가 되지 않도록 사전에 이미지를 걸러내는 방식도 적용했다고 한다.

 

오픈 전에 수천 장에 가까운 이미지를 카테고리화하고 실제로 1만 개에서 2만 개 가까운 영상을 만들어보며 품질 평가를 진행했다는 점이 인상깊었다. 단순히 프롬프트 하나를 잘 쓴다고 바로 서비스가 되는 것이 아니었다. 입력 이미지가 달라져도 결과물이 안정적으로 나오는지, 신체 왜곡이나 배경 오류가 없는지, 의도하지 않은 결과가 나오지 않는지 계속 테스트해야 했다.

 

이 부분을 들으면서 “AI 템플릿”이라는 개념을 다시 생각하게 됐다.

사용자 입장에서는 버튼 하나를 누르고 영상을 만드는 간단한 기능처럼 보인다. 하지만 그 뒤에는 프롬프트, 모델, 입력값 필터링, 품질 평가, 정책 문구, 푸시 알림, UX 진입점까지 많은 요소가 연결되어 있었다.

 

카나나 템플릿이 의미 있게 사용된 사례

세션 중간에는 실제 유저가 카나나 템플릿을 활용한 사례도 소개됐다. 한 사용자가 먼저 돌아가신 가족의 사진을 카나나 템플릿으로 영상화했고 그것을 가족에게 보여주는 콘텐츠가 큰 반응을 얻었다고 한다.

 

이 사례가 인상 깊었던 이유는 AI 기능이 단순히 “신기한 기술”로 소비된 것이 아니라 사람의 기억과 감정에 연결되었기 때문이다.

카카오톡은 가족방, 친구방, 지인방처럼 일상적인 관계가 모여 있는 공간이다. 그래서 카나나 템플릿도 단순히 멋진 영상을 만드는 기능을 넘어 누군가에게 추억을 다시 보여주거나 대화를 시작하게 만드는 역할을 할 수 있다고 느꼈다.

 

이 지점에서 카나나 템플릿의 방향성이 보였는데 카나나 템플릿은 AI를 기술 그 자체로 보여주는 서비스라기보다 카카오톡 안에서 사람들이 자연스럽게 쓰고 공유할 수 있는 콘텐츠 경험을 만드는 서비스에 가까웠다.

 


Session 2. Kanana-kinema 모델 소개

두 번째 세션에서는 Kanana-kinema 모델에 대한 소개가 있었다. 이 세션은 기술적인 내용이 많았지만 발표자가 AI 전문가가 아닌 사람도 이해할 수 있도록 LLM과 비교해서 설명해주어서 흐름을 따라가기 좋았으면서 또 한편으로는 기술적인 이야기를 깊게 듣고 싶어서 아쉬움이 남았다.

 

먼저 LLM은 다들 잘 알다시피 다음 단어를 예측하는 모델이라고 설명했다. “안녕”이라는 단어가 들어오면 다음에 올 단어를 예측하고 그다음 단어를 또 예측하면서 문장을 만들어간다. 즉 비교적 작은 단위의 예측을 여러 번 반복해서 결과를 완성한다.

 

반면 이미지나 비디오 생성 모델은 훨씬 복잡하다. 비디오는 단어처럼 한 줄로 순서를 세우기 어렵다. 왼쪽에서 오른쪽으로, 위에서 아래로 단순히 나열한다고 해서 자연스러운 영상이 되는 것이 아니다. 그래서 Kanana-kinema는 디퓨전 방식을 선택했다고 한다.

디퓨전 방식은 노이즈에서 시작해 여러 단계를 거치며 점진적으로 이미지를 복원하거나 영상을 완성해가는 방식이다. 쉽게 말하면 LLM이 쉬운 작업을 여러 번 반복해 문장을 완성한다면 디퓨전은 어려운 작업을 여러 단계에 걸쳐 점진적으로 완성하는 방식이라고 이해했다.

왜 이미지 기반 비디오 생성인가

Kanana-kinema 세션에서 흥미로웠던 부분은 텍스트만으로 영상을 만드는 방식이 아니라 첫 프레임 이미지를 함께 입력받는 이미지 기반 비디오 생성에 집중했다는 점이었다.

예를 들어 “서핑 보드 타는 고양이”라는 텍스트만 있으면 모델은 어떤 고양이인지, 배경은 어떤지, 카메라 각도는 어떤지 모두 새로 결정해야 한다. 하지만 첫 프레임 이미지가 함께 들어오면 모델은 그 이미지를 기준으로 고양이의 생김새, 배경, 구도, 분위기를 참고할 수 있다.

 

즉 입력 이미지가 강력한 가이드 역할을 한다.

이 부분은 카나나 템플릿의 구조와도 연결된다. 사용자는 사진을 넣고 템플릿은 그 사진을 바탕으로 영상을 만든다. 이 방식은 완전히 빈 캔버스에서 영상을 만드는 것보다 훨씬 안정적이다. 입력 이미지가 기준점이 되기 때문에 사용자의 기대와 결과물 사이의 간극도 줄일 수 있다.

40분에서 40초로 줄이는 과정

모델 소개에서 가장 강하게 기억에 남은 숫자는 40분과 40초였다.

 

5초짜리 720p 영상을 생성하는 데 원래 방식으로는 많은 GPU 리소스가 필요하고 한 편을 만드는 데 40분 정도 걸릴 수 있다고 했다. 하지만 실제 서비스에서 사용자가 5초짜리 영상을 만들기 위해 40분을 기다리는 것은 어렵다.

그래서 모델 팀은 속도를 줄이기 위해 여러 가지 선택을 했다. 첫 번째는 앞에서 말한 이미지 기반 비디오 생성에 집중하는 것이었다. 두 번째는 디스틸레이션을 통해 생성 스텝을 줄이는 것이었다. 원래 40번에 걸쳐 생성하던 과정을 2스텝 수준으로 압축해 서비스 가능한 속도로 만든 것이다.

물론 스텝을 줄이면 문제가 생길 수 있다. 디테일이 뭉개지거나, 눈코입이 어색해지거나, 손가락과 신체가 이상하게 나오는 문제가 생길 수 있다. 그래서 추가적인 훈련과 보정 과정을 통해 품질을 개선했다고 한다.

 

이 과정을 들으면서 AI 모델 개발은 단순히 “더 좋은 모델을 만들자”가 아니라 “서비스에 들어갈 수 있는 속도와 비용으로 품질을 유지하자”에 가깝다는 생각이 들었다.

연구실에서 좋은 결과를 내는 모델과 실제 카카오톡 안에서 수많은 사용자가 쓰는 모델은 요구 조건이 다르다. 후자는 속도, 안정성, 비용, 품질, 실패율까지 모두 고려해야 한다.

 

Q&A. 카나나 템플릿을 서비스와 기술 관점에서 더 깊게 이해한 시간

Q&A 시간에는 카나나 템플릿 자체에 대한 질문, AI 생성물의 품질 관리, 프롬프트 작성 팁, 향후 서비스 방향까지 다양한 질문이 나왔다. 단순히 “어떻게 쓰면 좋은가”를 넘어서 실제 AI 기능이 카카오톡 안에서 서비스로 운영되기 위해 어떤 고민을 거치는지 들을 수 있는 시간이었다.

카나나 템플릿을 가장 많이 사용하는 연령층과 성별은 어떻게 될까

카나나 템플릿을 가장 많이 이용하는 연령층과 성별에 대한 질문이 있었다.

답변에 따르면 카나나 템플릿 이용자 분포는 카카오톡 전체 유저 분포와 굉장히 유사하다고 했다. 특정 세대만 사용하는 기능이라기보다 카카오톡을 사용하는 넓은 연령층이 자연스럽게 접근할 수 있는 기능에 가깝다고 이해했다.

40대, 50대, 30대, 60대 순으로 이용층이 많고 그 아래로 20대, 10대, 70대가 이어지는 식으로 설명됐다.

이 부분이 흥미로웠다. 보통 생성형 AI 기능이라고 하면 10대나 20대처럼 트렌드에 민감한 세대가 주로 사용할 것이라고 생각하기 쉽다. 하지만 카카오톡 안에 들어간 기능은 다르다. 카카오톡 자체가 전 연령층이 사용하는 생활 플랫폼이기 때문에 AI 기능도 특정 세대의 실험용 도구가 아니라 일상적인 커뮤니케이션 기능으로 확장될 수 있다.

그래서 카나나 템플릿은 “AI를 잘 아는 사람을 위한 기능”보다 “카카오톡을 쓰는 사람이 자연스럽게 눌러보는 기능”에 가깝다고 느꼈다.

 

위험한 프롬프트는 어떻게 차단하는가

세이프가드와 관련된 질문도 있었다. 위험한 프롬프트를 어떻게 차단하는지 카나나 템플릿에서 위험성 있는 프롬프트를 방지하는 방식이 궁금하다는 질문이었다.

답변은 명확했다. 현재 카나나 템플릿은 사용자가 직접 자유롭게 프롬프트를 입력하는 구조가 아니다. 운영자가 작성한 시스템 프롬프트를 기반으로 동작한다. 사용자가 직접 프롬프트를 입력할 수 있게 만들면 생성 결과물의 리스크를 예측하기 어려워지고 이를 방어하기 위한 세이프가드도 훨씬 복잡해진다. 그래서 당분간은 안전을 위해 내부에서 관리하는 프롬프트 중심으로 서비스를 운영할 계획이라고 했다.

이 답변은 세션1에서 말했던 “안전하게, 보수적으로, 사고 없이”라는 원칙과 이어졌다. AI 서비스에서 자유도는 매력적이다. 하지만 실제 서비스에서는 자유도가 높아질수록 리스크도 같이 커진다. 사용자가 어떤 입력을 넣을지 모르고 그 결과가 어떤 방향으로 나올지 완전히 예측하기 어렵기 때문이다.

결국 카카오가 선택한 방향은 “사용자가 무엇이든 하게 하는 AI”보다 “안정적으로 즐길 수 있는 AI 경험”에 가까웠다.

 

베이스 모델이 바뀌면 템플릿도 다시 바뀌어야 할까

기술적인 질문 중 하나는 베이스 모델과 템플릿의 관계였다. 만약 모델 버전이 바뀌면 기존 템플릿도 수정되어야 하는지 자동으로 마이그레이션될 수 있는지에 대한 질문이었다.

답변에 따르면 카나나 템플릿은 카나나 자체 모델을 베이스로 사용하고 있고 내부적으로 모델 버전이 올라가는 경우가 있다고 했다. 이때 템플릿이 고정된 상태에서 모델만 바뀌면 결과가 달라질 수 있다. 이를 보완하기 위해 중간에 “프롬프트 인핸서” 역할을 하는 과정을 한 번 더 거친다고 설명했다. 이 과정 덕분에 모델 버전이 바뀌더라도 어느 정도 자동 마이그레이션이 가능하다고 이해했다.

 

이 부분은 꽤 기술적으로 흥미로웠다. 프롬프트는 모델에 직접 들어가는 최종 명령문처럼 보이지만 실제 서비스에서는 사용자의 입력과 운영자의 시스템 프롬프트 사이에 한 단계 더 보정 과정이 들어갈 수 있다. 즉 프롬프트는 고정된 문장 하나가 아니라 모델 상태와 입력값에 맞게 조정되는 하나의 처리 파이프라인에 가깝다.

내가 워크숍에서 동물상 프롬프트를 만들 때도 비슷한 문제를 겪었다. 처음에는 “동물상을 분석해줘”라고만 했더니 고양이상이나 햄스터상으로 편향되는 문제가 있었다. 그래서 프롬프트 안에 기준과 제약 조건을 더 넣어야 했다. 실제 서비스에서는 이런 보정 과정을 프롬프트 인핸서가 일부 담당한다고 볼 수 있었다.

 

이미지·비디오 생성 모델에도 LLM처럼 시스템 프롬프트 우선순위가 있을까

또 다른 기술 질문은 정책 프롬프트나 시스템 프롬프트의 우선순위에 관한 것이었다. LLM에서는 시스템 프롬프트가 사용자 프롬프트보다 우선 적용되는 구조가 익숙하다. 그렇다면 이미지나 비디오 생성 모델에서도 비슷한 층위가 존재하는지에 대한 질문이었다.

답변에 따르면 이미지·비디오 생성 모델 자체에는 LLM처럼 별도의 시스템 프롬프트 구조가 그대로 존재하는 것은 아니라고 했다. 대신 앞서 언급한 프롬프트 인핸서 과정에서 시스템 프롬프트와 유사한 형태의 제어가 이루어진다고 설명했다.

이 답변을 듣고 이미지·영상 생성 서비스의 구조가 LLM 서비스와 다르다는 점을 다시 느꼈다. LLM에서는 대화 맥락과 시스템 지시문이 중요한 반면, 이미지·영상 생성에서는 입력 이미지, 템플릿 목적, 보정 프롬프트, 모델 특성이 함께 작동한다. 그래서 단순히 “프롬프트를 잘 쓰면 된다”가 아니라 어떤 입력 이미지를 허용하고 어떤 결과를 막을지까지 함께 설계해야 한다.

 

입력 이미지가 다양할 때 결과물 품질을 어떻게 일정하게 유지하는가

카나나 템플릿은 제작자의 가이드와 사용자의 입력 이미지가 결합되는 구조다. 사용자가 어떤 사진을 넣을지 알 수 없기 때문에 결과물 품질을 일정하게 유지하기 어렵다. 이에 대한 질문도 있었다.

 

답변에 따르면 카나나는 여러 방식을 함께 사용한다고 했다. 먼저 비즈니스 로직 차원에서 특정 용량 이하의 사진에는 “영상으로 만들기” 버튼을 붙이지 않는 방식이 있다. 너무 작은 이미지나 품질이 낮은 이미지는 결과가 제대로 나오기 어렵기 때문이다.

또 각 템플릿 상세 화면에서 “이런 사진을 준비해 주세요”라는 가이드를 제공한다. 사용자가 어떤 사진을 넣어야 결과가 잘 나오는지 안내함으로써 입력값의 변수를 줄이는 방식이다.

마지막으로 프롬프트 인핸서 과정이 있다. AI 모델이 먼저 사진을 분석하고 그 결과를 시스템 프롬프트와 결합해 한 번 더 프롬프트를 작성한다. 이를 통해 사용자가 어떤 사진을 넣더라도 조금 더 일관된 결과물이 나오도록 만든다고 설명했다.

이 답변은 내가 워크숍에서 겪은 문제와 정확히 연결됐다. 내 동물상 프롬프트도 입력 사진이 바뀌면 결과가 흔들렸다. 어떤 사진은 고양이상으로 몰리고 어떤 사진은 햄스터상으로 몰렸다. 결국 입력값이 다양할수록 프롬프트에는 더 명확한 기준과 방어 조건이 필요하다.

서비스에서는 이 문제를 프롬프트만으로 해결하지 않는다. 입력 이미지 기준, UX 안내, 비즈니스 로직, 프롬프트 보정 과정을 모두 함께 사용한다.

 

원하는 스타일의 프롬프트는 어떻게 역설계할 수 있을까

프롬프트 작성 팁 중 가장 실용적이었던 답변은 원하는 스타일 이미지를 먼저 넣고 모델에게 프롬프트 디자이너 역할을 부여하는 방식이었다.

예를 들어 원하는 스타일의 이미지를 넣은 뒤 “너는 템플릿 프롬프트를 디자인하는 디자이너다. 어떤 프롬프트를 쓰면 이런 이미지가 나올 것 같은지 작성해달라”고 요청하는 방식이다. 이렇게 하면 모델이 결과 이미지를 기준으로 역으로 프롬프트를 구성해줄 수 있다고 했다.

이 방식은 프롬프트를 처음부터 쓰기 어려울 때 유용하다. 보통 사람은 원하는 결과 이미지는 떠올릴 수 있지만 그 결과를 만들기 위한 프롬프트 문장을 바로 작성하기 어렵다. 이때 이미지를 기준으로 프롬프트를 역추론하게 하면 출발점이 생긴다.

나도 이번 워크숍에서 동물상 결과를 만들 때 비슷한 방식으로 접근했다. 먼저 어떤 결과가 나와야 사람들이 직관적으로 이해할지 생각했고 그 결과를 만들기 위해 어떤 조건을 프롬프트에 넣어야 할지 역으로 정리했다.

 

한글 프롬프트와 영어 프롬프트 중 무엇이 더 좋을까

프롬프트 언어에 대한 이야기도 나왔다. 실습은 카카오와 파트너십을 맺은 OpenAI의 ChatGPT를 활용해 진행되었고 서비스 관점에서는 사람들이 많이 쓰고 바이럴이 잘 될 것 같은 템플릿이면 된다고 했다. 모델마다 최적화된 프롬프트가 다를 수 있기 때문에 하나의 정답이 있는 것은 아니라고 설명했다.

OpenAI 쪽과 협업했을 때는 한글로 작성해도 된다는 이야기를 들었다고 했다. 결국 한글이든 영어든 반말이든 존댓말이든 정답은 없고 결과물이 잘 나오면 된다는 취지였다.

 

Q&A를 통해 정리한 인사이트

Q&A를 듣고 나서 카나나 템플릿을 바라보는 관점이 조금 달라졌다.

처음에는 카나나 템플릿을 “사진을 넣으면 영상이 만들어지는 기능” 정도로 생각했다. 하지만 Q&A를 듣고 나니 이 기능 뒤에는 훨씬 많은 설계가 있었다.

 

프롬프트는 운영자가 직접 관리한다.
입력 이미지는 품질 기준과 가이드로 통제한다.
프롬프트 인핸서를 통해 사진 분석과 시스템 프롬프트 결합이 이루어진다.
품질 평가는 감성보다 명확한 오류를 줄이는 방식으로 진행된다.
사용자 직접 프롬프팅은 세이프가드 문제 때문에 조심스럽게 접근한다.
접근성 확장은 서비스 성장의 핵심 과제로 보고 있다.

 

결국 카나나 템플릿은 단순한 생성 AI 기능이 아니라 AI 모델을 카카오톡이라는 일상 플랫폼 안에서 안정적으로 쓰게 만들기 위한 서비스 설계의 결과물이었다.

 

AI 서비스에서 중요한 것은 모델이 무엇을 할 수 있는가만이 아니다.
사용자가 어디서 들어오고, 무엇을 넣고, 얼마나 기다리고, 어떤 결과를 받고, 어디에 공유하는지까지 모두 설계해야 한다.

그래서 좋은 AI 템플릿은 프롬프트 하나로 완성되지 않는다. 프롬프트, 입력 가이드, 품질 평가, 세이프가드, UX 진입점이 함께 맞물릴 때 비로소 서비스가 된다.

 

Workshop. 나만의 카나나 템플릿 프롬프트 만들기

이제 본격적으로 워크숍이 시작됐다.

 

먼저 ChatGPT 또는 카카오에서 제공한 ChatGPT 환경을 활용해 나만의 프롬프트를 만들고 그 프롬프트로 재미있는 이미지를 생성한다. 그 다음 생성한 이미지를 카나나 템플릿 기능으로 영상화한다. 마지막으로 결과물과 프롬프트를 오픈채팅방에 공유한다.

 

현장에서는 다양한 예시도 보여주었다. 사진을 일본 애니메이션 스타일로 바꾸거나, 특정 이벤트 프롬프트를 적용하거나, 아이돌 직캠 썸네일처럼 만드는 예시가 있었다. 반려동물 사진을 카카오톡 이모티콘처럼 만들거나 증명사진처럼 바꾸는 사례도 있었다.

 

이 예시들을 보면서 이번 워크숍의 목표가 더 분명해졌다.

정답처럼 잘 만든 이미지를 만드는 것이 아니라 사람들이 보고 “나도 해보고 싶다”고 느낄 만한 프롬프트를 만드는 것이 목표였다.

 

내가 선택한 아이디어: AI 동물상 프로필 생성기

나는 여러 아이디어 중에서 “AI 동물상 프로필 생성기”를 선택했다.

 

처음 고민했던 아이디어는 세 가지였다.

개인 증명사진을 웃기게 망가뜨려 엽사처럼 만드는 아이디어.
개인 증명사진을 미국 하이틴 졸업사진처럼 바꾸는 아이디어.
개인 증명사진을 보고 닮은 동물상으로 바꿔주는 아이디어.

 

이 중에서 동물상 아이디어를 선택한 이유는 반복 사용성이 가장 높다고 생각했기 때문이다. 사람들은 자기 얼굴이 어떤 동물상인지 궁금해한다. 또 친구 사진을 넣고 “너는 강아지상이다”, “너는 햄스터상이다”, “너는 여우상이다”처럼 이야기하기 쉽다.

 

즉 이 아이디어는 단순한 이미지 변환이 아니라 대화 소재가 될 수 있었다.

카카오톡이라는 플랫폼과도 잘 맞는다고 생각했다. 혼자 보고 끝나는 이미지보다, 친구에게 보내고 반응을 받을 수 있는 결과물이 더 강하다고 느꼈다.

첫 번째 시도: 너무 은은해서 무슨 상인지 알기 어려웠다

처음에는 사람 얼굴은 유지하면서 동물의 분위기만 은은하게 반영하는 방향으로 프롬프트를 작성했다.

예를 들어 고양이상이라면 날카로운 눈매와 시크한 분위기, 강아지상이라면 따뜻한 눈매와 친근한 표정, 햄스터상이라면 둥근 볼과 귀여운 비율을 강조하는 식이었다.

하지만 결과를 보니 문제가 있었다.

이미지는 예쁘게 나왔지만 무슨 동물상인지 직관적으로 알기 어려웠다. 그냥 잘 보정된 AI 프로필 사진처럼 보였다. “동물상 테스트”라는 재미가 살아나지 않았다.

두 번째 시도: 동물 귀와 수염을 추가했다

그래서 방향을 바꿨다.

동물 분위기만 은은하게 반영하는 것이 아니라 특정 동물상으로 판단되면 그 동물의 귀, 수염, 꼬리, 코, 털 질감 같은 특징을 이미지에 추가하는 방식으로 수정했다.

이렇게 하자 결과는 훨씬 직관적이었다. 고양이상이라면 고양이 귀와 수염이 보이고, 강아지상이라면 강아지 귀와 따뜻한 표정이 보이는 식이다. 사람 얼굴은 유지하되 동물 캐릭터 요소를 자연스럽게 입히는 방향이었다.

이 방향은 공유성 측면에서 더 강했다. 친구에게 보냈을 때 설명 없이도 반응이 나올 수 있기 때문이다.

 

세 번째 문제: 모두 고양이만 나왔다

하지만 또 다른 문제가 생겼다. 다른 사람 사진을 넣어도 결과가 계속 고양이상으로 나오는 경향이 있었다. 처음에는 사진의 눈매나 분위기 때문에 고양이상으로 판단한 것이라고 생각했다. 하지만 여러 사진을 넣어보니 프롬프트 자체가 고양이 쪽으로 편향되는 느낌이 있었다.

 

이 문제를 보면서 프롬프트 설계에서 중요한 점을 배웠다.

AI에게 “가장 닮은 동물상을 골라줘”라고만 하면 모델은 실제 분석보다 가장 안정적으로 예쁜 결과가 나오는 방향으로 수렴할 수 있다.

고양이상은 스타일리시하고 SNS 프로필처럼 만들기 좋다. 그래서 모델이 무의식적으로 고양이를 선택하는 것처럼 보였다. 이것은 분석이라기보다 스타일 편향에 가까웠다.

 

그래서 프롬프트에 다음 조건을 추가했다.

 

고양이상이나 수달상으로 기본 선택하지 말 것.
동물 유형은 귀여움이나 인기가 아니라 얼굴 구조를 기준으로 선택할 것.
사람마다 명확히 다른 동물상이 나와야 할 것.
고양이상은 실제로 날카로운 눈매와 시크한 분위기가 강할 때만 선택할 것.

네 번째 문제: 이번에는 햄스터만 나왔다

고양이 편향을 줄이자 이번에는 햄스터상으로 몰리는 문제가 생겼다.

이것도 흥미로웠다. 고양이를 막으니 모델이 가장 안전하고 귀여운 결과인 햄스터로 이동한 것이다. 둥근 볼, 귀여운 표정, 부드러운 분위기는 많은 사람 얼굴에 적용하기 쉬웠다.

 

AI 이미지 생성에서 “분석”과 “생성”을 한 번에 시키면, 생성 쪽의 미적 편향이 분석을 덮어버릴 수 있다.

즉 모델이 실제로 얼굴을 분석해서 동물상을 고르는 것이 아니라 결과 이미지가 예쁘고 안정적으로 나오는 동물을 선택하는 문제가 생긴다.

그래서 최종 프롬프트에서는 “먼저 얼굴 특징을 분석하고, 그 다음 가장 논리적으로 맞는 동물상을 선택한 뒤, 마지막으로 이미지를 생성하라”는 구조를 넣었다.

 

또 각 동물상의 기준을 더 명확히 나누었다.

강아지상은 둥근 눈, 따뜻한 미소, 부드럽고 친근한 분위기.
고양이상은 길고 날카로운 눈매, 차분하고 시크한 표정.
햄스터상은 둥근 볼, 작은 입, 귀엽고 압축된 얼굴 비율.
여우상은 올라간 눈꼬리, 얇은 미소, 날카롭고 자신감 있는 분위기.
토끼상은 큰 눈, 순한 분위기, 부드러운 얼굴 균형.
사슴상은 맑고 차분한 눈, 우아하고 정돈된 얼굴 비율.
곰상은 안정적인 얼굴 구조, 따뜻하고 듬직한 분위기.
수달상은 장난기 있는 표정, 밝고 생기 있는 느낌.
공룡상은 강한 턱선, 선명한 인상, 카리스마 있는 분위기.

 

이렇게 기준을 나누자 프롬프트가 단순한 이미지 생성 문장이 아니라 일종의 분류 규칙처럼 바뀌었다.

최종 프롬프트

워크숍에서 정리한 최종 프롬프트는 다음과 같은 방향이었다.

Analyze the person's facial features and determine which Korean “animal face” type they resemble the most.

IMPORTANT:
- Do NOT default to cat type or hamster type.
- Different people should result in clearly different animal types.
- The animal type MUST be selected based on dominant facial structure and facial energy, not based on cuteness, popularity, or aesthetics.
- Prioritize facial analysis accuracy over visual consistency.

Carefully analyze:
- eye shape
- eye size
- facial proportions
- cheek shape
- jawline
- nose and mouth shape
- expression
- overall facial energy and mood

Possible animal types include:
- Puppy
- Cat
- Hamster
- Fox
- Rabbit
- Deer
- Bear
- Otter
- Dinosaur

Animal type reference examples:
- Puppy = round friendly eyes, warm smile, approachable and soft vibe
- Cat = sharp or elongated eyes, cool and elegant expression
- Hamster = round cheeks, compact facial proportions, cute and soft mood
- Fox = sly smile, lifted eyes, sharp and charismatic vibe
- Rabbit = innocent eyes, gentle and pure atmosphere
- Deer = calm eyes, elegant and refined facial balance
- Bear = stable facial structure, warm and reliable vibe
- Otter = playful smile, bright and lively expression
- Dinosaur = sharp jawline, strong charismatic facial energy

First determine the MOST LOGICAL animal type based on the actual facial structure.

Then create a trendy Korean SNS-style portrait inspired by that animal type.

The portrait should:
- clearly resemble the original person
- look highly recognizable at first glance
- feel cute, funny, and shareable
- look like a trendy profile image people would upload to Instagram or KakaoTalk

Add matching visual animal-inspired details such as:
- animal ears
- whiskers
- fluffy hair or fur texture
- matching expressions
- animal-inspired mood and styling

Important:
- Keep the person clearly human
- Do NOT create a furry costume
- Do NOT fully transform them into an animal
- Make the animal traits stylish and naturally blended into the portrait

The final result should make people instantly say:
“OMG this animal type actually matches them perfectly.”
 

생성된 이미지를 카나나 템플릿으로 영상화하다

이미지를 만든 뒤에는 카나나 템플릿을 활용해 짧은 영상으로 만들었다.

워크숍 안내에 따르면 나와의 채팅방이나 친구와의 채팅방에 사진을 보내면 우측에 “영상으로 만들기” 기능이 뜬다.

그 기능을 통해 생성한 이미지를 카나나 템플릿으로 영상화할 수 있었다.

 

이번 워크숍의 흐름은 다음과 같았다.

프롬프트를 만든다.
이미지를 생성한다.
카나나 템플릿으로 영상화한다.
오픈채팅방에 공유한다.
다른 사람들의 결과물을 보며 반응을 확인한다.

 

AI 서비스는 모델보다 경험에 가깝다

이번 밋업에서 가장 크게 느낀 점은 AI 서비스는 모델 성능만으로 완성되지 않는다는 것이다.

모델이 좋아도 사용자가 어떻게 들어오는지, 무엇을 입력하는지, 얼마나 기다릴 수 있는지, 결과를 어디에 공유하는지, 실패했을 때 어떻게 안내할지까지 모두 설계해야 한다.

 

카나나 템플릿은 이 부분을 잘 보여주는 사례였다.

사용자는 그냥 사진을 넣고 영상을 만든다고 느낄 수 있다. 하지만 실제로는 입력 이미지 가이드, 시스템 프롬프트, 프롬프트 인핸서, 품질 평가, 생성 시간 최적화, 푸시 알림, 공유 진입점이 모두 연결되어 있다.

 

나는 이번 워크숍을 통해 프롬프트를 단순한 명령어가 아니라 서비스의 일부로 보게 됐다.

프롬프트가 좋다는 것은 모델이 말을 잘 듣는다는 뜻만은 아니다. 사용자가 쉽게 쓰고, 결과를 납득하고, 다시 사용하고, 다른 사람에게 공유할 수 있어야 한다. 그런 점에서 좋은 프롬프트는 문장이 아니라 경험 설계에 가깝다.

마무리

이번 KANANA 429 오프라인 밋업은 단순히 카카오 AI 서비스를 체험하는 자리가 아니었다.

카나나 템플릿이 어떻게 기획되고 어떤 기준으로 안전하게 운영되고 어떤 방식으로 모델이 최적화되고 실제 사용자가 어떻게 받아들이는지를 가까이서 볼 수 있는 시간이었다.

 

특히 나만의 프롬프트를 직접 만들고 실패를 수정하고 결과물을 영상화하는 과정이 좋았다. 처음에는 “어떤 이미지를 만들까”를 고민했지만 시간이 지날수록 “사람들이 왜 이걸 쓰고 싶어할까”를 고민하게 됐다.

 

AI 템플릿은 프롬프트를 잘 쓰는 일이 아니라 사람들이 가지고 놀고 싶어지는 경험을 만드는 일이다.

 

반응형