Kanana AI 모델의 진화 과정

2026. 2. 10. 16:16코딩 도구/카카오 AI 앰배서더 KANANA 429

반응형

컴퓨터사이언스 전공 대학생이 공부하며 정리한 Kanana AI 모델의 진화 과정

1. 왜 Kanana AI 모델을 공부해보고 싶었을까

생성형 AI를 공부하다 보면 자연스럽게 ChatGPT, Claude, Gemini 같은 글로벌 모델을 먼저 접하게 된다. 실제로 나 역시 과제나 개인 공부를 할 때 이런 모델들을 자주 사용해왔다. 그런데 문득 이런 생각이 들었다.

“내가 매일 쓰는 카카오톡과 카카오맵에는, 카카오는 어떤 AI를 쓰고 있을까?”

 

해외 모델은 많이 알려져 있지만, 국내 서비스에 실제로 적용되는 AI 모델이 어떤 방향으로 발전하고 있는지는 상대적으로 접할 기회가 적었다. 그래서 이번 기회에 카카오의 AI 모델인 Kanana를 공부하고 정리해보고자 한다.

2. Kanana 모델의 방향: ‘AI 모델’이 아니라 ‘에이전틱 AI’를 향해

카카오가 Kanana 모델을 통해 강조하는 핵심 키워드는 단순한 대화형 AI가 아니라 Agentic AI(에이전틱 AI)다. 에이전틱 AI는 사용자의 질문에 답하는 수준을 넘어, 사용자의 목적을 이해하고 그 목적을 달성하기 위해 여러 단계를 스스로 수행하는 AI를 의미한다.

카카오가 제시하는 에이전틱 AI의 핵심 능력은 크게 세 가지로 정리할 수 있다.

  1. 즉각(Perception): 음성, 이미지, 텍스트 등 다양한 입력을 이해하는 능력
  2. 추론(Reasoning): 상황의 맥락과 사용자의 의도를 파악하는 능력
  3. 행동(Action): 사용자가 원하는 결과물을 생성하거나 실제 작업을 수행하는 능력

이는 사람이 정보를 인식하고, 생각한 뒤, 행동으로 옮기는 과정과 유사하다. Kanana 모델은 이러한 구조를 실현하기 위해 고성능 LLM을 기반으로 멀티모달 이해 능력과 도구 활용 능력을 지속적으로 강화하고 있다.

3. Kanana 언어 모델의 진보 과정 정리 

Kanana 모델의 발전 과정을 살펴보면, 단순히 성능을 올리는 데서 멈추지 않고 서비스 환경을 고려한 효율성을 함께 추구하고 있다는 점이 인상적이다.

  • Kanana 1.0 → 1.5
    초기 언어 모델 공개 이후, 수학·코딩 등 고난도 문제 해결 능력을 크게 강화한 1.5 버전이 공개되었다.
  • ME 모델 개발
    대규모 서비스 환경에서의 추론 효율을 검증하기 위해, 1.5 기반의 ME(Mixture of Experts) 구조 모델이 연구되었다.
  • Reasoning 모델 연구
    더 복잡한 문제 해결과 깊이 있는 추론이 가능한 구조를 검증하기 위한 연구가 병행되었다.
  • Kanana 2.0 개발
    현재는 성능, 효율성, 체감 속도를 모두 고려한 Kanana 2.0 모델이 개발 중이다.

기술적으로는 MLA(Multi-head Latent Attention)를 통한 KV 캐시 압축, MoE(Mixture of Experts) 구조 적용을 통해 대규모 추론 환경에서도 비용 효율성과 응답 속도를 함께 개선하려는 방향성이 보인다. 연구 성능과 실제 서비스 요구 사이의 균형을 의식한 설계라는 점이 흥미로웠다.

4. 멀티모달 모델 Kanana-O가 가지는 의미

Kanana 모델의 또 다른 중요한 축은 멀티모달 확장이다.

Kanana-O 모델은 텍스트, 음성, 이미지를 동시에 이해하고, 텍스트와 음성으로 응답할 수 있는 구조를 갖추고 있다.

특히 인상적인 부분은 한국어와 한국 문화에 대한 이해다. 제주 방언과 같은 지역적 표현이나, 한국의 장소·문화 맥락을 비교적 자연스럽게 이해한다는 점은 해외 모델과 차별화되는 지점이다. 또한 스트리밍 기반 음성 처리로 거의 지연 없이 대화를 이어갈 수 있다는 점 역시 실제 서비스 적용을 강하게 의식한 결과로 보인다.

Kanana-O는 단일 거대 모델이 아니라, 언어 모델을 중심으로 비전 모델과 오디오 모델을 결합하는 구조를 택하고 있다. 이는 이미 검증된 언어 모델을 중심으로 멀티모달 기능을 확장하는 현실적인 접근으로 느껴졌다.

5. 공부해보며 느낀 Kanana 모델의 장점

Kanana 모델을 공부하며 느낀 장점은 다음과 같다.

  • 한국어 및 한국 문화에 특화된 데이터셋 기반의 높은 이해도
  • 대규모 트래픽을 전제로 한 추론 효율과 비용 구조 고려
  • 단순 응답형 AI를 넘어, Agentic AI라는 명확한 발전 방향성
  • 실제 카카오 서비스에 적용되는 것을 전제로 한 현실적인 설계

특히 ‘서비스에 쓰이는 AI’를 전제로 모델을 설계하고 있다는 점이 인상 깊었다.

6. 아직은 더 궁금한 점, 아쉬운 점

반면, 공부하면서 자연스럽게 생긴 질문들도 있다.

  • 에이전틱 AI가 실제 서비스에서 사용자가 체감할 수 있는 수준은 어디까지일까?
  • 멀티모달 기능이 어느 범위까지 개방될 수 있을까?
  • 외부 개발자나 학생이 Kanana 모델을 실험하고 활용할 기회는 얼마나 제공될까?

이는 단점이라기보다는, 앞으로의 발전 과정에서 확인해보고 싶은 지점에 가깝다.

7. 마무리: 이 공부가 KANANA 429로 이어진 이유

Kanana 모델을 공부하며 느낀 점은, 카카오의 AI가 ‘성능을 과시하는 기술’보다는 ‘사람과 함께 쓰이는 기술’을 지향하고 있다는 것이다. 아직 완성형이라고 보기는 어렵지만, 방향성만큼은 분명해 보인다.

 

이번 정리를 계기로 Kanana 모델과 카카오 AI를 더 깊이 이해하고, 대학생의 눈높이에서 이를 설명하는 역할을 해보고 싶어 KANANA 429 앰배서더에 지원하게 되었다. 앞으로 이 모델이 실제 서비스에서 어떻게 진화해갈지 계속 지켜보고 싶다.

반응형