카카오가 드디어 일을 냈습니다. GPT-4o와 견줄만한 성능의 경량 멀티모달 언어모델을 오픈소스로 공개했는데요. 그것도 이미지까지 이해하고 명령까지 수행하는 수준으로 말이죠. AI 개발자라면 물론, AI에 관심 있는 분이라면 이 소식 절대 놓치지 마세요.
안녕하세요. 오늘은 카카오가 7월 24일 공개한 ‘카나나’ 시리즈에 대해 소개해 드릴게요. Hugging Face에 공개되면서 누구나 활용할 수 있게 됐고, 딥시크(DeepSeek)처럼 ‘저비용·고효율’ 전략도 눈에 띕니다. 국내 AI의 새로운 진화, 지금부터 자세히 들어가 보시죠!
📚 카카오가 공개한 모델은?
2025년 7월 24일, 카카오는 두 가지 AI 모델을 오픈소스로 공개했습니다. 하나는 카나나-1.5-v-3b, 다른 하나는 전문가 혼합 구조인 카나나-1.5-15.7b-a3b입니다. 이 모델들은 텍스트뿐 아니라 이미지까지 이해하고, 다양한 지시를 자연스럽게 수행할 수 있도록 설계됐어요.
특히 ‘카나나’ 시리즈는 올 2월 플래그십 모델부터 시작해, 5월엔 경량 모델 4종을 선보였고, 이번에는 본격적으로 멀티모달과 MoE 구조까지 공개한 것입니다.
➤ 카나나-1.5-v-3b의 기능과 성능
모델명 | 기능 | 특징 |
---|---|---|
카나나-1.5-v-3b | 텍스트+이미지 이해, 명령 수행 | GPT-4o급 성능, 한국어·영어 강점 |
카나나-1.5-15.7b-a3b | 전문가 혼합(MoE) 방식 | 자원 효율성↑, 비용↓ |
카카오는 특히 지식 증류(knowledge distillation) 기법을 사용해 고성능 대형 모델의 지식을 경량 모델에 전달함으로써 성능을 극대화했다고 설명했습니다. 이는 비용 부담은 줄이고 정확도는 높이는 전략이죠.
➤ MoE 모델, 딥시크 전략과 닮았다
- ✔️ MoE란? Mixture of Experts, 작업 종류에 따라 전문가 모델을 선택적으로 활성화하는 기술
- ✔️ 장점: 계산 자원 절약, 속도 향상, 대규모 AI도 저비용 운영 가능
- ✔️ 중국 딥시크 모델도 같은 전략으로 전 세계 주목
카카오가 선택한 MoE 구조는 단순한 성능 경쟁을 넘어서, AI 대중화를 위한 중요한 해법으로도 주목받고 있습니다.
➤ GPT-4o, 큐원2.5, 하이퍼클로바와 비교
카카오는 이번에 공개한 카나나-1.5-v-3b가 성능 면에서 오픈AI의 GPT-4o와 비슷한 수준이라 자신합니다. 특히 이미지 이해와 지시 이행 면에서 다른 국내외 경량 모델보다 더 높은 점수를 기록했다고 밝혔습니다.
모델 | 비교 포인트 | 결과 요약 |
---|---|---|
GPT-4o | 텍스트+이미지, 음성까지 가능한 고성능 모델 | 범용성은 높지만 경량화 어려움 |
큐원 2.5 (알리바바) | 중국 경량 LLM | 텍스트는 우수하나 이미지 이해 한계 |
하이퍼클로바 X 시드 비전 3B (네이버) | 한국어 특화 멀티모달 모델 | 한국어 강점 있으나 지시 이행력은 부족 |
카나나-1.5-v-3b | 텍스트+이미지, 지시 이행, 언어 혼합 | 고성능+경량화+한국어/영어 모두 우수 |
즉, ‘작지만 강한 모델’로 GPT-4o와 경쟁할 수준이라는 게 카카오의 입장이며, 특히 한국어 AI 모델로서 경쟁력을 높일 수 있다는 점에서 기대감이 큽니다.
➤ Hugging Face 오픈소스 의미는?
- ✔️ 공개 플랫폼: 전 세계 AI 개발자들이 공유·개발하는 AI 오픈소스 허브
- ✔️ 누구나 다운로드 가능: 기업·개인 모두 자유롭게 사용 가능
- ✔️ 글로벌 AI 생태계 연결: 국내 AI 기술을 세계로 확장할 기회
카카오가 Hugging Face를 선택한 이유는 명확합니다. 개방성과 확장성. 이로써 국내 AI 기술도 글로벌 무대에서 테스트되고 발전할 수 있는 기반을 마련한 셈이죠.
➤ 핵심 요약과 전망
- 🚀 카나나-1.5-v-3b: 이미지+텍스트 멀티모달, GPT-4o 수준
- 🧠 카나나-1.5-15.7b-a3b: MoE 전문가 혼합 구조로 효율성 강화
- 🌍 Hugging Face 공개: 글로벌 접근성 확대
- 🔍 지식 증류+MoE 전략: ‘작고 똑똑한 AI’의 실현
이제 중요한 건, 이 모델을 어떻게 활용할지에 대한 아이디어겠죠. 기업용 챗봇, 이미지 분석 툴, 창작 지원 도구 등 다양한 분야에서 카카오의 AI는 쓰일 수 있습니다. 오늘의 공개는 그 시작일 뿐일지도 모릅니다.
💬 자주 묻는 질문 (FAQ)
카카오는 이제 단순한 포털 기업이 아닙니다. AI 기술의 본격적인 주자로 자리 잡으며, 국내를 넘어 글로벌 경쟁에 뛰어들고 있어요. 카나나 시리즈의 멀티모달 능력과 경량화 전략은 앞으로 다양한 산업에 혁신을 가져올 가능성이 큽니다.
오픈소스 모델을 통해 누구나 AI를 활용하고, 발전시킬 수 있는 환경. 그 시작점에 카카오가 있다는 것, 꽤 의미 있지 않을까요? 앞으로 우리 일상 곳곳에서 이 기술이 어떤 방식으로 스며들지 지켜보는 재미도 기대됩니다.
'핫이슈' 카테고리의 다른 글
2025년 민생회복 소비쿠폰 사용처 혼란, 왜 이렇게 헷갈릴까? (2) | 2025.07.31 |
---|---|
12·29 여객기 참사 피해지원 포털 시범 운영 시작! 유가족 정보 접근성 강화 (4) | 2025.07.30 |
다 유튜브 한다고 하더니… 이제는 국회까지 나섰다 (8) | 2025.07.24 |
2025 최저임금 2.9% 인상 확정…내 월급은 얼마나 오를까? (7) | 2025.07.11 |
백종원 vs 김재환 전 PD, 진짜 갈등의 시작은? (7) | 2025.07.10 |