이동통신 3사의 LLM, 각기 다른 ‘소버린 AI’ 해법 < 모바일·통신 < IT·과학 < 기사본문

SK텔레콤·KT·LG유플러스, 한국어 전용 AI 모델들 비교

| 스마트에프엔 = 양대규 기자 | 한국의 '소버린 AI(AI 주권)' 실현을 위한 이동통신 3사의 경쟁이 본격화되고 있다. SK텔레콤, KT, LG유플러스는 자사 보유 데이터를 기반으로 각각 LLM(대규모 언어모델)을 개발하며, 한국어 특화 성능과 데이터 주권 확보를 핵심 가치로 내세우고 있다.

이들 모두 한국어 특화 성능과 독자 기술 확보를 강조하지만, 선택한 접근 방식은 크게 다르다.

SK텔레콤 'A.X 4.0', 720억개 매개변수로 한국어 처리 효율성 극대화

4일 업계에 따르면 SK텔레콤의 주력 LLM은 'A.X(에이닷 엑스) 4.0'이다. A.X 4.0은 720억개의 대규모 매개변수를 가진 표준 모델과 70억개의 경량 모델을 통해 한국어 처리 효율성을 극대화하는 데 중점을 둔다.

SK텔레콤은 A.X 4.0이 '현존 LLM 중에서도 최상급의 한국어 처리 효율성'을 자랑한다고 강조한다. 이 모델은 중국 알리바바가 개발한 오픈소스 모델인 Qwen2.5에 방대한 한국어 데이터를 추가 학습시켜 국내 비즈니스 환경에 최적화된 성능을 발휘하도록 고도화되었다

SK텔레콤은 글로벌 오픈소스 모델을 기반으로 하되, 자체 설계한 토크나이저와 방대한 한국어 데이터 학습, 자체 슈퍼컴퓨터 활용 등 깊이 있는 맞춤화를 통해 독자적인 기술력을 확보하고 있다.

GPT-4o 대비 우수한 한국어 벤치마크 점수와 높은 토큰 효율을 통해 국내 비즈니스 환경에 최적화된 성능을 입증했다. 대표적인 한국어 능력 평가 벤치마크인 KMMLU에서 78.3점을 기록했다. GPT-4o(72.5점)보다 높은 성능이다. 한국어 및 한국 문화 벤치마크인 CLIcK에서도 83.5점을 획득하며 GPT-4o(80.2점)보다 더 높은 한국 문화 이해도를 입증했다.

SK텔레콤은 이미 A.X 4.0을 지난 5월 에이닷 통화 요약에 적용, 성공적으로 활용하고 있다. 추후 자사는 물론 SK그룹 내 다양한 서비스에 적용할 계획이디.

이 모델은 3일 전 세계 개발자 커뮤니티 플랫폼인 '허깅페이스(Hugging Face)'를 통해 오픈소스로 공개됐다.

김지원 SK텔레콤 AI 모델 랩(AI Model Lab)장은 "SK텔레콤의 다양한 서비스를 고도화하고, 기업 시장에서 한국어 특화 LLM으로 국내 비즈니스 환경에 최적화된 모델이 될 수 있도록 지속적인 기술 개발을 추진할 계획”이라고 말했다.

KT '믿:음 2.0', 韓 문화·언어 깊이 이해하도록 고도화된 AI 모델

KT는 '믿:음'을 '한국적 독자 AI 모델'로 명확히 포지셔닝해 한국의 문화와 언어를 깊이 이해하도록 고도화된 AI 모델이라고 강조했다.

KT의 '믿:음 2.0'은 115억 개의 매개변수를 가진 베이스 모델과 23억 개의 미니 모델로 구성됐다. '한국적 AI'라는 철학 아래 데이터 구축부터 모델 학습 전 과정에 걸쳐 자체 기술로 개발했다.

믿:음 2.0은 한국 사회의 맥락과 한국어 고유의 언어적·문화적 특성을 반영하는 것을 목표로 한다. KT는 교육 서적, 문학 작품, 법률 및 특허 문서, 다양한 사전 등 산업, 공공, 문화 영역에서 자체 확보한 방대한 한국어 특화 데이터를 활용하여 믿:음 2.0을 학습시켰다.

KT는 고려대학교와 공동 개발한 'Ko-Sovereign' 벤치마크를 통해 한국의 언어, 문화, 가치관을 깊이 이해하는 능력을 강조하며, 이는 소버린 AI의 핵심 요소인 문화적 주권을 구현하려는 명확한 의지를 보여준다. 또한 마이크로소프트(MS)와의 협력과 병행하는 이중 전략은 시장의 다양한 요구를 충족시키면서도 핵심 독자 기술을 확보하려는 실용적인 접근 방식이다.

KT는 이를 비용(믿음)과 성능(MS)을 기준으로 한 선택으로 설명하며 ,고객 상황과 목적에 따라 AI 선택권을 보장하는 상호 보완적인 역할이라고 강조한다

믿:음 2.0은 4일 오픈소스 플랫폼 허깅페이스에 공개됐다.

신동훈 KT 생성형AI랩(Gen AI Lab)장(상무)은 "믿:음 2.0은 일반적인 생성 능력은 물론 한국의 문화와 언어를 깊이 이해하도록 고도화된 AI 모델"이라며 "KT가 국내 사용자에게 고성능 한국적 AI에 대한 새로운 대안을 제시하고, 글로벌 경쟁력을 갖추는 중요한 발판이 될 것"이라고 강조했다.

LG유플러스, 그룹 AI 모델 기반 특화 sLLM '익시젠'으로 비즈니스 가치↑

LG유플러스의 생성형 AI 모델은 '익시젠(ixi-GEN)'으로, LG유플러스의 광범위한 '익시(ixi)' AI 브랜드의 핵심 부분이다. LG유플러스의 '익시젠'은 LG AI연구원의 '엑사원'을 기반으로 LG유플러스의 통신 및 플랫폼 데이터를 학습하여 통신 산업에 특화된 소형 언어 모델(sLLM)로 개발됐다.

일반적으로 1000억 개 이하의 매개변수를 가진 모델이 sLLM으로 분류되며, 이는 빠른 데이터 처리 속도, 실시간 응답, 그리고 낮은 개발 및 유지보수 비용이라는 장점을 제공한다. 고객사의 경영 환경과 필요한 AI 서비스에 따라 매개변수 수를 88억 개, 250억 개 등으로 세분화하여 제공할 계획이다. 이는 유연하고 모듈화된 접근 방식을 통해 다양한 고객 요구에 맞춤형으로 대응하려는 전략이다.

익시젠은 스페인 바르셀로나에서 열린 MWC25의 '글로벌 AI 레드팀 챌린지'에서 안전성과 신뢰성을 국제적으로 인정받았다. 이 챌린지에서 익시젠은 다른 통신사 LLM(아랍에미리트의 텔콤GPT, 말레이시아의 AIngineer)과의 경쟁에서 '가장 뚫기 어려운 AI 모델'로 평가받았다.

익시젠의 기반이 되는 LG AI연구원의 '엑사원'은 한국어 능력 측면에서 주목할 만한 성과를 보인다. 엑사원은 한국어와 영어를 모두 구사하도록 학습되었으며, 2.4B 정도의 작은 모델로도 어느 정도 한국어를 능통하게 구사하는 모습을 보인다. 특히, 엑사원 3.0(78억 매개변수)은 메타의 라마 3.1, 구글의 젬마 2, 알리바바의 큐원 2 등 글로벌 오픈소스 모델과의 벤치마크 성능 비교에서 한국어 및 다국어 처리에서 뛰어난 결과를 보였다.

결국 이들 이동통신 3사는 각기 다른 전략적 경로를 통해 소버린 AI 실현에 기여하고 있다. ▲SK텔레콤은 글로벌 기술의 현지 최적화를 통해 성능과 효율성을 ▲KT는 한국적 AI의 독자 개발을 통해 문화적 깊이와 자율성을 ▲LG유플러스는 그룹 시너지와 도메인 전문화를 통해 효율성과 신뢰성을 추구한다.

이런 다양성은 한국 AI 생태계의 강점으로 작용하며, 국가가 특정 기술에 대한 의존도를 낮추고 다각적인 AI 역량을 확보하는 데 기여한다. 미래에는 이들 기업 간의 경쟁과 협력이 더욱 심화될 것으로 예상되며, 이는 한국이 글로벌 AI 강국으로 도약하고 진정한 소버린 AI를 실현하는 데 중요한 동력이 될 전망이다.

양대규 기자 yangdae@smartfn.co.kr

다른기사