SKT가 공개한 '5000억 파라미터' AI의 비밀: A.X K1 기술 보고서 해설!
안녕하세요, 친절한 IT 해설가입니다.
요즘 IT 뉴스에서 '초거대 AI'나 '파라미터' 같은 용어들을 자주 접하게 되는데요. SK텔레콤이 자체 개발한 초거대 AI 모델의 핵심 기술을 담은 보고서를 공개하면서 큰 주목을 받고 있습니다.
오늘은 이 '5000억 파라미터'라는 숫자가 대체 무엇을 의미하는지, 그리고 SKT가 어떤 특별한 방법으로 이 거대한 AI를 만들어냈는지 쉽고 자세하게 풀어 설명해 드릴게요.
AI의 '뇌 용량', 5000억 파라미터의 의미는?
SKT가 공개한 모델의 이름은 ‘에이닷엑스 케이원(A.X K1)’입니다. 이 모델은 무려 5190억 개에 달하는 파라미터(Parameter)를 가지고 있는데요.
여기서 ‘파라미터’는 쉽게 말해 AI 모델이 학습한 데이터와 지식을 저장하는 가중치, 즉 AI의 지능적인 뇌 용량이라고 생각하시면 됩니다. 이 숫자가 클수록 AI가 더 복잡하고 정교한 추론을 할 수 있게 되죠. A.X K1은 국내에서 5000억 개 이상의 파라미터를 구현한 첫 초거대 AI 모델이라는 점에서 큰 의미가 있습니다[5].
제한된 자원으로 초거대 모델을 만든 비결: MoE 구조
AI 모델을 개발할 때는 엔비디아의 GPU(그래픽 처리 장치) 같은 고성능 컴퓨팅 자원이 필수적인데요. SKT는 1024장의 GPU(H200)와 약 4개월이라는 제한된 개발 기간 내에 이 거대한 모델을 완성했습니다[1].
이처럼 제한된 자원 속에서도 뛰어난 효율성을 발휘할 수 있었던 비결은 바로 ‘MoE(Mixture of Experts)’, 즉 전문가 혼합 구조 덕분입니다.
이 기술을 쉽게 설명해 드릴게요. 만약 AI에게 "미적분 문제를 풀어라"라는 요청이 들어왔다고 가정해 봅시다. 기존의 AI는 5000억 개의 뇌 전체를 가동해야 했지만, MoE 구조는 그렇지 않아요.
5190억 개의 파라미터 중 해당 문제에 가장 적합한 '수학 전문가' 파트(약 330억 개)만 선택적으로 활성화해서 사용합니다[5]. 이는 학습의 안정성과 효율성을 동시에 높여주는 혁신적인 방법이라고 할 수 있습니다.

실제로 A.X K1은 수학 및 코딩 분야에서 기존의 딥시크-V3.1 모델 대비 각각 102%, 110% 더 뛰어난 성능을 보여주면서, 이 MoE 구조의 효율성이 입증되었어요[3]. 제한된 자원으로도 고품질의 결과물을 만들어냈다는 점에서 더욱 기대가 됩니다.
연내 '조 단위 확장'과 멀티모달 기능 추가 예정
SKT는 A.X K1을 여기서 멈추지 않고, 더욱 공격적으로 확장할 계획을 발표했습니다. 연내에 모델 크기를 조 단위 수준으로 확대하는 것은 물론, 멀티모달(Multimodal) 기능도 추가할 예정이라고 해요[2, 3].
멀티모달 기능이란, 현재 주로 텍스트를 다루는 LLM이 텍스트뿐만 아니라 이미지, 영상, 음성 등 다양한 형태의 데이터를 동시에 이해하고 처리할 수 있게 되는 것을 의미합니다. AI가 세상을 훨씬 입체적으로 이해하게 되는 것이죠.

SKT의 이번 기술 보고서 공개는 자체 AI 기술력에 대한 자신감을 보여주는 동시에, 앞으로 국내 AI 기술 경쟁을 한 단계 끌어올리는 중요한 발판이 될 것으로 기대됩니다. 조 단위 규모로 성장할 A.X K2 또는 다음 버전의 성능과 활용도가 벌써부터 궁금해지네요!
본 포스팅은 AI를 활용하여 제작된 정보성 요약 글입니다.