노타, 국산 NPU에서 2,360억 파라미터 'K-엑사원' 최적화…모델 크기 71% 줄였다
AI 경량화·최적화 전문기업 노타가 퓨리오사AI(FuriosaAI)의 데이터센터용 NPU(신경망처리장치)에서 LG AI연구원의 대형 AI 모델 'K-엑사원(EXAONE) 236B' 최적화에 성공했다. 노타는 약 2,360억 개 파라미터 규모인 이 모델의 크기를 약 71% 줄이면서도 주요 벤치마크 3종 단순 평균 기준 원본 대비 약 99.2%의 정확도를 유지했다고 밝혔다.