NPU가 더 지능적인 Windows 시대를 여는 방법
[테크수다 기자 도안구 eyeball@techsuda.com] 마이크로소프트 사이트에 윈도우에 적용된 NPU(Neural processing unit) 관련 글이 있어 이를 오픈AI ChatGPT-5를 통해 번역했습니다.
오역이 있을 수 있으니 반드시 원문을 확인해주세요.
Copilot+ PC 안에는 작지만 강력한 AI 엔진이 들어 있다. 이 엔진은 원래 스마트폰에서 쓰이던 기술을, 마이크로소프트가 실리콘 파트너들과 함께 최신 개인용 PC에 적용한 뉴럴 프로세싱 유닛(NPU) 이다.
이 NPU 칩은 AI 작업을 장치 내에서 가속화할 수 있어, 즉 클라우드가 아니라 로컬(기기 내부)에서 처리될 수 있게 한다. 이로써 Copilot+ PC가 제공하는 디지털 경험이 더 풍부해진다.
이 PC가 다른 제품과 다른 점은 NPU가 초당 40조 회 이상의 연산(Trillion Operations Per Second, TOPS) 을 수행할 수 있어야 한다는 요구가 있다는 것이다. TOPS는 시스템이 초당 수행할 수 있는 연산량을 측정하는 단위이다.
NPU는 기계 학습과 소형 언어 모델 처리를 효율적으로 수행하도록 특화되어 있어, 이미지 생성이나 지능형 카메라 효과 같은 특징들을 구현하면서도 PC의 다른 영역에 과부하를 주지 않는다. 즉, 전력 소모를 적게 하면서도 AI 연산을 맡아주어, 노트북이 전원에 연결되지 않아도 배터리 지속시간을 더 오래 유지할 수 있게 돕는다.
NPU 덕분에 마이크로소프트와 다른 제조사들이 더 정교한 AI 기능을 더 저렴한 기기에서도 제공할 수 있게 된다. 예전 같으면 계산 자원이 수천 달러짜리 서버급 하드웨어를 필요로 했을 작업들을, 이제는 수백 달러짜리 기기에서도 구현할 수 있게 하여 기술 접근성을 넓힌다는 것이다.
아키텍처 측면에서 보면, NPU는 Copilot+ PC가 더 진보된 기술이 나올 때를 대비할 수 있게 한다. 예를 들어, Copilot+ PC의 NPU는 향상된 윈도우 검색 기능을 가능하게 한다. 사용자는 자연어로 질문을 던져 파일, 설정, 사진 전반을 정확하게 검색할 수 있고, 시각 지능 기능은 화면 상의 이미지에서 텍스트 복사, 요약, 콘텐츠 식별 같은 작업을 쉽게 할 수 있게 한다.
NPU는 일부 로컬 처리를 수행하고, 더 큰 모델이 필요할 경우 클라우드 처리를 병행하는 구조로 작동할 수 있다.
인터넷이 연결되어 있다면, NPU와 클라우드가 협업해 더 확장된 경험을 제공할 수 있다.
마이크로소프트는 올해 창립 50주년을 맞았고, 윈도우는 11월에 40주년을 기념한다. 이런 시점에서 NPU 기술이 새로운 전환점이 될 수 있다는 의미가 크다.
Copilot+ PC에서 NPU의 진화 과정
Copilot+ PC의 NPU 개발 여정은 수년 전 Surface Hub 2 스마트 카메라에서 시작되었다. 이 카메라는 영상 리프레이밍, 원근 보정과 같은 복잡한 AI 작업을 로컬에서 수행할 수 있는 전용 프로세서를 지녔고, 이를 통해 실시간 사용자 경험을 개선할 수 있다는 개념을 입증했다.
예컨대 눈 맞춤(eye contact), 배경 흐림(blur) 처리, AI 오디오 잡음 제거 등 기능을 제공했다.
마이크로소프트는 이 스마트 카메라의 교훈을 가져와 주류 컴퓨팅 영역에 응용했다. AMD, 인텔, 퀄컴과의 협력을 통해 Copilot+ PC용 NPU를 개발했다.
이런 발전은 지금의 Copilot+ PC가 제공하는 AI 기능의 기반이 되었다. 예를 들어, Recall 기능은 Copilot+ PC에서 이전에 본 항목들을 비주얼 방식으로 추적하며 다시 접근할 수 있게 한다. Click to Do 기능은 화면의 PDF나 텍스트 등에서 요약, 재작성, 복사, 검색 같은 작업을 단축하는 기능이다. 이 기능군은 점진적으로 확대 중이며, 일부는 구독 없이도 제공된다.
예를 들어, 마이크로소프트 Photos 앱에서는 relight 기능을 추가해 사진의 조명을 직관적으로 조정할 수 있게 했다.
가장 큰 장점 중 하나는 여러 AI 기반 애플리케이션을 동시에 실행할 수 있다는 점이다. 다른 생성형 AI는 클라우드 기반 대형 언어 모델을 쓰는 반면, NPU는 소형 언어 모델(small language models) 을 구동할 수 있다.
Bathiche는 윈도우 플랫폼이 기기의 구성(예: GPU 크기 등)에 따라 작업 부하를 유연히 분배할 수 있다고 말한다. 예컨대 GPU가 크면 그래픽 작업을 GPU에 배분하고, 전력 효율을 위해 NPU가 백그라운드 AI 처리를 맡을 수 있다는 것이다.
미래: 더 직관적인 방식으로 더 많은 사람에게
Bathiche는 이렇게 말한다.
“지난 60년 동안 우리가 컴퓨터를 사용하는 방식은 실제로 거의 바뀌지 않았다. (마우스와 키보드 중심의 상호작용)”
AI 에이전트(사용자 요청을 이해하고 권한 하에 작업을 수행하는 지능형 소프트웨어)가 나오면, 클릭이 훨씬 줄어든 미래가 가능하다고 본다.
NPU는 이러한 직관적 상호작용을 더 발전시키는 역할을 할 것이다.
NPU는 향상된 응답성과 속도를 제공해 에이전트가 로컬에서 고급 AI 모델을 구동하도록 돕는다.
예컨대 Copilot+ PC의 새 Settings 에이전트는 “내 마우스가 너무 작다”와 같은 설명만으로, 커서 크기 변경 같은 설정까지 제안할 수 있다.
앞으로 이 팀은 장치 내 에이전트가 더 복잡한 작업을 처리하는 미래를 그린다.
Bathiche는 다음과 같이 덧붙인다.
“에이전트는 진정한 북극성(north star)이다. 그들은 지금 사람과의 새로운 상호작용 단위이며, 개발자에게는 프로그래밍의 새로운 단위다.”
[테크수다 기자 도안구 eyeball@techsuda.com]