젠슨 황 엔비디아 CEO, ‘에이전트’로 데이터센터부터 거실까지 꿰다…마이크로소프트와 협력해 윈도우 생태계 AI로 리인벤트

[테크수다 기자 도안구 eyeball@techsuda.com] 젠슨 황(Jensen Huang) 엔비디아(NVIDIA) CEO가 다시 ‘에이전트’를 들고 무대에 섰다. 그는 2026년 6월 1일 타이베이 뮤직센터에서 열린 GTC 타이베이(GTC Taipei) 기조연설에서 “유용한 AI가 도착했다”고 선언했다. 이날 연설은 컴퓨텍스(Computex) 개막 무대와 맞물렸고, 타이완 전역 70곳의 워치파티로 동시에 중계됐다.

황 CEO는 약 두 시간 동안 하나의 메시지를 반복했다. AI의 중심이 ‘답을 생성하는 모델’에서 ‘일을 수행하는 에이전트’로 이동했다는 것이다. 그는 데이터센터 칩, AI 팩토리, 기업용 소프트웨어, PC, 자율주행차, 휴머노이드까지 모두 같은 에이전트 컴퓨팅 패턴으로 설명했다. 그 중심에는 풀생산에 들어간 차세대 플랫폼 베라 루빈(Vera Rubin)이 있었다.

에이전트 AI는 모델이 도구와 메모리를 직접 다루며 일을 수행하는 AI다. 황 CEO는 이번 연설에서 컴퓨팅의 기본 단위가 앱에서 에이전트로 이동하고 있다고 봤다. 사용자가 앱을 열고, 클릭하고, 입력하는 방식 대신 사용자의 의도를 AI에 설명하면 에이전트가 도구를 호출해 결과물을 만드는 방식이다.

핵심 요약 3줄

  • 황 CEO는 깃허브 커밋이 2026년 초 거의 3배로 늘었다는 점을 근거로 “유용한 AI”, 즉 에이전트 AI가 실제 생산성으로 나타나기 시작했다고 말했다.
  • 엔비디아는 에이전트 시대를 겨냥한 베라 루빈을 풀생산 단계에 올렸고, 에이전트를 위해 설계한 CPU ‘베라(Vera)’를 전면에 세웠다.
  • 같은 에이전트 컴퓨팅 패턴은 AI 팩토리, 기업용 소프트웨어, RTX Spark 기반 윈도우 PC, 자율주행차, 휴머노이드까지 확장됐다.

“AI가 일자리를 줄인다는 건 헛소리”…커밋 3배가 연 선언

황 CEO는 거창한 비전보다 숫자로 연설을 시작했다. 화면에는 깃허브(GitHub) 화면이 떴다. 그는 깃허브를 전 세계 3천만~4천만 명의 전문 소프트웨어 개발자가 코드를 올리고 수정하는 핵심 플랫폼으로 설명했다.

황 CEO는 커밋(commit) 추이를 짚었다. 2023년 약 3억 건, 2024년 약 4억 건, 2025년 약 5억 건이던 커밋이 2026년 초 몇 달 만에 거의 3배로 늘었다는 것이다. 그는 이 변화를 코딩 에이전트 확산의 직접적인 신호로 해석했다.

이어 경제적 의미를 붙였다. 그는 전 세계 전문 개발자의 임금 총액을 약 3조 달러로 추산했다. 그 3조 달러어치 인건비가 거의 3배의 산출을 낸다면, 사실상 9조 달러 수준의 생산성이 만들어진다는 계산이다.

황 CEO는 일자리 논쟁도 정면으로 받았다. 그는 AI가 일자리를 줄인다는 주장에 대해 “완전히 헛소리”라고 말했다. 생산성이 크게 늘어나면 기업은 오히려 더 많은 개발자를 고용하려 한다는 논리다. 개발자 한 명이 더 많은 가치를 만들 수 있다면, 줄일 이유보다 늘릴 이유가 커진다는 것이다.

이 대목에서 그는 산업 전체의 그림으로 시야를 넓혔다. 토큰은 이제 수익을 내는 단위가 됐다. AI 기업은 더 많은 토큰을 만들기 위해 더 많은 AI 팩토리를 필요로 한다. 황 CEO는 바로 이 수요가 타이완 컴퓨팅 생태계의 성장을 끌어올리고 있다고 말했다.

앱에서 에이전트로…무대에서 보여준 새 컴퓨팅 패턴

황 CEO의 핵심 논지는 컴퓨팅의 단위가 바뀌고 있다는 것이다. 과거에는 운영체제 위에서 앱과 코드가 돌았다. 이제는 그 자리를 에이전트가 차지한다. 에이전트는 모델, 하니스(harness), 도구, 스킬, 런타임으로 구성된다.

그는 모델을 두뇌에, 하니스를 몸에 비유했다. 도구는 작업장의 연장이다. 에이전트는 이 연장을 호출하고 조합해 사용자의 의도를 결과물로 바꾼다. 에이전트는 사람처럼 단기 기억과 장기 기억도 관리한다. 이 때문에 메모리 관리, 도구 호출, 오케스트레이션이 모두 중요해진다.

시연은 곧바로 이어졌다. 화면에는 프롬프트 한 줄이 떴다. 코드는 자동으로 생성됐고, 결과물이 나왔다. 황 CEO는 클로드 코드(Claude Code)와 코덱스(Codex)를 언급하며 코딩 에이전트가 이미 새로운 작업 방식을 만들고 있다고 설명했다.

또 다른 시연에서는 사용자가 “타이베이 101 빌딩을 엔비디아 그린 점으로 표현하고, GTC Taipei 2026과 엔비디아 로고로 변형되는 GIF를 만들어 달라”고 입력했다. 에이전트는 이를 코드와 결과물로 바꿨다. 리모컨 배터리 클립을 잃어버렸다는 요청에는 3D 프린팅용 CAD 파일을 만드는 장면도 제시됐다.

황 CEO는 이를 “새 컴퓨팅 패턴”이라고 불렀다. 사용자는 앱을 실행하고 클릭하는 대신 원하는 의도를 설명한다. AI는 코드를 만들거나 도구를 호출해 필요한 결과를 만들어낸다.

그는 이 전환이 소프트웨어 기업에 위협이 아니라 기회라고 봤다. 에이전트가 많아질수록 더 많은 도구가 필요하고, 소프트웨어는 에이전트가 사용할 수 있는 형태로 제공돼야 하기 때문이다. 엔비디아가 20년간 쌓아온 CUDA-X 라이브러리도 이제 사람이 아니라 에이전트가 호출하는 도구가 된다.

“컴퓨트가 곧 매출”…베라 루빈을 무대로 끌어낸 이유

황 CEO는 에이전트 시대의 핵심 인프라로 AI 팩토리를 제시했다. 고객은 더 이상 단순히 컴퓨터를 사려는 것이 아니라, 토큰을 생산하는 AI 팩토리를 짓고 싶어 한다는 설명이다. 그는 엔비디아가 GPU 회사, 시스템 회사를 넘어 AI 인프라 회사로 바뀌고 있다고 말했다.

그는 AI 팩토리의 규모도 숫자로 제시했다. 1기가와트(GW)급 AI 팩토리는 과거 200억~300억 달러에서 시작했지만, 지금은 500억~600억 달러 수준이고 곧 800억~1천억 달러에 이를 수 있다고 말했다. 또 10년이 끝나기 전에 100기가와트 규모의 AI 팩토리가 가동될 것이라고 전망했다.

이를 위한 청사진으로는 DSX와 옴니버스(Omniverse)를 소개했다. DSX는 AI 팩토리를 설계하고 운영하기 위한 레퍼런스 디자인이다. 옴니버스는 AI 팩토리를 실제로 짓기 전에 디지털 트윈으로 설계, 검증, 시뮬레이션하는 도구다. 황 CEO는 오늘날 AI 팩토리가 전력을 최대 40%까지 과다 배정하는 문제도 짚었다. DSX는 같은 전력 예산 안에서 더 많은 GPU를 안정적으로 운영하게 해주는 방식으로 설명됐다.

그 다음 본론이 나왔다. “베라 루빈이 풀생산에 들어갔습니다.” 객석에서 박수가 터졌다.

황 CEO는 베라 루빈을 단일 GPU로 보지 말라고 했다. 베라 루빈은 에이전트를 처리하기 위한 다중 랙, POD급 슈퍼컴퓨터다. 그레이스 블랙웰(Grace Blackwell)이 AI 추론을 위해 만들어졌다면, 베라 루빈은 에이전트를 돌리기 위해 만들어졌다는 설명이다.

베라 루빈 플랫폼은 베라 루빈 NVL72, 베라 CPU 랙, Groq 3 LPX, 베라 블루필드 4 STX 스토리지, 스펙트럼-X 이더넷 포토닉스 등으로 구성된다. 한 보드에 6조 개의 트랜지스터와 1만8천 개 이상의 부품이 들어간다고 설명됐다. TSMC 3나노 공정, CoWoS 패키징, 마이크론·SK하이닉스·삼성의 HBM4 메모리도 언급됐다.

현장 연출도 있었다. 무대 위로 실제 베라 루빈 랙이 등장했다. 황 CEO는 “저 뒤에서 2천 명쯤 끌고 있을 것”이라고 농담했다. 그는 베라 루빈 공급망이 그레이스 블랙웰의 두 배 규모이며, 과거 랙 하나를 조립하는 데 두 시간이 걸렸다면 이제는 5분으로 줄었다고 강조했다.

베라 CPU, “사람이 아니라 에이전트를 위한 CPU”

베라 루빈의 또 다른 핵심은 베라(Vera) CPU다. 황 CEO는 에이전트 AI가 CPU의 역할을 바꿨다고 설명했다. GPU가 오케스트라라면 CPU는 지휘자다. 에이전트 시대에는 CPU 병목이 GPU 활용률, 토큰 처리량, 지연 시간, 사용자 경험을 직접 좌우한다.

그는 기존 CPU가 사람의 사용 패턴에 맞춰져 있었다고 말했다. 사람이 클릭하고 기다리는 속도와 에이전트가 나노초 단위로 도구를 호출하고 응답을 요구하는 속도는 다르다. 그래서 에이전트를 위한 CPU가 필요하다는 것이다.

베라는 엔비디아의 올림푸스(Olympus) 코어 88개를 하나의 모놀리식 메시 구조로 묶은 CPU로 설명됐다. LPDDR5X 메모리를 사용하고, 대역폭과 단일 스레드 성능을 끌어올렸다. 황 CEO는 베라가 SQL 워크로드를 3배, 실시간 스트리밍 처리를 6배 빠르게 수행한다고 말했다. 또 에이전트 샌드박스 성능은 기존 x86 CPU 대비 1.8배라고 설명했다.

그는 베라를 새로운 성장 동력으로 봤다. 그레이스가 그레이스 블랙웰과 함께 AI 데이터센터에 사실상 표준처럼 자리 잡았듯, 베라도 베라 루빈과 함께 에이전트 CPU의 기준이 될 것이라는 기대다.

케이던스 슈퍼 에이전트와 네모트론 3 울트라

황 CEO는 에이전트가 실제 산업에 어떻게 들어가는지도 보여줬다. 대표 사례는 반도체 설계 자동화 기업 케이던스(Cadence)였다.

무대에서는 1950년대 진공관 기계가 26개 문서에서 60만 개 단어를 읽고 7분 만에 회로를 설계했다는 옛 사례가 소개됐다. 황 CEO는 “그 작업은 40분짜리 인간의 일이었다”고 말했다. 문제는 오늘날 칩 설계의 복잡성이다. 그는 엔비디아 반도체 하나를 설계하는 데 1천 명의 엔지니어가 3년을 투입하고, 그 과정에서 수백만 번의 시뮬레이션이 필요하다고 설명했다.

케이던스 시연에서는 반도체 설계 에이전트가 전력, 성능, 면적, 타이밍, 설계 규칙, 전자기 문제 등을 동시에 검토했다. 황 CEO는 에이전트를 쓰면 기존보다 40배 빠르게 작업할 수 있다고 말했다. 그는 “엔비디아의 수천 명 칩 설계자가 앞으로 수십만 개의 케이던스 슈퍼 에이전트와 함께 일하게 될 것”이라고 표현했다.

이 흐름에서 오픈 모델 네모트론 3 울트라(Nemotron 3 Ultra)도 공개됐다. 황 CEO는 이 모델이 상태공간모델(SSM)과 전문가 혼합(MoE)을 결합한 하이브리드 아키텍처 기반이라고 설명했다. 그는 네모트론 3 울트라가 5배 빠르고 30% 더 낮은 비용으로 추론을 수행한다고 말했다.

엔비디아는 모델만 공개하는 데 그치지 않는다고 밝혔다. 학습 데이터와 학습 스크립트까지 함께 공개해 기업이 자체 업무에 맞게 수정하고 개선할 수 있게 한다는 설명이다. 황 CEO는 이미 네모트론 4를 작업 중이라고 덧붙였다.

윈도우 PC의 재발명…RTX Spark와 거실의 AI 슈퍼컴퓨터

황 CEO는 이후 PC로 화제를 옮겼다. 그는 타이완을 현대 PC 산업의 출발점으로 치켜세운 뒤, PC가 다시 바뀌고 있다고 말했다. 마이크로소프트와 엔비디아가 윈도우 PC를 에이전트 시대에 맞게 다시 설계하고 있다는 것이다.

그 결과물이 AI PC용 슈퍼칩 RTX Spark다. RTX Spark는 미디어텍(MediaTek)과 공동 개발한 N1X 기반 칩으로 소개됐다. 이 칩은 6,144개의 CUDA 코어를 갖춘 블랙웰 RTX GPU, 20코어 그레이스 CPU, 128GB 통합 메모리를 담는다. 엔비디아와 마이크로소프트는 윈도우에서 에이전트가 안전하게 실행될 수 있도록 보안 프리미티브와 엔비디아 오픈셸(OpenShell) 런타임을 함께 제공한다고 밝혔다.

황 CEO의 메시지는 명확했다. “PC가 재발명되고 있습니다. 40년 동안 우리는 앱을 실행하고, 클릭하고, 입력했습니다.” 이제는 묻기만 하면 PC가 일을 하는 방식으로 바뀐다는 것이다.

시연에서는 로컬 네모트론 모델 또는 클라우드의 클로드 소네트(Claude Sonnet)에 연결된 에이전트가 주택 설계를 도왔다. 에이전트는 부지를 모델링하고, 지형과 건물 외형을 구성하고, 내부 배치를 제안했다. 이후 이미지 생성 모델을 활용해 여러 시점의 사실적인 이미지를 만들었다.

황 CEO는 어도비(Adobe)가 포토샵과 프리미어의 핵심 구조를 RTX Spark에 맞게 재설계하고 있다고 밝혔다. 윈도우용 DGX 스테이션도 함께 소개됐다. 책상 옆에 두는 AI 슈퍼컴퓨터로, 대규모 모델과 에이전트 워크플로를 기업 개발자의 책상까지 가져오겠다는 구상이다.

그는 더 먼 미래도 그렸다. 오늘날 전화기로 가장 적게 하는 일이 전화 통화인 것처럼, PC도 문서 작업과 앱 실행만 하는 기계가 아니게 될 수 있다는 것이다. 그는 언젠가 집집마다 AI 슈퍼컴퓨터가 놓이고, 그것이 개인 에이전트를 돌리는 장치가 될 것이라고 말했다. PC는 단순한 도구가 아니라 함께 일하는 동료에 가까워진다는 설명이다.

물리 AI로 확장…코스모스 3, 알파마요 2 슈퍼, 아이작 그루트

마지막 축은 물리 AI였다. 황 CEO는 에이전트 컴퓨팅 패턴이 클라우드와 PC에만 머물지 않는다고 말했다. 로봇, 자율주행차, 위성, 기지국, 공장, 엣지 장비로 확산된다는 것이다.

그는 물리 AI용 월드 파운데이션 모델 코스모스 3(Cosmos 3)를 공개했다. 코스모스 3는 이미지와 텍스트를 받아 현실적인 물리 세계 영상을 생성하는 모델로 소개됐다. 로봇과 자율주행차가 실제 환경에서 학습하기 전에 가상 세계에서 다양한 상황을 경험하도록 하는 기반이다.

자율주행 부문에서는 알파마요 2 슈퍼(Alpamayo 2 Super)가 소개됐다. 황 CEO는 이를 추론하는 자율주행차 모델로 설명했다. 시연 영상에서 차량은 정지한 선행차를 피하고, 보행자에게 양보하고, 자신의 판단 과정을 설명했다. 황 CEO는 자동차가 계속 혼잣말을 하면 사람은 불편하겠지만, 그 과정이 곧 사고라고 설명했다.

휴머노이드 부문에서는 참조 로봇 아이작 그루트(Isaac GR00T)가 등장했다. 손은 한쪽당 25자유도, 로봇 전체는 31자유도다. 키는 6피트, 무게는 150파운드로 소개됐다. 황 CEO는 “저와 비슷하다. 첫 숫자는 조금 짧고, 둘째 숫자는 조금 크지만”이라고 농담했다. 이 로봇은 젯슨 토르(Jetson Thor)와 엔비디아 로보틱스 소프트웨어 스택을 기반으로 한다.

황 CEO는 연설의 끝에서 다시 큰 그림으로 돌아왔다. 그는 지난 6개월 동안 컴퓨터 산업이 완전히 바뀌었다고 말했다. 프런티어 모델, 에이전트, 도구 호출, 메모리, 샌드박스, 물리 AI가 하나의 패턴으로 수렴하고 있다는 것이다.

그는 에이전트 컴퓨팅 패턴이 클라우드, 온프레미스, PC, 로봇, 엣지 어디서든 반복될 것이라고 봤다. 그리고 타이완 파트너들에게 감사를 전하며 연설을 마쳤다.

“고맙습니다, 타이완.”

젠슨 황 엔비디아 CEO의 GTC 타이페이 행사 이게 궁금하셨나요

Q. 황 CEO가 이번 연설에서 가장 강조한 메시지는 무엇인가요?

“유용한 AI”, 즉 에이전트 AI가 도착했다는 점이다. 답을 생성하는 AI에서 도구를 사용해 일을 수행하는 AI로 이동했다는 것이 연설을 관통한 핵심 논지였다.

Q. ‘커밋 3배’는 무엇을 뜻하나요?

황 CEO는 깃허브 커밋이 2023년 약 3억 건, 2024년 약 4억 건, 2025년 약 5억 건이었고, 2026년 초에는 몇 달 만에 거의 3배로 늘었다고 말했다. 그는 이를 코딩 에이전트 확산의 증거로 제시했다.

Q. 베라 루빈은 그레이스 블랙웰과 어떻게 다른가요?

황 CEO의 설명에 따르면 그레이스 블랙웰은 AI 추론을 위해 만들어졌고, 베라 루빈은 에이전트를 처리하기 위해 설계됐다. 베라 루빈은 단일 GPU가 아니라 여러 랙을 연결한 POD급 에이전트 슈퍼컴퓨터다.

Q. 베라 CPU가 ‘에이전트를 위한 CPU’라는 말은 무슨 의미인가요?

기존 CPU가 사람의 클릭과 입력, 대기 패턴에 맞춰져 있었다면, 베라는 에이전트가 도구를 호출하고 메모리를 관리하며 나노초 단위로 응답을 요구하는 환경에 맞춰 설계됐다는 의미다.

Q. RTX Spark와 N1X는 같은 제품인가요?

기사에서는 RTX Spark를 AI PC용 슈퍼칩 플랫폼으로, N1X를 미디어텍과 공동 개발한 기반 SoC로 구분해 쓰는 것이 안전하다. 공식 발표의 전면 제품명은 RTX Spark다.

Q. 네모트론 3 울트라의 특징은 무엇인가요?

황 CEO는 네모트론 3 울트라가 SSM과 MoE를 결합한 하이브리드 오픈 모델이라고 설명했다. 그는 이 모델이 5배 빠르고 30% 낮은 비용으로 동작한다고 말했으며, 모델과 학습 데이터, 학습 스크립트까지 공개한다고 밝혔다.

[Seoul = Techsuda eyeball@techsuda.com]