[테크수다 기자 도안구 eyeball@techsuda.com] 메타(Meta)가 아마존웹서비스(Amazon Web Services, AWS)와 그래비톤(Graviton) 코어 수천만 개를 도입하는 대규모 협약을 맺었다. 메타는 24일(현지시간) 자사 뉴스룸에서 이번 협약을 공식 발표했다. 메타는 이번 계약으로 세계 최대 그래비톤 고객사 중 하나로 올라섰다. 메타가 2025년 11월부터 엔비디아(NVIDIA), AMD, 구글(Google) 클라우드와 잇따라 칩 공급 계약을 맺은 데 이어 네 번째 대형 실리콘 파트너십이다.
메타는 2026년 한 해 AI 인프라에 최대 1,350억 달러를 투입한다고 밝힌 바 있다.
📌 메타는 AWS의 자체 ARM 기반 CPU '그래비톤(Graviton)' 코어 수천만 개를 도입해 에이전틱 AI 워크로드를 처리한다.
📌 이번 계약은 엔비디아·AMD·구글 TPU·자체 칩 MTIA에 이어 메타가 추진하는 다섯 번째 칩 다변화 축이다.
📌 메타는 GPU 중심 AI 인프라에 CPU 비중을 끌어올려, 추론·계획·실행을 반복하는 에이전트형 AI에 대응한다.
CPU 중심 에이전틱 AI…그래비톤이 떠오른 이유
이번 협약의 핵심은 GPU가 아닌 CPU에 있다. AWS 그래비톤(Graviton)이란 아마존이 자체 설계한 ARM 기반 서버용 CPU 제품군이다. 최신 그래비톤5(Graviton5)는 더 빠른 데이터 처리와 큰 대역폭을 제공한다.
메타가 GPU 대신 CPU 코어를 대규모로 확보한 이유는 '에이전틱 AI(agentic AI)'의 부상에 있다. 에이전틱 AI란 사용자의 지시 없이도 스스로 추론하고 계획하며 복잡한 작업을 단계별로 실행하는 자율형 AI 시스템을 말한다. 챗봇이 한 번의 질문에 한 번의 답을 내놓는 것과 달리, 에이전트는 여러 단계의 의사결정과 도구 호출, 메모리 관리를 반복한다. 이 과정에서 GPU의 행렬 연산뿐 아니라, 일반 연산과 데이터 흐름 제어, 시스템 호출을 담당하는 CPU의 역할이 급격히 커진다.
메타 인프라 총괄 산토시 자나르단(Santosh Janardhan)은 "AWS는 수년간 신뢰할 수 있는 클라우드 파트너였으며, 그래비톤으로 협력을 확장하면 메타 규모에서 필요한 성능과 효율로 에이전틱 AI 뒤에 있는 CPU 집약적 워크로드를 실행할 수 있다"고 말했다. 첫 배치는 코어 수천만 개 규모로 시작한다. 이후 메타의 AI 역량 성장에 맞춰 단계적으로 확장된다.
아마존 부사장 겸 수석 엔지니어 나페아 브샤라(Nafea Bshara)는 "그래비톤 코어 수천만 개 배치는 목적에 맞춘 실리콘과 AWS AI 스택이 결합될 때 차세대 에이전틱 AI를 구동하는 동력이 어떻게 만들어지는지 보여준다"고 말했다.
엔비디아·AMD·구글·브로드컴 잇는 5중 실리콘 전략
이번 AWS 협약은 메타의 '다중 공급사 실리콘 전략(multi-vendor silicon strategy)'을 잇는다. 메타는 지난 6개월 사이 다섯 갈래로 칩 공급망을 재편했다.
먼저 엔비디아(NVIDIA)와는 차세대 블랙웰(Blackwell)과 베라 루빈(Vera Rubin) GPU 수백만 개 도입 계약을 맺었다. AMD와는 5년간 약 1,000억 달러 규모의 공급 계약을 체결하고 MI450 GPU의 첫 고객사로 이름을 올렸다. AMD 거래에는 메타가 AMD 지분 최대 10%를 확보할 수 있는 워런트가 포함됐다. 2026년 2월 26일에는 구글과 다년간 수십억 달러 규모의 텐서처리장치(Tensor Processing Unit, TPU) 임대 계약을 맺었다. 메타는 2027년 자체 데이터센터에 TPU를 직접 도입하는 방안도 협의 중이다. 4월 15일에는 브로드컴(Broadcom)과 2029년까지 자체 칩 MTIA(Meta Training and Inference Accelerator) 공동 개발 계약을 연장했다.
메타는 자체 칩 MTIA도 빠른 속도로 갱신한다. 2026년 3월 메타는 MTIA 300, 400, 450, 500의 신형 칩 4종 로드맵을 공개했다. 이 중 MTIA 300은 추천·랭킹 학습용으로 이미 가동 중이다. MTIA 400은 테스트를 마치고 데이터센터 배치를 앞두고 있다. MTIA 450과 500은 생성형 AI 추론에 최적화돼 2027년까지 순차 도입된다. 메타는 약 6개월마다 신형 칩을 출시하는 속도전을 펼치고 있다.
여기에 이번 AWS 그래비톤 계약이 더해지면서, 메타는 GPU(엔비디아·AMD), TPU(구글), 맞춤형 ASIC(자체 MTIA·브로드컴), 범용 ARM CPU(AWS 그래비톤)의 네 가지 아키텍처를 모두 운용하는 하이퍼스케일러가 됐다.
자나르단은 "메타 규모의 AI 구축에는 다변화된 인프라 접근이 필요하다"고 말했다. 이는 단일 공급사 의존에서 벗어나려는 협상력 강화 전략이다. 동시에 워크로드별 최적 칩 배치를 통한 비용·성능 최적화 시도이기도 하다. 모건스탠리와 모닝스타 등 월가 분석가들은 메타의 이 전략을 "다중 실리콘 전략(multipronged silicon strategy)"이라고 부른다. 엔비디아는 프런티어 모델 학습, AMD는 추론, 구글 TPU는 라마(Llama) 학습 후보, 자체 MTIA는 추천 알고리즘, 그리고 이번 AWS 그래비톤은 에이전트 CPU 워크로드를 담당하는 역할 분담 구조다.
업계는 이번 계약이 엔비디아 의존도를 더 빠르게 낮추는 신호탄이라고 본다. 메타는 2025년 약 720억 달러였던 AI 인프라 투자를 2026년 1,150억∼1,350억 달러로 거의 두 배 늘릴 계획이다. 이 막대한 투자를 한 공급사에 몰아주지 않고 다섯 갈래로 분산하는 것이 메타의 명확한 메시지다.
메타 AWS 그래비톤 계약, 이것만은 짚고 가자
Q1. AWS 그래비톤(Graviton)은 정확히 어떤 칩인가?
그래비톤은 아마존웹서비스가 자체 설계한 ARM 아키텍처 기반 서버용 CPU 제품군이다. 인텔과 AMD의 x86 CPU 대신 ARM 명령어 체계를 사용한다. 전력 효율이 높고 AWS 데이터센터 안에서만 운영된다. 최신 그래비톤5는 데이터 처리 속도와 메모리 대역폭이 강화돼 AI 워크로드에 적합하도록 개선됐다.
Q2. 메타는 왜 GPU가 아닌 CPU를 수천만 개나 도입하나?
에이전틱 AI는 단순한 모델 추론을 넘어 도구 호출, 메모리 관리, 다단계 의사결정 같은 일반 연산을 동반한다. 이런 작업은 GPU보다 CPU에 적합하다. 메타는 이미 충분한 GPU 자원을 확보한 상태에서 부족했던 CPU 측면을 보강하는 셈이다.
Q3. 메타의 자체 칩 MTIA가 있는데 왜 외부 칩까지 사들이나?
MTIA는 6개월 주기로 갱신되지만 단일 칩으로 모든 AI 워크로드를 감당하기는 어렵다. 메타는 워크로드별 최적 칩 배치 전략을 택하고 있다. 학습용은 엔비디아, 추론용은 AMD와 MTIA, 에이전트 CPU는 그래비톤 식으로 역할을 분담하는 구조다.
Q4. 엔비디아에 미치는 영향은 어떤가?
직접적 위협보다는 의존도 분산 신호로 해석된다. 메타는 엔비디아 베라 루빈 GPU도 동시에 대량 구매 중이다. 다만 구글, AMD, AWS, 브로드컴으로 옵션이 늘어나면서 엔비디아의 가격 협상력은 점진적으로 약화될 가능성이 있다.
Q5. 메타의 전체 AI 인프라 투자 규모는 어느 정도인가?
메타는 2026년 한 해에만 1,150억∼1,350억 달러를 AI 인프라에 투자할 계획이다. 2025년 약 720억 달러에서 거의 두 배로 늘어난 수치다. 이번 AWS 그래비톤 계약도 이 거대한 투자 계획의 일부다.
테크가 전 산업 영역에 스며드는 소식에 관심이 많다. 1999년 정보시대 PCWEEK 테크 전문지 기자로 입문한 후 월간 텔레닷컴, 인터넷 미디어 블로터닷넷 창간 멤버로 활동했다. 개발자 잡지 마이크로소프트웨어 편집장을 거쳐 테크수다를 창간해 지금까지 활동하고 있다. 태블릿을 가지고 얼굴이 꽉 찬 방송, 스마트폰을 활용한 현장 라이브를 한국 최초로 진행했다.