구글 AI 제미나이 성공의 비밀 병기 '풀스택 통합'···TPU설계·AI모델·데이터센터아키텍처
[테크수다 기자 도안구 eyeball@techsuda.com] 척 로빈스 시스코 CEO와 아민 바닷 구글 인프라와 엔지니어링 총괄 부사장이 시스코가 마련한 AI 서밋 2026에서 대담을 나눴다. 오픈AI와 마이크로소프트의 일격에 순간 흔들리는 것처럼 보였지만 구글은 쓰러지지 않고 기사회생했다. 오히려 이제 여유를 가진 듯 성큼 성큼 나아가고 있다. 이번 대담은 플스택을 보유한 구글이 어떻게 생태계 싸움에 임하는지 엿볼 수 있는 내용이다.
관련 대담을 요약 정리하고 하단에 전문을 AI를 활용해 번역했다. 오역이 있을 수 있으니 원문을 꼭 보시기 바란다.
핵심 요약 3가지
1. 풀스택 통합이 구글 제미나이 성공의 비밀 병기
구글의 진짜 경쟁력은 TPU 칩 설계부터 DeepMind AI 모델, 데이터센터 아키텍처까지 전 계층을 통합 운영하며 공동 설계(Co-design)하는 것이다. 이러한 수직 통합 전략이 제미나이 3를 거의 모든 벤치마크에서 최첨단 성능으로 이끌었다.
2. 칩 설계 주기 3년→3개월 단축이 AI 혁신의 게임 체인저
현재 하드웨어 설계부터 데이터센터 배치까지 3년이 걸리는 주기를 2년, 나아가 3개월까지 단축할 수 있다면 특정 워크로드에 최적화된 전문 칩을 빠르게 개발해 전력 효율성을 10배 향상시킬 수 있다. 전문화는 범용성을 희생하지만 비용, 규모, 전력 모든 면에서 10배 이득을 준다.
3. 연구와 학습이 AI의 가장 과소평가된 킬러 앱
코딩, 고객지원 등이 주목받지만, 실제로 가장 많이 사용되는 AI 사용 사례는 '연구와 학습'이다. 전문가 수준의 지식에 몇 초 만에 접근할 수 있게 되면서 며칠 걸리던 업무 질문이 즉시 해결되고 있다. 이는 "모든 환자를 위한 의사, 모든 학습자를 위한 교사"를 제공할 수 있는 기회다.
🎯 Why It Matters (왜 중요한가)
구글이 약 2년 만에 AI 분야 '언더독'에서 '선두주자'로 부상한 비결이 공개되었다. 하드웨어-소프트웨어-서비스의 완벽한 통합과 빠른 반복 주기가 AI 시대의 핵심 경쟁력임이 입증되었다.
특히 주목할 점:
- 전력 효율성이 AI 인프라의 가장 중요한 제약 조건
- 범용 하드웨어에서 전문화된 xPU 시대로의 전환
- 우주 데이터센터 같은 급진적 아이디어도 진지하게 검토 중
📊 The Big Picture (큰 그림)
AI 인프라의 패러다임 전환
과거 25년간 지배했던 범용 이더넷과 GPU 중심 아키텍처가 종말을 맞이하고 있다. 각 워크로드에 최적화된 맞춤형 솔루션 시대가 열리면서:
- 하드웨어: GPU, TPU, InfiniBand, Ultra Ethernet 등 다양한 기술이 공존
- 네트워킹: 하나의 표준이 아닌 워크로드별 최적 기술 선택
- 데이터센터: 2002년 10MW → 현재 10GW (1,000배 증가)
- 혁신 속도: CPU 무어의 법칙 시대처럼 3~6개월마다 모델 성능 2배 향상
🔢 By the Numbers (주요 숫자)
- 3년 → 2년 → 3개월: 칩 설계 주기 단축 목표
- 10배: 전문화된 칩의 전력 효율성 향상 가능성
- 3~6개월: AI 모델 성능이 2배 향상되는 주기
- 10MW → 10GW: 데이터센터 전력 규모 1,000배 증가 (2002년 대비)
- 24시간: 우주 태양 동기 궤도에서 얻을 수 있는 태양광 발전 시간
- 30%: 우주에서의 냉각 효율 향상률
- 50%: 위성 간 통신으로 달성 가능한 지연 시간 감소율
💬 What They're Saying (주요 발언)
아민 바닷 (구글 AI 인프라 총괄):
"우리의 진짜 비밀 병기는 회사 전체의 스택을 통틀어 함께 일하면서 최종 문제를 해결한다는 것입니다. TPU는 DeepMind와 공동 설계되며, 검색, 광고, 유튜브 등 모든 사용 사례의 입력을 반영합니다."
칩 설계 주기 혁명:
"현재 하드웨어를 구상하고 데이터센터에 대규모로 설치하기까지 3년이 걸립니다. 만약 이를 3개월까지 단축할 수 있다면 효율성, 능력, 세상을 바꾸는 관점에서 혁명적인 일이 될 것입니다."
전문화의 경제학:
"특정 작업 부하에 특화된 장치를 만들면 전력 효율을 2배에서 5배, 심지어 10배까지 높일 수 있습니다. 전문화는 비용, 규모, 전력 모든 면에서 10배의 이득을 주지만 범용성은 포기해야 합니다."
AI의 진짜 킬러 앱:
"연구와 학습은 실제로 가장 적게 이야기되는 것 중 하나입니다. 그것은 실제로 가장 많이 사용됩니다. 인류에서 가장 광범위합니다. 우리는 모든 환자를 위한 의사와 모든 학습자를 위한 교사를 제공할 기회를 가지고 있습니다."
효율성의 역설:
"많은 사람이 효율성이 문제를 해결해 줄 것이라고 믿습니다. 하지만 놀라운 점은 효율성이 개선되어 성능이 좋아지면 사람들은 즉시 그만큼 더 많은 일을 한다는 것입니다. 우리가 제공하는 모든 효율성 개선분은 에이전트, 코딩 등 더 강력해진 기능에 의해 즉각 소비됩니다."
무어의 법칙 재현:
"모델의 능력에 숫자를 매기기는 어렵지만, CPU의 무어의 법칙 전성기 때와 같은 느낌이 확실히 듭니다. 3~6개월마다 모델이 두 배나 좋아지는 것처럼 느껴집니다."
미래 전망:
"이것은 인터넷 이후 가장 큰 혁명입니다. 세상은 근본적으로 다른 곳이 될 것이고 이번에는 훨씬 더 큰 규모일 것입니다. 우리는 말 그대로 이러한 서비스가 어떻게, 이러한 에이전트가 어떻게 전달될지 미래를 발명하게 될 것입니다."
🔍 Between the Lines (행간의 의미)
구글이 명시적으로 말하지 않은 것들:
Nvidia와의 미묘한 관계
- 표면: "Nvidia와의 파트너십이 성공의 열쇠"
- 실제: TPU로 Nvidia 의존도를 전략적으로 낮추는 중
- 의미: GPU 독점 시대가 끝나고 다양한 xPU 경쟁 시대 도래
우주 데이터센터의 진지함
- 태양 동기 궤도, 24시간 태양광, 30% 냉각 효율 향상 등 구체적 수치 제시
- "5년보다는 더 걸리지만 전력을 다해 투자할 가치"
- 의미: SF 같은 이야기가 아닌 실제 R&D 진행 중
전력 위기의 심각성
- 10MW에서 10GW로 1,000배 증가
- "칩을 3개월 만에 만들어도 건물과 전력 공급이 병목"
- 의미: AI 발전의 최대 제약은 컴퓨팅 파워가 아닌 전력
감가상각 주기 재정의
- "6-7년이 자연 법칙은 아니다"
- 더 짧은 주기, 더 빠른 교체를 정당화하려는 시도
- 의미: 하드웨어 시장의 회전율 가속화
효율성 개선의 무한 루프
- 효율성 향상 → 즉시 더 많은 작업 수행 → 다시 더 많은 자원 필요
- "효율성이 세상을 구하는 시점은 생각보다 멀다"
- 의미: AI 인프라 수요는 당분간 폭발적 증가 지속
🎓 Deep Dive: 핵심 주제 분석
1. 공동 설계(Co-design) 철학
구글의 차별화 요소는 하드웨어와 소프트웨어를 분리하지 않는다는 점이다:
- DeepMind 연구팀과 TPU 설계팀이 2~3년 앞을 내다보며 협업
- 검색, 광고, YouTube 등 실제 사용 사례가 칩 설계에 직접 반영
- "확률 분포를 알면 여러 디자인을 평가할 수 있다"
2. 전문화 vs 범용성의 트레이드오프
| 범용 하드웨어 | 전문화 하드웨어 |
|---|---|
| 모든 작업에 사용 가능 | 특정 워크로드에 최적화 |
| 낮은 효율성 | 10배 높은 효율성 |
| 긴 수명 주기 (6-7년) | 짧은 수명 주기 가능 |
| 공급망 단순 | 공급망 복잡 |
| 프로그래밍 가능 | 하드코딩 최적화 |
3. 네트워킹 패러다임의 변화
25년간 지배한 이더넷 시대가 끝나고 있다:
- AI 워크로드는 더 높은 대역폭, 더 낮은 지연, 더 나은 혼잡 제어 필요
- Ultra Ethernet Consortium 등 새로운 표준 등장
- InfiniBand 같은 특화 기술 부상
- "어떤 기술이 승리할 것인가가 아니라 고객 문제를 어떻게 해결할 것인가"
4. 우주 데이터센터의 가능성
공상과학이 아닌 진지한 검토 대상:
장점:
- 24시간 태양광 발전 (배터리 불필요)
- 기상 영향 없음
- 30% 높은 냉각 효율
- 위성 간 통신으로 50% 지연 시간 감소
과제:
- 냉각 시스템 설계
- 유지보수 (우주 로보틱스로 해결 가능)
- 발사 및 배치 비용
타임라인:
- 5년 이내는 어렵지만 10년 내 가능성
5. AI 사용 사례의 재발견
가장 많이 논의되는 사용 사례: 코딩, 고객지원, 자동화 가장 실제로 많이 사용되는 사례: 연구와 학습
바닷의 경험:
- 컴퓨터 과학 박사지만 생물학, 화학, 금융, 의학 전문가는 아님
- AI로 모든 분야의 전문 지식에 즉시 접근 가능
- 며칠 걸리던 업무 질문이 몇 분 만에 해결
- "독창적이지는 않지만 게임 체인저"
🚀 Innovation Roadmap (혁신 로드맵)
단기 (1-2년)
- TPU와 같은 전문화 칩 경쟁 심화
- 제미나이 4, 5 등 3~6개월마다 2배 성능 향상
- Ultra Ethernet 등 새로운 네트워킹 표준 확산
중기 (3-5년)
- 칩 설계 주기 3년 → 2년으로 단축
- 10GW급 데이터센터 보편화
- 개인화된 AI 교사/의사 서비스 본격화
- 우주 데이터센터 초기 실험
장기 (5-10년)
- 칩 설계 주기 18개월 → 12개월 도전
- 워크로드별 특화 칩 생태계 완성
- 우주 데이터센터 상용화 가능성
- AI가 인간 전문가 수준의 독창적 통찰 생성
⚠️ Critical Challenges (핵심 도전 과제)
1. 전력 공급 병목
문제: 데이터센터 규모 1,000배 증가했지만 전력 인프라는 따라가지 못함 해결 시도: 전력 효율 10배 향상, 우주 태양광, 액체 냉각
2. 속도(Velocity)의 압박
문제: "어떻게 하면 더 빨리 전달하고 반복할 수 있을까" (매주 최대 고민) 해결 시도: 칩 설계 주기 단축, 공동 설계 프로세스 강화
3. 효율성의 역설
문제: 효율 개선 → 더 많은 작업 → 다시 더 많은 자원 필요 (무한 루프) 현실: "효율성이 세상을 구하는 시점은 생각보다 멀다"
4. 공급망 복잡도
문제: 전문화 칩 증가 → 공급망 다변화 필요 기회: "모든 사람이 같은 것을 원하지 않으면 오히려 쉬워질 수 있다"
5. 인프라 신뢰성
문제: 수만 개 가속기 환경에서 무언가는 항상 실패함 해결: 체크포인팅, 중복성, 빠른 장애 조치
📈 Market Dynamics (시장 역학)
경쟁 환경의 변화
승자 독식이 아닌 생태계 경쟁:
- Claude, ChatGPT, 제미나이 모두 함께 발전
- "경쟁 환경이 모두를 더 낫게 만든다"
- 다양한 모델, 다양한 하드웨어, 다양한 솔루션 공존
평가(Eval) 방식의 진화:
- 실제 사용 사례에 집중
- 과거 어려웠던 케이스로 개선도 측정
- "모든 평가에서 2배 좋다고 말하기는 어렵지만 확실히 좋아지고 있다"
인프라의 전략적 가치
"인프라의 좋은 점은 인터넷이든 AI든 수요가 높다는 것"
- 스택 최상단(애플리케이션)과 최하단(인프라) 모두 중요
- 기술 혁명마다 인프라는 핵심 가치 제공
- 현재는 "미래를 발명하는" 특별한 시기
🎯 The Bottom Line (결론)
세 가지 핵심 교훈:
통합이 승리한다
- 하드웨어-소프트웨어-서비스의 완벽한 통합이 AI 시대의 필수 전략
- 독립적 설계가 아닌 공동 설계가 차별화 요소
- 2~3년 앞을 내다보는 예측력과 반복 속도가 경쟁력
전문화가 미래다
- 범용 하드웨어 시대가 끝나고 워크로드별 최적화 시대 도래
- 전력 효율 10배 향상이 가능하지만 설계 주기 단축이 관건
- 다양한 기술이 공존하는 생태계가 형성 중
AI는 인터넷보다 큰 혁명이다
- 3~6개월마다 2배씩 성능 향상 (무어의 법칙 재현)
- 가장 과소평가된 킬러 앱은 '연구와 학습'
- "모든 환자를 위한 의사, 모든 학습자를 위한 교사" 시대 도래
- 이것은 승자 독식이 아닌 생태계 혁명
최종 메시지:"기술 분야에서 일하며 기여하고 영향을 미치기에 지금보다 더 좋은 시기는 없었습니다. 우리는 말 그대로 미래를 발명하고 있습니다."
인프라와 AI: 구글 아민 바닷과 시스코 척 로빈스 대담 전문
- 척 로빈스(Chuck Robbins) 시스코 CEO
- 아민 바닷(Amin Vahdat) 구글 인프라 및 엔지니어링 총괄 부사장
CR: 요즘 어떻게 지내시나요?
AV: 정말 흥미진진한 삶을 살고 있습니다. 지금처럼 즐거웠던 적이 없었던 것 같아요. 여러분도 느끼실 겁니다. 청중 여러분도 말이죠. 저는 정말 감격스럽습니다. 사실 제미나이 3(Gemini 3)와 함께 구글은 정말 놀라운 시간을 보내고 있습니다.
제미나이 3는 정말 환상적입니다. 여러분도 아시다시피 거의 모든 벤치마크에서 최첨단 성능을 보여주고 있으며 비용 효율성도 뛰어납니다. 우리는 이 성과가 정말 자랑스럽습니다. 하지만 구글에서 지난 3년 이상의 여정을 이어온 결과라고 생각합니다. 제미나이 1이 나온 지 2년 정도 되었네요.
개인적으로 저는 항상 언더독, 즉 약자를 응원하는 편입니다. 구글이 한때 언더독 위치에 있었을 때 그곳에 있었다는 게 좋았습니다. 내부적으로는 우리 모두가 믿고 있었습니다. 실제로 우리 모두가 그랬죠. 이 여정에 오기까지 경쟁은 누구에게나 열려 있었지만, 우리는 지난 몇 년 동안 이룬 성과가 자랑스럽습니다.
CR: 충분히 자랑스러워할 만합니다. 사실 당신들은 구글에 대해 회의적이었던 사람들의 생각이 틀렸음을 매우 심오한 방식으로 증명해 냈습니다. 특정 분야에서 구글을 거의 포기했던 사람들이 있었는데, 갑자기 구글이 돌아왔으니까요. 엄청난 성공입니다. 축하드립니다.
구글의 초능력 중 하나를 꼽으라면 시장에서 가장 완벽한 '풀스택' 기업이라는 점일 것입니다. 직접 구축하는 TPU부터 분산 시스템 아키텍처, 그리고 수십억 사용자의 손에 닿는 애플리케이션에 이르기까지 스택의 모든 계층을 아우르죠. 이러한 점이 당신들의 성공에 얼마나 큰 기여를 하고 있나요?
AV: 아주 좋은 질문입니다. 이것이 사실 가장 큰 부분 중 하나라고 생각합니다. 우리 스택을 보면 TPU, 제미나이, 분산 시스템 아키텍처, 데이터센터 구조, 전력 공급 메커니즘 등 모두 자랑스럽습니다.
하지만 우리의 진짜 비밀 병기는 최종적인 문제를 해결하기 위해 회사의 모든 스택에 걸쳐 함께 협력한다는 점입니다. 그게 가장 보람찬 일이죠.
예를 들어 TPU는 고립되어 설계되지 않습니다. 구글 딥마인드(DeepMind)와 공동 설계하며, 검색, 광고, 유튜브 등 다양한 사용 사례의 입력을 반영합니다.
CR: 데미스 허사비스(Demis Hassabis)와 이 문제로 정기적으로 긴밀히 협력하고 계시죠?
AV: 맞습니다. 그와 긴밀하게 일하는 것이 제 업무 중 가장 즐거운 부분이기도 합니다. 인프라와 모델을 보면, 우리는 도전적이지만 훌륭한 위치에 있습니다. 인프라가 회사가 제공할 수 있는 가치의 제한 요소가 되는 상황이죠. 여러분의 팀이, 인프라와 그 속도 때문에 말입니다.
CR: 물론 당신들도 인정받기를 바라시겠죠.
AV: 네, 물론입니다. 하지만 다시 말해 만약 인프라 자원이 더 많았다면 그것은 회사에 매우 긍정적인 영향을 주었을 것입니다.
데미스와 저는 정기적으로 대화하고 팀 간의 교류도 깊습니다. 하드웨어와 소프트웨어 모두에서 이 공동 설계 프로세스가 매우 중요합니다.
오늘날 우리가 구축하는 소프트웨어와 하드웨어는 모두 2~3년의 리드 타임, 즉 준비 기간이 필요합니다. 따라서 모델을 개발하는 연구 팀과 손잡고 미래를 예측하는 능력, "상황이 어디로 흘러갈 것인가"를 묻고 답할 수 있는 능력이 중요합니다.
물론 미래를 완벽히 예측할 수는 없습니다. 하지만 확률 분포나 결과의 범위를 안다면 여러 디자인을 비교 평가하여 무엇이 가장 가능성이 높은지 판단할 수 있습니다.
CR: TPU 이야기를 해보죠. xPU 분야에서 거둔 첫 번째 대규모 성공 사례라고 생각합니다. GPU 부족 모델을 어느 정도 해소했고, 특히 추론(Inferencing) 측면에서 훌륭한 성과를 냈습니다.
우선, TPU를 시장에 직접 판매할 계획이 있나요, 아니면 GCP(Google Cloud Platform) 도메인 내에서만 유지할 예정인가요?
AV: TPU는 전적으로 GCP의 제품 서비스입니다. 하지만 엔비디아(Nvidia)와 GPU 역시 GCP의 거대한 제품군이라는 점을 말씀드리고 싶습니다. 우리는 엔비디아와의 깊은 파트너십을 통해 고객의 문제를 해결하는 데 집중하고 있으며, 구글의 성공 중 많은 부분이 그 파트너십의 결과입니다.
특정 사용 사례에 따라 어떤 제품이 더 적합한지가 달라질 수 있습니다.
이러한 수직적 통합, 전체 스택 솔루션은 고객이 해결하려는 문제가 무엇인지에서 시작하여 위아래로 협력하며 최선의 솔루션을 전달하는 과정입니다.
저에게 가장 흥미로운 부분은 '전문화'가 가능하다는 것입니다. GPU든, TPU든, 많은 다른 회사들의 제품들이 실제로 폭발적으로 증가하고 있습니다. 아시다시피 여기서 진짜 단계적 변화는 이제 모든 상황에 맞는 범용 아키텍처가 필요하지 않다는 점입니다. 우리는 개별 사용 사례에 특화된 하드웨어나 소프트웨어를 발명할 수 있는 단계에 와 있습니다.
CR: 모든 모델 클래스와 변형에 대해 시간이 지남에 따라 최적화된 개별 실리콘을 제작할 수 있다고 보시나요?
AV: 좋은 질문입니다. 더 전문화할수록 특정 작업 부하에 대해 더 효율적일 수 있습니다.
하지만 문제는 하드웨어 설계부터 배포까지의 리드 타임입니다. 질문에 대한 답은 '예'일 것입니다. 만약 우리가 그 리드 타임을 10분의 1로 줄일 수 있다면 말이죠.
현재는 놀라운 하드웨어를 구상하고 데이터센터에 대규모로 설치하기까지, 빛의 속도는 아니지만 정말 빠르게 해도 3년이 걸립니다.
CR: 10년 뒤에는 그 기간이 얼마나 단축될까요?
AV: 10년 뒤에는 잘 모르겠지만, 만약 이를 예를 들어 3개월까지 단축할 수 있다면...
CR: 와, 3개월이요? 그건 공격적인데요.
AV: 네, 어떻게 해야 할지는 아직 아무도 모르죠. 하지만 3개월이 된다면 효율성, 능력, 세상을 바꾸는 관점에서 혁명적인 일이 될 것입니다.
CR: 3개월 주기라면 소비가 너무 힘들지 않을까요? 칩을 데이터센터에 통합하고 용량 계획을 세우는 가치 사슬 전체가 바뀌어야 할 텐데요. 칩의 감가상각 기간도 보통 3년, 5년, 7년 정도니까요.
AV: 현재의 5~6년 감가상각 주기가 자연의 법칙이라고 생각하지는 않습니다.
CR: 그것이 프로그래밍 방식 기반일까요, 아니면 실제로 3개월마다 다른 테이프아웃(반도체 설계 완료 및 생산 의뢰)이 일어나는 것을 의미하나요?
AV: 핵심 질문입니다. 만약 프로그래밍이 가능하다면 전문화되지 않을 것이고, 전문화되지 않으면 워크로드에 최적화될 수 없습니다.
3개월은 급진적이지만 2년은 달성 가능해 보입니다. 시간의 3분의 1이죠. 그 다음 18개월. 청중 여러분 중 많은 분들이 긴장하기 시작하실 겁니다. 아마 불가능할 것 같다고요. 12개월은 할 수 없어 보입니다.
하지만 요점은 이겁니다. 더 짧게 끌어당길수록 더 전문화할 수 있고, 더 전문화할수록 더 높은 효율성을 제공할 수 있습니다.
예를 들어 특정 작업 부하에 특화된 장치를 만들면 전력 효율을 2배에서 5배, 심지어 10배까지 높일 수 있습니다. GPU든, TPU든, 또는 특정 워크로드를 위한 다른 가속기든, 전력 효율성은 최소 10배는 됩니다.
하지만 이를 위해서는 3년 뒤의 미래를 예측해야 한다는 한계가 있죠.
CR: xPU로 경제성은 어떻게 변화합니까?
AV: 좋은 질문입니다. 이것을 이렇게 생각합니다.
첫째, 비용은 하드웨어 비용만이 아닙니다. 데이터센터를 구축하고, 전력을 공급하고, 냉각하는 비용입니다. 전문화는 비용, 규모, 전력 모든 면에서 10배의 이득을 주지만 범용성은 포기해야 합니다.
전력 효율성 관점에서 10배 더 효율적인 무언가가 있다면, 우리는 같은 돈으로 10배 더 많이 배치할 수 있습니다. 그것은 엄청난 것입니다.
그 다음 질문은 얼마나 오래 사용할 것인가입니다. 오늘날 우리는 칩을 6년, 7년 동안 사용합니다. xPU가 더 전문화되면 더 짧은 기간 동안 사용할 수도 있지만, 훨씬 더 효율적으로 사용할 것입니다.
전력 효율성 측면에서, 또는 성능당 비용 측면에서 극적으로 더 나은 것을 제공할 수 있다면, 여전히 경제성이 완전히 말이 됩니다.
CR: 그런 수준의 전문화와 회전율로 공급망을 확장할 수 있습니까?
AV: 좋은 질문입니다. 그것은 해결해야 할 문제입니다. 하지만 우리가 정말 그렇게 할 수 있다면, 우리가 5~10배 더 효율적인 것을 구축할 수 있다면, 그것은 공급망의 다른 부분에 투자할 가치가 있는 문제입니다.
지금은 우리가 범용 하드웨어로 구축하고 있고, 모든 사람이 같은 것을 원하고 있습니다. 우리가 더 전문화할 수 있다면, 실제로 공급망의 일부가 더 쉬워질 수 있습니다. 모든 사람이 똑같은 것을 원하지 않기 때문입니다.
CR: 데이터센터 네트워킹에 대해 매우 열정적이시죠. 업계는 일종의 변화를 겪고 있습니다. 기존의 이더넷이 있고, InfiniBand가 있습니다. 이제 Ultra Ethernet에 대한 이야기가 있고, 훨씬 더 많은 것들이 있습니다.
가장 흥분되는 것은 무엇입니까? 그리고 오늘날 수십억 명의 사용자에게 제공되는 대규모 AI 인프라를 구축할 때 어떤 것이 필요하다고 생각하십니까?
AV: 놀라운 시기라고 생각합니다. 이더넷이 25년 동안 지배적인 기술이었습니다. 환상적이었습니다. 비용 효율적이었습니다. 범용이었습니다. 모든 애플리케이션에 적합했습니다.
우리는 이제 AI 워크로드가 다르다는 것을 인식하고 있습니다. 다른 요구사항을 가지고 있습니다. 더 높은 대역폭이 필요합니다. 더 낮은 지연 시간이 필요합니다. 더 나은 혼잡 제어가 필요합니다.
업계가 함께 모여 Ultra Ethernet Consortium과 같은 것을 형성하고 있는 것을 보는 것이 흥분됩니다. 우리는 이더넷을 어떻게 발전시킬 수 있는지 생각하고 있습니다.
동시에 InfiniBand와 같은 기술도 있습니다. 특정 워크로드에 매우 적합합니다.
저에게 핵심은 우리가 다양한 워크로드를 위한 다양한 기술을 가질 것이라는 점입니다. 어떤 경우에는 이더넷이 적합할 것입니다. 어떤 경우에는 InfiniBand가 적합할 것입니다. 어떤 경우에는 완전히 새로운 것이 필요할 수도 있습니다.
중요한 것은 우리가 문제를 해결하고 있다는 것입니다. "어떤 기술이 승리할 것인가?"가 아니라 "고객을 위해 어떤 문제를 해결해야 하는가?"입니다.
CR: 흥미롭네요. 하나의 표준이 모든 것을 지배하는 세계가 아니라 다른 워크로드를 위한 다른 표준이 있는 세계가 되는 거죠.
AV: 정확합니다. 그리고 저는 그것이 실제로 좋은 일이라고 생각합니다. 우리가 더 최적화할 수 있기 때문입니다.
범용 솔루션을 갖는 것은 훌륭합니다. 25년 동안 우리에게 잘 작용했습니다. 하지만 이제 우리는 더 전문화할 수 있고, 더 나은 결과를 얻을 수 있습니다.
CR: 데이터센터 자체와 우주 공간에 대해 이야기해보죠. 이전에 맷 가먼과도 논의했는데요. 이에 대한 견해는 어떠십니까?
AV: 매우 흥미로운 분야입니다. 구글을 비롯한 여러 기업이 이 공간을 검토하고 있습니다. '태양 동기 궤도(Sun-Synchronous Orbit)'에서 24시간 태양광 발전을 활용하는 것은 큰 매력이 있습니다.
칩을 3개월 만에 만들어도 그것을 수용할 건물과 전력을 공급하는 것이 병목이 될 수 있습니다. 만약 우주 공간에서 24시간 태양광을 활용한다면 배터리도 필요 없고 기상 영향도 없습니다.
또한 냉각 효율이 30% 높고, 위성 간 통신을 통해 광섬유를 거치지 않으므로 지연 시간을 50% 줄일 수 있습니다. 물론 냉각과 유지보수 등 해결해야 할 문제가 많지만, 우주 로보틱스가 대안이 될 수 있다고 봅니다.
현재의 인프라 배포 및 유지보수 방식은 미래의 신뢰성과 속도 요구 사항을 충족하기 어렵습니다.
2002년 구글이 첫 데이터센터를 지었을 때 10메가와트 규모였는데, 사람들은 놀라워했습니다. 하지만 이제 사람들은 10기가와트를 이야기합니다. 규모가 1,000배 커졌다는 것은 모든 방식을 재고해야 한다는 뜻입니다.
CR: 우주에서 기가와트 급 인프라를 구축하는 것이 10년 뒤면 가능할까요?
AV: 5년보다는 더 걸리겠지만 정확한 시점을 말하기는 이릅니다. 하지만 전력을 다해 투자하고 추구할 가치가 있는 아이디어이며, 이를 통해 기술적 진보를 이룰 것입니다.
CR: 지금 가장 걱정되는 것은 무엇인가요?
AV: 매주 바뀝니다. 속도(Velocity)가 가장 큰 걱정입니다. 어떻게 하면 더 빨리 전달하고 반복할 수 있을까요. 에너지, 공급망, 메모리 가격 등도 매주 고민 목록에 오릅니다.
CR: 앞으로 몇 년 동안 제약 조건과 병목 현상은 어디에 있을까요? 그리고 현재 대중이 믿고 있는 진실 중 당신이 동의하지 않는 것이 있다면요?
AV: 많은 사람이 소프트웨어, 모델, 하드웨어의 '효율성'이 문제를 해결해 줄 것이라고 믿습니다. 하지만 놀라운 점은 효율성이 개선되어 성능이 좋아지면 사람들은 즉시 그만큼 더 많은 일을 한다는 것입니다.
우리가 제공하는 모든 효율성 개선분은 에이전트, 코딩 등 더 강력해진 기능에 의해 즉각 소비됩니다. 효율성이 언젠가 세상을 구하겠지만, 그 시점은 생각보다 멀리 있을 수 있습니다.
CR: AI가 단순히 오늘날 하는 일을 조금 더 잘하는 수준을 넘어, 인간의 지식 체계에 없던 새로운 통찰력을 생성하는 단계에 왔다고 보시나요?
AV: 좋은 질문입니다. 전직 교수로서 말씀드리면, 학계에서는 아이디어의 '독창성'으로 평가받습니다. 하지만 저는 항상 거인들의 어깨 위에 서 있는 느낌이었습니다.
저에게 가장 흥미로운 점은 전문가에게 접근하기 어려운 사람들, 심지어 저처럼 정보에 접근할 수 있고 전문가에게 접근할 수 있는 특권을 가진 사람들조차 AI를 통해 고도의 질문에 대해 거의 즉각적인 답변을 얻을 수 있게 되었다는 점입니다.
독창적인 통찰력은 아닙니다. 다시 말해 제가 세계 최고의 전문가나 상위 1% 전문가에게 즉시 연락할 수 있다면 동등하거나 더 나은 답을 얻을 수 있을 것입니다. 하지만 지금은 너무나 많은 다양한 분야에서 놀라운 정보에 거의 즉시 접근할 수 있는 지점에 있습니다.
업무상 복잡한 질문을 하면 제게는 놀라운 팀이 있습니다. 하지만 제 간단한 질문에 답하는 데 많은 사람들이 며칠이 걸릴 수도 있습니다. 그곳에는 가장 똑똑한 사람들이 있고 매우 열심히 일하지만, 이제는 많은 똑똑한 사람들의 시간을 소비하지 않고 몇 초 또는 몇 분 만에 같은 답을 얻을 수 있습니다.
독창적인가요? 아니요, 아니지만 그것은 게임 체인저입니다. 대대적으로요. 게임 체인저입니다.
AI가 이제 우리가 스스로 할 수 없었던 독창적인 아이디어로 인류를 능가할 수 있을지 그렇게 걱정하지 않습니다. 어쩌면 그런 일이 일어날 수도 있습니다.
CR: 언제 일어날까요? 그것들을 모두 함께 꿰맬 때?
AV: 바로 이 순간 그것들에 접근하는 것입니다. 다시 말해 저는 컴퓨터 과학 박사 학위를 가지고 있을 수 있습니다. 매우 운이 좋습니다. 저는 컴퓨터 과학의 개념을 이해할 수 있습니다. 하지만 저는 생물학, 화학, 금융, 의학 등의 박사 학위를 가지고 있지 않습니다. 하지만 제 자신에게 그것에 접근할 수 있다는 것, 그것이 게임 체인저라고 생각합니다.
이것은 실제로 매우 흥미로운 사용 사례입니다. 제 인생에서 가장 가치 있는 사용 사례가 무엇인지 생각한다면 연구와 학습이었기 때문입니다.
CR: 네, 맞습니다.
AV: 우리는 코딩에 대해 불균형적으로 많이 이야기합니다. 고객 지원에 대해서도 많이 이야기합니다. 많은 그런 사용 사례에 대해 많이 이야기합니다. 연구와 학습은 실제로 가장 적게 이야기되는 것 중 하나입니다. 그것은 실제로 가장 많이 사용됩니다. 인류에서 가장 광범위합니다.
CR: 정확히요.
AV: 그리고 우리는 실제로 어떻게든 그것에 너무 익숙해져서 그것에 충분한 가치를 부여하는 것조차 멈췄습니다.
제가 팀에 이야기할 때 좋아하는 방식은 우리는 기회를 가지고 있다는 것입니다. 우리는 아직 거기에 있지 않고 많은 도전이 있습니다. 저는 안전에 대한 논의도 들었지만, 보안에 대해서도요.
우리는 모든 환자를 위한 의사와 모든 학습자를 위한 교사를 제공하고, 개인의 필요에 맞게 전문화할 수 있는 기회를 가지고 있습니다. 우리가 이야기한 비즈니스 사용 사례도 마찬가지입니다.
이것은 게임 체인저가 될 것입니다. 다시 말해 당신이 말했듯이 당신은 학습 지향적이고, 배우고 싶어하고, 그것을 매우 잘하는 등, 이것을 모든 사람에게 열 수 있습니다. 그리고 저는 우리가 실제로 그 정점에 있다고 생각합니다.
CR: 네, 그리고 능동적으로 제공할 수 있고... 이미 이 시점에 열려 있습니까?
AV: 매우, 매우 가깝다고 생각합니다. 인터넷이 있다면 당신은 가지고 있습니다. 그리고 이제 누락된 마지막 부분은 개인화라고 생각합니다.
다시 말해 우리는 이미 이것의 힌트를 보고 있습니다. 맞죠? 알겠습니다. G2는 정보가 이렇게 제시되는 것을 좋아합니다. 거의 같지만 약간 다르게요.
CR: 네.
AV: 우리는 거의 거기에 있다고 생각합니다. 그리고 마찬가지로 건강을 위해 할 수 있다면, 비즈니스 인텔리전스 등을 위해 할 수 있다면, 우리는... 그리고 그것은 일부 사람들이 생각하는 것만큼 멀지 않습니다.
CR: 앞으로 몇 년 동안 사람들을 흥분시키려 한다면, 제미나이 4와 제미나이 5에서 무슨 일이 일어나고 있는지, 로드맵을 공개하지 않고, 하지만 조금 더 구체적으로... 모델로서 더 나아질 것이라는 것은 우리 모두가 알고 있습니다.
무엇을 기대할 수 있다고 생각하십니까? 그리고 어떤 전환을 기대할 수 있습니까? 모든 모델마다 10배 더 나은가요? 25% 더 나은가요? 100배 더 나은가요? 그리고 그 개선이 시간이 지남에 따라 복합됩니까, 아니면 실제로 곡선으로 평탄화되기 시작합니까?
AV: 이 시점에서 저는 어떤 둔화도 보지 못합니다. 제가 말씀드리고 싶은 것은 모델의 능력에 숫자를 매기기는 어렵지만, CPU의 무어의 법칙 전성기 때와 같은 느낌이 확실히 든다는 것입니다.
우리는 청중에 Lipo가 있는데, 아시다시피 18개월마다 최신 CPU를 손에 넣을 수 없어서 안달이 났습니다. 모든 것이 같은 비용으로 두 배나 좋아졌으니까요.
제 생각에 모델의 경우 3~6개월마다입니다. 정량화는 없지만, 일이 두 배나 좋아지는 것처럼 느껴지고, 심지어 더 빠르게 좋아지는 것 같습니다.
CR: 평가(Eval)가 모델이 실제로 그 수준에서 개선되고 있는지 측정하기 위해 비례적으로 더 나아지고 있다고 생각하십니까?
AV: 평가는 정말 좋아지고 있습니다. 점점 더 실제 사용에 초점을 맞추고 있다고 생각하기 때문입니다.
실제로 우리는 모델이 과거에 잘하지 못했던 곳에 충분한 데이터를 가지고 있습니다. 그래서 실제로 이제 "이봐, 알겠어, 이 어려운 경우들, 모델이 전에 약간 어려워했던 것들? 그들은 일반적으로 많은 사용 사례에 대해 잘합니다. 얼마나 많은 개선을 제공합니까?"라고 말할 수 있습니다.
따라서 모든 평가에서 모델이 두 배나 좋다고 말하기는 어렵습니다. 하지만 말씀드릴 수 있는 것은 그건 그렇고 놀라운 시간입니다. Claude든, ChatGPT든, 제미나이든 모두 더 나아지고 있고 모두를 더 낫게 만들고 있기 때문입니다.
경쟁 환경도 모두를 더 낫게 만들고 있다고 말하고 싶습니다. 이것은 릴리스 후 릴리스에서 볼 수 있는 환상적인 것입니다. 당신은 이제 더 많은 통찰력을 얻고 있다고 느끼고 있습니다. 더 많은 능력을 얻고 있습니다. 그리고 더 멀리, 더 깊이, 더 빠르게 갈 수 있습니다.
CR: 제가 묻지 않은 어떤 질문을 했어야 했습니까? 그리고 이 청중에게 어떤 조언을 하시겠습니까?
AV: 훌륭한 질문들을 하셨습니다. 제가 말씀드리고 싶은 것은... 아, 제미나이요?
CR: (웃음)
AV: 아니요, 아니요, 실제로 그렇게 말하지 않을 것입니다. 저에게는 물론 제미나이를 사랑합니다. 우리가 거기서 하고 있는 일을 사랑하지만, 이것은 매우 진지하게 말씀드립니다. 이것은 승자 독식 환경이 아닐 것입니다.
이것은... 여러분 모두가 들었을 것입니다, 인터넷 이후 가장 큰 혁명입니다. 저는 인터넷을 기억합니다. 당신도 인터넷을 아주 잘 기억하실 겁니다. 그것은 꽤 큰 일이었습니다.
다시 말해 제 생각에 우리는 이제 자녀가 있는 우리 중 일부는 인터넷이 폭발하기 전에 태어난 우리가 어떻게 살았는지 인식할 수 없을 지점에 있습니다. 세상은 근본적으로 다른 곳입니다.
이것은 그것이 될 것이지만 훨씬, 훨씬, 훨씬 더 클 것입니다. 그리고 기술에서 일하고, 기여하고, 영향을 미치기 위한 더 나은 시간은 없었습니다. 스택의 최상단에서 일하든 저처럼 인프라에서 일하든, 물론 시스코가 하고 있는 모든 놀라운 일처럼요.
인프라의 좋은 점은 인터넷이든 AI든 수요가 높다는 것입니다.
어쩌면 당신이 이것을 묻지 않았을 수도 있지만, 제가 말씀드리고 싶은 것은 기술적 관점에서 이 혁명을 어떻게 지원할지에 대한 책을 쓸 기회입니다. 그것은 독특합니다, 그렇죠?
우리는 말 그대로 이러한 서비스가 어떻게, 이러한 에이전트가 어떻게 전달될지 미래를 발명하게 될 것입니다.
CR: 저는 감사해야겠습니다. 두 조직으로서 우리가 함께 해온 모든 훌륭한 작업에 대해 감사하지 않는다면 실례가 될 것 같습니다. 그리고 저는 그 파트너십이 시간이 지남에 따라 번성하는 것을 절대적으로 봅니다. 그리고 그것은 당신의 지원 없이는 일어나지 않았을 것입니다.
그리고 당신의 전체 팀과 그들이 우리의 실리콘 팀 및 네트워킹 팀과 어떻게 협력하는지에 대해 감사드립니다. 정말 감사드립니다. 여기 와주셔서 감사합니다. 다시 돌아오실 수 있기를 바랍니다.
AV: 절대적으로요, 좋아요. 감사합니다.
CR: 대단히 감사합니다.
[테크수다 기자 도안구 eyeball@techsuda.com]
- 이 글은 구글 제미나이, 앤쓰로픽 클로드, 오픈AI ChatGPT, otter.ai 를 활용했습니다.
테크가 전 산업 영역에 스며드는 소식에 관심이 많다. 1999년 정보시대 PCWEEK 테크 전문지 기자로 입문한 후 월간 텔레닷컴, 인터넷 미디어 블로터닷넷 창간 멤버로 활동했다. 개발자 잡지 마이크로소프트웨어 편집장을 거쳐 테크수다를 창간해 지금까지 활동하고 있다. 태블릿을 가지고 얼굴이 꽉 찬 방송, 스마트폰을 활용한 현장 라이브를 한국 최초로 진행했다.