7월 7, 목요일

인텔, 2세대 AI 칩 ‘가우드2·그레코’ 출시···엔비디아 쿠다 생태계 도전장

[테크수다 기자 도안구 eyeball@techsuda.com] 인텔이 엔비디아가 독주하고 있는 인공지능 반도체 칩 시장에 2세대 학습과 추론 칩을 출시하면서 추격에 나섰다.

인텔은 인텔 비전(Intel Vision) 행사에서 2019년 2조 5530억원에 인수한 이스라엘 스타트업 하바나 랩스(Habana Labs)가 개발한 2세대 학습 프로세서 가우디2(Gaudi2)와 추론 칩인 그레코(Greco)를 선보였다.

가우디2 프로세서와 그레코 프로세서는 인공지능 딥러닝 애플리케이션을 위해 특별히 개발됐으며, 7나노 공정 기반으로 제작됐다. 아울러, 하바나 랩스의 고효율 아키텍처를 기반으로 구축, 고객에게 데이터 센터 컴퓨터 비전과 자연어 애플리케이션을 위한 고성능 모델 학습 및 추론 기능을 제공한다.

로이터통신에 따르면 인텔 데이터센터와 AI 그룹 총괄 책임자인 샌드라 리베라(Sandra Rivera) 수석 부사장은 AI 칩 시장이 향후 5년 동안 매년 25%씩 성장해 500억 달러(한호 약 63조 9000억원) 수준으로 성장할 것으로 전망했다.

그는 “하바나의 새로운 딥 러닝 프로세서 출시는 인텔이 AI 전략을 실행해 고객에게 클라우드에서 에지에 이르기까지 다양한 솔루션 선택권을 제공, AI 워크로드의 증가하는 수와 복잡한 특성을 해결한 대표적인 예입니다. 가우드2는 인텔 고객이 점점 더 크고 복잡해지는 딥 러닝 워크로드를 빠르고 효율적으로 훈련하는 데 도움이 될 수 있으며 또 그레코co가 가져올 추론 효율성을 기대하고 있습니다”라고 밝혔다.

인텔은 가루디2가 하바나의 기존 AI 칩보다 연산 속도가 2배 빠르며 엔비디아 A100 80GB 프로세서 대비 2배 높은 성능을 기록했다고 전했다.

엔비디아가 AI 반도체 시장에서 독주하고 있는 건 엔비디아 GPU를 병렬 처리할 수 있도록 돕는 소프트웨어인 ‘쿠다(CUDA)’ 생태계가 막강하기 때문이다. 수많은 AI 관련 소프트웨어들이 모두 쿠다와 연동되어 동작한다. 인텔이 새로운 AI 반도체를 내놓는다고 해도 엔비디아 AI 생태계가 하루 아침에 무너지지 않는 이유면서 인텔의 공략 또한 쉽지 않은 또 다른 이유다.

이에 대해 에이탄 메디나 하바나랩스 최고기술책임자(CTO)는 “쿠다는 엔비디아를 오래 지켜줄 요새는 아니다”라면서 “인텔 소프트웨어 플랫폼은 오픈소스 커뮤니티 깃허브(GitHub)에서 자유롭게 공유 가능한 개방형 표준”이라고 말했다. 

AI 칩 개발과 함께 관련 소프트웨어 개발에 더욱 더 집중하겠다는 입장이다.

하바나 가우디2 프로세서는 기존 고효율 1세대 가우디와 동일한 아키텍처를 기반으로 설계되어 인공지능 학습 성능을 크게 향상시켰다. 고객은 현존하는 클라우드 내 GPU 기반 솔루션 및 아마존 EC2 DL1 인스턴스는 물론 슈퍼마이크로 가우디 훈련 온프레미스 서버 대비 40% 높은 가격 대비 성능을 경험할 수 있다.

1세대 가우디 대비 가우디2 프로세서의 주요 개선 사항은 다음과 같다:

  • 16나노미터에서 7나노미터로 향상된 공정 사용
  • 매트릭스 곱셈 엔진(MME) 및 텐서 프로세서 코어 컴퓨팅 엔진에 FP8을 포함한 새로운 데이터 유형 도입
  • 텐서 프로세서 코어 8개에서 24개로 증가
  • 호스트 하위 시스템을 오프로드하기 위한 온칩 미디어 처리 엔진 통합
  •  32GB에서 96GB HBM2E로 3배 증가한 2.45TB/초 대역폭에서의 인패키지 메모리 용량
  • 48MB로 2배 증가한 이중 온보드 SRAM
  • 통합된 RoCE2(RDMA over Converged Ethernet)가 10개의 NIC에서 24개로 증가해 산업 표준 네트워킹에서 고효율 스케일업 및 스케일아웃 지원

한편, 하바나 시냅스AI(SynapseAI) 소프트웨어 스위트는 딥러닝 작업 부하에 최적화되었으며, 더 쉽게 모델을 구축하고 마이그레이션할 수 있도록 설계됐다. 이를 통해 고객이 기존 GPU 기반 모델에서 가우디2로 워크로드와 시스템을 전환할 수 있도록 지원하며, 소프트웨어 개발을 위해 진행한 투자 역량을 보존할 수 있도록 돕는다.

개발자들이 있는 곳으로 찾아가는 시냅스AI는 텐서플로우(TensorFlow)와 파이토치(PyTorch) 프레임워크를 통합하고 30개 이상의 유명 컴퓨터 비전 및 자연어 참조 모델을 제공한다. 개발자는 하바나 개발자 웹사이트에서 문서와 도구, 사용법 컨텐츠 및 커뮤니티 지원을 받을 수 있으며, 하바나 깃허브(Habana GitHub)에서 참조 모델과 모델 로드맵을 활용할 수 있다.

[테크수다 Techsuda]

About 도안구 기자

도안구 기자
긴 여정을 떠나며. 동료들은 다 어디 있는 거야.

추천 기사

한국레노버, 리전 7세대 출시···인텔 12세대 프로세서·엔비디아 RTX 탑재

[테크수다 기자 도안구 eyeball@techsuda.com] “레노버 리전은 압도적 성능으로 게이밍 시장에서 입지를 다져왔을 뿐만 아니라, 세련된 …

답글 남기기

이메일 주소는 공개되지 않습니다.