11월 19, 일요일
Home / TECH / Computing / Cloud / 엔비디아, 쿠다(CUDA) 6 발표
Techsuda Webinar

엔비디아, 쿠다(CUDA) 6 발표

엔비디아 쿠다

엔비디아(www.nvidia.co.kr, CEO 젠슨황)는 병렬컴퓨팅 플랫폼과 프로그래밍 모델의 가장 최신 버전인 엔비디아 쿠다(CUDA) 6을 발표했다.

쿠다 6 플랫폼은 그 어느 때보다도 병렬 프로그래밍을 단순화하여, 소프트웨어 개발자들이 과학, 엔지니어링, 기업

및 기타 어플리케이션을 GPU로 가속하는데 소요되는 시간과 노력을 크게 단축시킬 것으로 기대된다.

개발자는 쿠다 6 플랫폼을 활용해 CPU 기반 라이브러리만 교체함으로써 최고 8배 빠르게 즉각 가속되는 애플리케이션 속도와 더불어 개선된 성능을 누릴 수 있다. 쿠다 6의 주요 기능은 다음과 같다:

통합 메모리(Unified Memory) – 데이터를 수동으로 복사해서 옮길 필요 없이 어플리케이션이 바로 CPU와 GPU 메모리를 액세스할 수 있게 하여 프로그래밍을 단순화하며, 다양한 프로그래밍 언어에서의 GPU 가속 지원을 쉽게 추가할 수 있도록 한다.
드롭-인 라이브러리(Drop-in Libraries) – 기존 CPU 라이브러리를 GPU 가속 라이브러리로 교체하기만 해도 어플리케이션의 BLAS와 FFTW 계산 속도를 최고 8배까지 자동으로 높여 준다.
멀티 GPU 확장(Multi-GPU Scaling) – 새롭게 디자인된 BLAS와 FFT GPU 라이브러리는 단일 노드에서 최대 8개의 GPU에 걸친 성능을 자동으로 확장해, 노드 당 9 테라플롭 이상의 배정밀도(Double precision) 성능을 제공하고 그 어느 때보다 많은 작업량(최고 512GB)을 처리한다. 또한, 멀티 GPU 확장은 새로운 BLAS 드롭-인 라이브러리와도 함께 사용할 수 있다.

샌디아 국립 연구소(Sandia National Laboratories, SNL)의 확장가능 알고리즘 부서(Scalable Algorithms Department) 소속 롭 호엑스트라(Rob Hoekstra) 매니저는 “통합메모리는 데이터관리를 자동으로 처리함으로써 GPU에서 구동하는 커넬의 프로토타입을 신속히 만들고 복잡한 코드를 줄여, 개발시간을 최고 50%까지 줄일 수 있게 한다”며 “이러한 능력을 가지고 있는 것은 미래 프로그래밍 모델을 선정하고 보다 정교하고 큰 규모의 코드를 GPU에 복사하는데 매우 유용할 것”이라고 전했다.

패브릭 엔진(Fabric Engine, Inc.)의 폴 도일(Paul Doyle) CEO는 “패브릭 엔진의 기술은 주요 스튜디오, 게임 개발자, 애니메이션 제작자들이 시각적으로 굉장히 아름다운 3D 애니메이션 및 효과를 만들도록 도왔다”며 “그들은 계속 엔비디아 GPU에서의 가속 지원을 추가하라고 우리를 설득했었지만 복잡한 제작 사례 같은 경우 메모리 관리가 너무 어려운 과제라는 것을 발견했다. 이제 통합 메모리로 메모리 관리가 자동으로 이루어지는 만큼 패브릭 컴파일러가 엔비디아 GPU를 타겟할 수 있게 되어, 고객들이 어플리케이션을 최고 10배 빠르게 구동할 수 있게 되었다”고 말했다.

새로운 추가 기능 외에도 쿠다 6 플랫폼은 풀 세트의 프로그래밍 툴, GPU 가속 수학 라이브러리, 관련 문서 및 프로그래밍 가이드를 제공한다.

버전 6 쿠다 툴킷은 2014년 초에 제공될 예정이며, 다운로드 가능 시점에 쿠다 GPU 컴퓨팅 등록 개발자 프로그램(CUDA-GPU Computing Registered Developer Program)의 멤버들에게 통지될 예정이다.

프로그램 가입: developer.nvidia.com/programs/cuda/register#source=pr

쿠다 6 플랫폼에 대한 보다 자세한 내용은 11월 18일부터 21일까지 덴버에서 개최되는 SC13의 엔비디아 부스 613(www.nvidia.com/object/sc13.html) 또는 엔비디아 쿠다 웹사이트 www.nvidia.co.kr/cuda에서 확인할 수 있다.

avatar
wpDiscuz