[AWS reInvent 2025] 초보자를 위한 AWS 이해하기
[테크수다 eyeball@techsuda.com] 클라우드 시장을 이끌고 있는 AWS의 가장 큰 행사가 현지 시간으로 12월 1일~5일간 미국 라스베가스에서 열린다.
https://reinvent.awsevents.com/
아마존은 책을 인터넷으로 판매하면서 전자상거래 시장에 뛰어들었다. 지금은 글로벌 1위 전자상거래 기업으로 금지된 것 제외하고 모든 걸 팔고 있다. 심지어 전자상거래 이외에 로봇, 기기, 온라인 스트리밍, 위주 발사체, 결제 등 다양한 사업 영역에서 활동한다. 클라우드 서비스를 제공하는 아마존웹서비스(AWS)도 그 중의 하나다. 전자상거래로 시작한 아마존이 전혀 다른 사업분야에 뛰어들어 전세계 IT 패러다임을 완전히 바꿨다.
클라우드 서비스 사업자들은 생성형 AI 시대 가장 주목받고 있는 LLM 기업들에게 인프라를 제공해주며 동반 성장하고 있다.
이 글은 이 시장을 개척한 AWS에 대해 그리고 클라우드, AI에 대해 좀더 쉽게 이해하기 위해 작성했다.
1. AWS는 무엇일까?
AWS(Amazon Web Services)는 인터넷을 통해 필요한 IT 자원을 바로 빌려 쓰는 서비스다. 여기서 'IT 자원'은 우리가 컴퓨터로 무언가를 할 때 필요한 거의 모든 것—서버, 스토리지, 데이터베이스, AI 모델, 네트워크, 보안—을 의미한다.
쉽게 말하면 전기처럼 쓰는 컴퓨터 자원이다. 집에서 전기를 쓰면 쓴 만큼 요금이 나오듯, AWS에서도 서버나 스토리지를 사용한 만큼만 비용을 낸다.
기존에는 기업이 서버를 사서 설치하고, 냉각 장치와 전기 설비를 갖추고, 전문 인력까지 고용해야 했지만
AWS에서는 클릭 몇 번이면 전 세계에 컴퓨터 수십~수백 대를 띄울 수 있다.
AWS를 차별화시키고 그 정신을 하나의 단어로 꼽으라면 'API(애플리케이션 프로그래밍 인터페이스)'다. 아래 그림에서 보듯 아마존은 김치찌개를 제공하는 게 아니라 김치찌개를 만들기 위한 다양한 재료들을 제공한다고 보면 된다. 모든 걸 이런 형태로 제공하다보니 최적화해서 서비스를 제공하기도 편해졌다. 외부에서 호출해서 가져갈 수 있는 표준환된 통로와 인터페이스를 만들어 뒀다고 보면 된다. 완제품 대신 재료를 손쉽게 가져갈 수 있게 만들어 뒀고 20년이 넘게 이런 정신은 변함이 없다.
2. 왜 AWS가 필요한가?
① 빠르게 시작할 수 있다 (민첩성)
기존에는 서버 한 대 도입하는 데 몇 주에서 몇 달이 걸렸다. AWS는 몇 분이면 끝이다. IT 프로젝트를 하려면 하드웨어 제품과 소프트웨어 제품이 필요하다. 내부에서 기획을 하고 실제 프로젝트가 진행되면 관련 장비를 구매해야 한다. 예전에는 서버, 스토리지, 애플리케이션, 보안 벤더들을 영역별로 불러서 테스트를 하고 그 중에 하나의 기업들을 선정한 후 이 기업들 제품을 사서 구축해 놔야 했다. 시간과 비용도 많이 들었다. 테스트를 하지만 방식이 완전히 바뀌었고 관련 인프라와 다양한 기능들은 AWS가 제공하니 대시보드 혹은 포털 화면에서 원하는 걸 클릭해서 환경을 구성하면 된다.
② 필요할 때만 자원을 늘리거나 줄일 수 있다 (탄력성)
예를 들어, 온라인 쇼핑몰이 크리스마스 시즌에만 트래픽이 폭증한다고 하자.
예전 방식: 서버를 미리 100대 구매해야 함
AWS 방식:
평소엔 5대
성수기엔 100대로 ‘자동 확장’
시즌이 끝나면 다시 5대로 줄임
워너 보겔스 아마존 CTO는 사용자가 갑자기 늘어났을 때 확장은 가능했는데 그 트래픽이 사라졌을 때 원래 상태로 돌아가는 '일레스틱' 상황을 구현하는 게 어려웠다고 밝힌 바 있다. 쉽게 말하면 고무줄을 떠올르면 된다. 유연성이 있는 고무줄을 길게 잡아 늘였다가 다시 한 끝을 손에서 놓으면 원래 상태로 돌아간다. 이게 바로 클라우드 분야에서 자주 나오는 일레스틱의 용어다.
아마존은 1995년 아마존닷컴을 서비스하기 시작한 후 이런 문제 해결에 총력을 기울였다. 그렇게 해서 2006년 스토리지 서비스를 시작으로 사용한 만큼 비용을 지불하는 클라우드 사업에 뛰어들었다.
20년이 지난 2025년 11월 말 기준으로 아마존웹서비스가 제공하는 서비스는 240개를 훌쩍 뛰어넘는다.
③ 초기 비용이 필요 없다 (비용 절감)
서버를 구매하지 않기 때문에 투자비용(설비비)이 0원이다. 필요할 때 잠깐 쓰고, 끝나면 바로 지우면 된다. 물론 사용한 만큼 내기 때문에 잘못 설정해 놓고 모니터링을 안하면 비용이 많이 드는 경우도 왕왕 있다. 그래서 핀옵스라고 기업 내부에서 클라우드나 SaaS를 쓸 때 용량과 비용을 모니터링하고 통제하는 영역도 함께 발전하고 있다. AWS는 다양한 영역에서 '크레딧'이라는 걸 지원한다. 무료 사용권 정도로 이해하면 좋다. 이걸 받을 수 있는 것들이 어디에 있는지 찾아보고 요구해도 좋다.
스타트업들은 다양한 지원 프로그램으로 사용료 할인 혹은 단기간 무료 이벤트가 있다.
④ 전 세계 어디든 바로 서비스 가능 (글로벌 확장)
AWS는 전 세계에 네트워크와 데이터센터를 갖고 있다.
38개 리전(Region)
120개 가용영역(AZ)
410개 이상 엣지 로케이션(POP)
이 인프라 덕분에 한국에서 만든 서비스를 미국·유럽·일본에 몇 분 만에 배포할 수 있다.
가령 한국 기업 한 곳이 중동에서 대형 플랜트 구축 프로젝트를 한다고 해보자. 이전에는 해당 기업 전산팀에서 글로벌 통신사와 만나서 해당 지역에 네트워크 인프라가 구축되어서 서비스를 받을 수 있는지 체크를 한다. 그리고 해당 나라 호스팅 업체를 찾아서 인프라를 계약하거나 혹은 직접 구매해 해당 지역에서 구축과 설치, 운영을 해야 한다. 이를 위해 실무팀은 시장조사부터 가격비교까지 진행하고 예산을 짜고 프로젝트 기간을 산정해야 한다.
하지만 최근엔 프로젝트 팀이 해당 나라에 날라가는 와중에 전산팀들은 AWS 팀과 협업해 해당 나라에 도착하면 바로 사용할 수 있도록 인프라를 한국에서 셋팅해 놓으면 된다. 기업 보안 이슈들도 WAN 형태로 지원하고 가는 장비들에 대한 노트북 하드웨어 정보와 맥 어드레스 부터 체크해 인증한 기기만 해당 네트워크 망에 붙어 사내 업무를 볼 수 있도록 할 수 있다. 시간과 비용을 훨씬 줄일 수 있다.
AWS가 전세계 곳곳에 인프라를 만들어 두고 해당 인프라들끼리 연결해 놨기 때문이다.
3. AWS의 중요한 개념 3가지
AWS를 이해하려면 꼭 알아야 하는 용어가 있다.
① 리전(Region) = “국가 단위의 AWS 지역”
AWS가 데이터센터를 가지고 있는 지역.
한국도 ‘서울 리전’ 이라는 이름으로 AWS 인프라가 있다.
② 가용영역(AZ) = “한 지역 안의 데이터센터 여러 개”
하나의 리전에는 2~4개의 AZ가 존재한다.
서울은 4개의 AZ를 가진 아시아에서 드문 강력한 리전이다.
리전(나라)
└── AZ1(데이터센터)
└── AZ2
└── AZ3
└── AZ4
이 구조 덕분에 한 AZ에 문제가 생겨도 다른 AZ에서 서비스가 살아 있기 때문에 안정성이 매우 높다.
③ EC2 = “클라우드에서 빌려 쓰는 컴퓨터(서버)”
AWS의 대표 서비스.
윈도우·리눅스 서버부터 GPU 서버까지 원하는 크기로 바로 띄울 수 있다.
4. AWS는 일상 속에서 이미 쓰이고 있다
AWS라고 하면 기업만 사용하는 것처럼 느껴지지만 사실 우리 일상 대부분이 AWS 위에서 돌아간다.
넷플릭스 영화 스트리밍
스마트TV·공기청정기의 클라우드 제어
스포츠 경기 하이라이트 자동 생성
클라우드 기반 자동차 시뮬레이션
모바일 앱 백엔드
전 세계 수많은 웹사이트
AWS는 눈에 보이지 않을 뿐, 우리가 사용하는 대부분의 디지털 서비스의 보이지 않는 엔진이다.
5. AWS의 인공지능(AI) 서비스는 어떻게 구성될까?
AWS의 AI는 크게 3단 구조다.
● ① AI 인프라 (가장 밑바닥)
AI를 학습시키고 운영하기 위한 ‘컴퓨팅 파워’.
Trainium → AI 학습(Training) 전용 칩
Inferentia → AI 추론(Inference) 전용 칩
GPU EC2 인스턴스(P5, G6 등)
S3 → 학습 데이터 저장소 (스토리지)
특히 Trainium2로 만든 Project Rainier는 전 세계 최대 규모의 AI 클러스터다. Anthropic 등 AI 회사들이 실제 모델을 학습한다.
② AI 개발 도구
AI 개발을 위한 툴셋.
SageMaker → ML 모델 구축·학습·배포 전용 플랫폼
Bedrock → Claude·Llama·GPT 등 다양한 모델을 API로 바로 사용
Strands Agents → Agentic AI 만들기 위한 오픈 소스 SDK
AgentCore → 에이전트를 대규모로 안전하게 운영하는 서비스
③ AI 애플리케이션
AWS가 직접 만든 ‘완제품 AI 서비스’.
Kiro(키로) → 개발자·현업 모두 사용하는 AI 개발 도구
QuickSuite → 기업 데이터를 분석해 자동 리포트·인사이트 생성
즉, 인프라 → 개발 도구 → 완성형 앱 이 3단 구성이 AWS AI의 핵심 구조다.
6. AWS가 기술 경쟁에서 중요한 이유
전 세계에서 생성형 AI 경쟁이 치열해지는 가운데 AWS의 강점은 다음 네 가지로 요약된다.
① 가장 큰 글로벌 인프라
AI·클라우드 모두 인프라 규모가 가장 크다.
② 자체 칩(Trainium/Inferentia)을 보유한 ‘몇 안 되는 기업’
AI 학습·추론 비용을 크게 낮출 수 있다.
③ 다양한 AI 모델을 선택할 수 있는 ‘AI 백화점’
Bedrock 하나로 Claude·Llama·GPT·Mistral 등 다양한 모델에 접근 가능.
④ 기업용, 대규모 운영 경험이 가장 풍부
넷플릭스, 삼성, BMW 등 전 세계 산업 리더들이 AWS에서 운영한다.
7. AWS가 만드는 반도체
클라우드 기업들은 원래 인텔이나 AMD 같은 CPU 기업들과 협력해 자사가 필요한 서버 인프라를 도입해 왔다. 대만 회사 중 슈퍼마이크로 같은 기업들이 대표적이다. GPU는 엔비디아에게서 사고 메모리는 삼성전자나 SK하이닉스, 마이크론 같은 회사에 발주하는 형식이었다.
하지만 서비스를 제공하면서 AWS는 ARM 기반의 CPU를 독자 설계해 이를 탑재한 서버 인프라를 만들어 내기 시작했다. 이를 위해 AWS는 이스라엘 반도체 설계 회사인 안나프르나랩스(Annapurna Labs)를 2015년 약 3.5억 달러~4억 달러에 인수했다. 이들은 서버칩, 학습칩, 추론칩, 니트로라는 DPU 칩 등 다양한 반도체 칩을 설계해 계속해서 적용하고 있다.
앤쓰로픽이 최근 오퍼스 4.5를 출시했는데 AWS의 인퍼런스아 인프라를 통해 학습이 진행된 게 아니냐는 말도 나오고 있다. 구글이 TPU 7세대를 선보이면서 제미나이 학습과 추론에 활용했고 또 이 인프라를 메타나 xAI 등 외부 고객들에게도 제공하겠다는 뉴스가 흘러나오고 있는 상황이다.
AWS와 구글클라우드는 엔비디아와 협력도 하지만 자체 개발한 칩을 통한 인프라 확장에도 상당한 공을 들이고 있다.
최근 AWS에 댛해 AI 시대에 경쟁사들에 비해 조금 주춤하는 거 아니냐는 이야기를 듣고 있지만 막대한 인프라 투자를 끊임없이 해왔고 사용자들이 쉽게 활용할 수 있는 환경을 지속적으로 제공, 발전시키며 세상을 변화시키고 있다. AWS를 좀더 쉽게 설명한다면 아래 문장이 아닐까 싶다.
“AWS는 전 세계 기업과 일상을 움직이는 보이지 않는 컴퓨터이자, AI 시대의 가장 큰 기술 인프라”이다.
AWS reinvent 2025에서 어떤 걸 선보일지 기대해봐도 좋을 거 같다.
편집자 주 : 해당 기사는 네이버 클로바노트, 구글 제미나이 3.0 프로, 앤쓰로픽 클로드 Opus 4.5, 오픈AI 클로드 5.1을 활용했다.
[테크수다 기자 도안구 eyeball@techsuda.com]