[AWS 리인벤트 2023] 이화영 LG AI연구원 상무, "이미지를 텍스트로 바꾸는 캡셔닝 솔루션"∙∙∙"엑사원 2.0 얹는 아마존 베드록 협력도 기대"


[테크수다 기자 도안구 eyeball@techsuda.com] "LG 그룹사가 다양한 산업군에 있는 만큼 다양한 요구 사항이 있습니다. 또 업무별로 요구도 다양합니다. 우선은 디지털 마케팅 분야에서 이미지 활용 이슈 해결을 위해 서비스를 내놨습니다. 코드 생성기 또한 제공합니다. 범용적인 코드 지원은 물론 각 산업별 특화 코드들이 있습니다. 이 또한 외부 유출없이 학습을 통해 코드 생성을 지원합니다. 현재 C, C++, 자바스크립트, 파이썬 4개 언어를 지원하고 있고 향후 자바까지 지원할 예정입니다."


이화영 LG AI연구원 상무를 원격으로 만났다. 기자단이 서울에 있고 이화영 상무가 미국 라스베이거스에 있는 게 아니었다. 정반대였다.


아마존웹서비스(Amazon Web Services, 이하 AWS)는 오늘 AWS 리인벤트(re:Invent)에서 LG그룹의 인공지능(AI) 연구 허브인 LG AI연구원이 AWS상에서 AI 이미지-투-텍스트(image-to-text) 캡셔닝 솔루션을 출시했다고 발표했다.


신규 캡션 솔루션은 3,000억 개의 파라미터를 보유한 LG AI연구원의 멀티모달 파운데이션 모델(FM)인 엑사원(EXAONE)을 활용한다. 엑사원은 광고, 패션, 리테일 등 다양한 산업 분야의 전 세계 고객을 위해 보다 정확하고 관련성 높은 캡셔닝 솔루션을 제공한다.



왜 캡셔닝 솔루션을 만들었을까. 이화영 상무는 전세계 있는 LG전자 마케터들의 요구 때문이라고 했다. 각 조직마다 캠페인과 마케팅 활동을 위해 이미지들을 많이 구입한다. 한국에서 구입한 이미지가 있지만 미국 조직이나 남미 조직에서 검색해서 찾기가 쉽지 않았다. 이미지를 입력하면 캡션이 생성되고 키워드도 생성된다.


또 하나는 시각 장애인들을 지원하기 위해서다 엘지 그룹사의 많은 제품에 대해 보이지 않아도 이미지를 캡셔닝하면 캡션이 생성되고 이걸 음성으로 지원해 이해를 돕는다.


이 제품은 5일간 무료로 유료로 판매도 한다.


이화영 상무는 "AI는 많은 산업에 혁신을 일으키고 있다. 우리는 사람들이 보다 창의적으로 일할 수 있도록 비용 효율적인 방식으로 지원할 수 있는 이 기술의 잠재력에 대해 갖는 기대가 크다"며 "LG AI연구원의 엑사원은 크리에이티브 분야에서 생성형 AI를 더 쉽게 활용할 수 있게 해주는 강력한 도구이며, AWS의 업계 선도적인 ML 역량은 우리가 혁신적인 솔루션을 빠르게 개발하고 배포하는 데 큰 도움이 되었다. 우리의 비전은 크리에이티브 영역이 새로운 차원의 효율성을 확보하고 기업이 이미지 검색 등의 반복적인 업무 대신 창작에 집중할 수 있도록 돕는 것”이라고 말했다.


그는 "AWS는 생태계 친화적인 거 같습니다. 본인들의 멀티모달이나 언어모델을 독점적으로 하지않고 저희처럼 새로운 모델을 만들어 활용하려는 기업들과도 협력합니다"라고 덧붙였다


엑사원의 새로운 제로샷 이미지 캡션 솔루션은 생성형 AI를 사용해 인간의 인지 능력과 유사하게, 이전의 경험과 지식, 훈련을 바탕으로, 본 적 없는 객체나 장면을 자동으로 이해하고 설명한다. 이는 엑사원이 한국어와 영어로 된 이미지와 텍스트를 이해하고 인간에 가까운 추론 능력을 활용해 정확하고 상세한 이미지 캡션과 키워드를 작성할 수 있게 한다.


광고와 같은 산업군에서는 LG AI연구원의 기술을 활용해 제품 설명을 자동화하거나 광고·마케팅 캠페인을 위한 새로운 콘텐츠를 만들 수 있다. LG AI연구원은 엑사원의 학습 중 파라미터 수가 늘어나는 등 필요에 따라 비용 효율적으로 IT 리소스를 확장할 수 있도록, 안전하고 조정 가능한 컴퓨팅 용량을 클라우드에서 제공하는 아마존 엘라스틱 컴퓨트 클라우드(Amazon EC2)를 사용한다.


소비재 기업, 마케팅 에이전시 등 LG AI연구원의 고객들은 AWS의 확장성을 활용해 시간당 2,000개 이상의 이미지 캡션을 생성할 수 있다. LG AI연구원은 머신러닝(ML) 모델을 구축·훈련·배포하는 완전 관리형 서비스 아마존 세이지메이커(Amazon SageMaker)를 사용해 3억 5,000만 개의 고해상도 이미지와 텍스트 세트를 엑사원에게 학습시켰다. LG AI연구원은 클라우드를 사용해 온프레미스 인프라보다 더 빠르고 저렴한 비용으로 결과를 미세 조정하고, 체크포인트를 구현하며, 데이터 편향과 같은 문제를 신속하게 해결할 수 있었다.


LG AI연구원은 엑사원을 통해 다양한 크리에이티브 산업 분야에서의 생성형 AI 도입을 가속화하기 위해 전 세계 여러 기관과 협력하고 있으며, 그 일환으로 미국 유명 대학인 파슨스디자인스쿨(Parsons School of Design)과 협업해 패션, 디자인, 미디어 분야 전문가들과 함께 생성형 AI 관련 기술과 서비스를 개발하고 있다. 또한, LG AI연구원은 엑사원을 활용해 텍스트 프롬프트에 따라 완전히 새로운 이미지를 만들어 내는 AI 버추얼 아티스트 틸다(Tilda)를 개발했다. 틸다는 3,000개의 이미지와 패턴을 생성해2022년 뉴욕 패션위크에서 박윤희 디자이너가 선보인 200여 벌의 의상을 디자인하는 데 도움을 준 바 있다.


LG AI연구원은 LG그룹 계열사에도 생성형 AI 솔루션을 제공하고 있다. LG생활건강은 지난 8월 LG AI연구원의 생성형 AI 기술이 AWS 상에서 만들어 낸 수천 가지의 독특한 디자인을 피부나 의류에 인쇄할 수 있는 미니 즉석 타투 프린터 '임프린투(IMPRINTU)'를 출시했다. 또한 LG AI연구원은 엑사원 모델을 LG 계열사에 제공해 가전 및 홈 엔터테인먼트 제품을 개발하는 엔지니어들의 생산성과 창의성을 높이고 소프트웨어 코드를 생성할 수 있도록 지원할 예정이다.


바시 필로민(Vasi Philomin) AWS 생성형 AI 부문 부사장은 "생성형 AI는 당대 가장 혁신적인 기술 중 하나로, 생산성과 창의성에 큰 영향을 미치고 있다"며 "콘텐츠 생성 산업이 급성장하는 가운데 LG AI연구원은 엑사원 플랫폼과 같은 기술이 AWS에 구축된 신속한 이미지-투-텍스트 캡션  솔루션을 활용해 어떻게 AI, 디자이너, 아티스트 간의 협업을 촉진할 수 있는지 보여주고 있다. 전 세계에 새로운 차원의 창의성이 발휘될 수 있도록, 앞으로도 LG AI연구원의 생성형 AI 혁신과 확장을 지원할 수 있기를 기대한다"고 말했다.



LG AI연구원의 엑사원 이미지투텍스트 변환 솔루션은 AWS 마켓플레이스(AWS Marketplace)와 아마존 세이지메이커 점프스타트(Amazon SageMaker Jumpstart)를 통해 수백만 명의 전 세계 AWS 활성 고객이 사용할 수 있게 되었다. AWS 마켓플레이스는 독립 소프트웨어 공급업체(ISV)들이 제공하는 수천 개의 소프트웨어가 등록된 디지털 카탈로그이며, 아마존 세이지메이커 점프스타트는 개별 사용 사례에 맞게 사전 학습 모델에 대한 액세스를 제공하는 ML 허브다.


또한, LG AI연구원은 엑사원을 아마존 베드록(Amazon Bedrock)으로 마이그레이션할 계획을 갖고 있다. 아마존 베드록은 API를 통해 여러 FM을 사용할 수 있는 완전 관리형 서비스로, 이를 통해 고객이 특정한 사용 사례에 가장 적합한 모델을 테스트·커스터마이즈·배포할 수 있도록 더 많은 선택권을 제공한다.


이화영 상무는 "저희가 만든 모델을 아마존 베드록에 얹어서 쓸 수 있는 논의를 시작했습니다. 엑사원 2.0입니다"라고 기대감을 드러냈다.


한편, 지난 10월 AWS는 오는 2027년까지 국내 클라우드 인프라에 7조 8,500억 원(미화 58.8억 달러)을 투자할 계획이라고 발표했다. 이는 클라우드 서비스에 대한 한국 고객의 수요 증가에 대응하기 위한 것으로, 2027년까지 한국의 총 국내총생산(GDP)에 약 15조 600억 원(미화 약 112.8억 달러)을 기여하고 연평균 1만 2,300개의 국내 기업 전일제 환산(FTE) 일자리 창출을 지원할 전망이다.


[테크수다 기자 도안구 eyeball@techsuda.com]

Newsletter
디지털 시대, 새로운 정보를 받아보세요!