AWS 머신 러닝을 활용한 맞춤형 동영상으로 시간 절약하기
2021년 1월 28일
CLIPr는 사람들의 시간을 10억 시간 절약하는 것을 목표로 합니다. AWS 머신러닝(ML) 서비스를 활용해 동영상을 최상급 검색 가능한 데이터 소스로 구성함으로써 사용자의 관심사에 가장 부합하는 콘텐츠를 찾아냅니다. CLIPr는 동영상 내 정보 추출을 간소화하여, 가장 관련성 높은 정보를 찾기 위해 수동으로 동영상을 훑어볼 필요가 없어져 시간을 절약해 줍니다. CLIPr은 간단한 AI 기반 도구를 제공하여 여러 동영상에 걸쳐 콘텐츠를 찾고, 상호작용하며, 공유할 수 있게 합니다. 구조화되지 않은 정보를 실행 가능한 데이터와 통찰력으로 전환함으로써 여러분의 숨겨진 보물을 발견해 드립니다.
CLIPr가 AWS 머신러닝 서비스를 활용하는 방법
CLIPr에서는 AWS와 머신러닝 스택이 제공하는 최고의 기술을 활용하여 고객 만족을 실현하고 있습니다. CLIPr의 핵심은 최신 머신러닝, 서버리스, 인프라스트럭처 애즈 코드(IaC) 설계 원칙을 적용하는 데 있습니다. AWS를 통해 필요한 시점에 클라우드 리소스를 활용할 수 있으며, 단일 스크립트로 몇 분 만에 완전히 새로운 고객 환경을 배포할 수 있습니다. 두 번째 장점은 확장성입니다. 비디오 처리는 다수의 작업을 병렬로 실행함으로써 수직 및 수평 확장이 가능한 아키텍처를 요구합니다.
초기 단계 스타트업으로서 시장 출시 시기는 매우 중요합니다. 엔티티 추출, 주제 추출, 분류와 같은 핵심 CLIPr 기능을 위해 모델을 처음부터 구축하는 데는 개발 및 훈련에 오랜 시간이 소요되었을 것입니다. 애플리케이션과 워크플로우에 AWS AI 서비스를 활용함으로써 우리는 고급 기능을 신속하게 제공할 수 있었습니다. 초기 MVP를 위해 Amazon Transcribe로 오디오를 검색 가능한 트랜스크립트로 변환하고, Amazon Comprehend로 텍스트 분류 및 주제별 정리를 수행했으며, 의료 고객을 위한 의료 온톨로지 추출에는 Amazon Comprehend Medical을, 인물 이름·얼굴·회의 유형 인식에는 Amazon Rekognition을 활용했습니다. 이를 통해 상당히 빠르게 반복 작업을 수행하며 빠른 성과를 창출했고, 이는 투자자들과의 프리시드 라운드 투자 유치에 결정적인 역할을 했습니다.
그 이후로 우리는 훈련 과정에서 수집한 데이터를 활용해 자체적인 머신러닝 모델을 구축하기 위해 워크플로우와 데이터 파이프라인을 업그레이드하기 시작했습니다. Amazon SageMaker는 우리 솔루션의 핵심 요소로 자리 잡았습니다. 이는 서버리스 모델로 무제한 확장이 가능한 머신러닝 서비스를 제공할 수 있게 해주는 기반 구조입니다. 사용 편의성과 원하는 머신러닝 및 딥러닝 프레임워크를 자유롭게 선택할 수 있는 유연성이 결정적인 요인이었습니다. 현재 텐서플로우(TensorFlow), 아파치 MXNet, 그리고 세이지메이커 노트북(SageMaker notebooks)을 활용하고 있습니다.
오픈소스 프레임워크를 활용함으로써 해당 플랫폼에 익숙한 데이터 과학자들을 팀에 유치하고 온보딩할 수 있었으며, 비용 효율적인 방식으로 신속하게 확장할 수 있었습니다. 불과 몇 달 만에 사내 머신러닝 알고리즘과 워크플로를 SageMaker와 통합하여 고객 참여도를 향상시켰습니다.
AWS 서비스 아키텍처, CLIPr 고급 기능 등을 확인하려면, AWS에서 이 글을 계속 읽어보세요.