AWS機械学習を活用したパーソナライズド動画で時間を節約
2021年1月28日
CLIPrは、人々の時間を10億時間節約することを目指しています。AWSの機械学習(ML)サービスを活用し、動画を検索可能な高品質なデータソースとして整理することで、ユーザーの関心に関連するコンテンツを解き放ちます。CLIPrは動画内の情報抽出を簡素化し、関連性の高い情報を探すために手動で動画を閲覧する必要性を排除することで、時間を大幅に節約します。 CLIPrは、動画横断でのコンテンツ発見・操作・共有を可能にするシンプルなAIツールを提供し、非構造化情報を実用的なデータと知見に変換することで、埋もれた宝物を掘り起こします。
CLIPrがAWS機械学習サービスを活用する方法
CLIPrでは、AWSと機械学習スタックが提供する最先端技術を駆使し、お客様に感動をお届けしています。中核となるCLIPrの設計思想は、最新の機械学習技術、サーバーレスアーキテクチャ、インフラストラクチャ・アズ・コード(IaC)に基づいています。AWSにより、必要な時にのみクラウドリソースを利用でき、たった1つのスクリプトで数分以内に完全に新しい顧客環境をデプロイ可能です。第二の利点はスケーラビリティです。 動画処理には、多数のジョブを並列実行することで垂直・水平両方向にスケール可能なアーキテクチャが求められます。
スタートアップ企業にとって、市場投入までの時間は極めて重要です。エンティティ抽出、トピック抽出、分類といったCLIPrの主要機能向けにモデルをゼロから構築する場合、開発とトレーニングに多大な時間を要したでしょう。AWSのAIサービスをアプリケーションとワークフローに活用することで、高度な機能を迅速に提供できました。 Amazon Transcribeで音声から検索可能な文字起こしを生成し、Amazon Comprehendでテキスト分類と関連トピックによる整理を実現。医療顧客向けにはAmazon Comprehend Medicalで医療オントロジーを抽出、Amazon Rekognitionで人物名・顔・会議タイプの検出を初版MVPに実装しました。これにより迅速な反復開発が可能となり、早期成果を積み重ねた結果、投資家とのプレシードラウンドを成功裏に完了できました。
それ以来、トレーニングプロセスで収集したデータを活用し、自社独自の機械学習モデルを構築するため、ワークフローとデータパイプラインのアップグレードを開始しました。Amazon SageMakerは当社のソリューションにおいて不可欠な要素となっています。これはサーバーレスモデルで無制限のスケーリングを実現する基盤であり、あらゆる機械学習および深層学習フレームワークを自由に選択できる使いやすさと柔軟性が決定的な要因でした。 現在、TensorFlow、Apache MXNet、SageMakerノートブックを活用しています。
オープンソースのフレームワークを採用したことで、これらのプラットフォームに精通したデータサイエンティストをチームに迎え入れ、コスト効率の良い方法で迅速に規模拡大を実現できました。わずか数ヶ月で、自社開発の機械学習アルゴリズムとワークフローをSageMakerに統合し、顧客エンゲージメントの向上を図りました。
AWSサービスのアーキテクチャ、CLIPrの高度な機能などについては、AWSでこの記事の続きを読む