TVTech: أداة CLIPr Cloud تختصر الوقت وتوفر ساعات لا حصر لها
24 مارس 2021
يهدف CLIPr إلى تنظيم مقاطع الفيديو لتسهيل العثور على المقطع المطلوب بسرعة وفعالية.
ما هو الشيء المشترك بين محطة تلفزيونية أو استوديو أفلام وبين صندوق البريد الإلكتروني الخاص بالعمل في الوقت الحاضر؟ كلاهما بوابة إلى ساعات لا حصر لها من محتوى الفيديو.
كان هذا التشابه هو ما لفت انتباهي عندما اتصل بي أحد ممثلي شركة جديدة تدعى CLIPr لمناقشة كيفية قيام الشركة بجعل مقاطع الفيديو قابلة للبحث.
باختصار، يستخدم CLIPr أدوات التعلم الآلي في سحابة Amazon لتصفح ساعات من مقاطع الفيديو التي تم تحميلها حتى يتمكن المستخدمون من العثور على ما يريدون مشاهدته ومشاهدته، بدلاً من قضاء ساعات طويلة في انتظار الجزء الجيد.
يأتي CLIPr في هذا السياق مع وضع السوق الشامل في الاعتبار — ملايين الساعات من مقاطع الفيديو التي تم إنتاجها خلال مؤتمرات الفيديو والمؤتمرات الافتراضية والخطب الافتراضية والدروس الافتراضية التي حلت محل التجارب الشخصية منذ إعلان جائحة COVID-19 قبل عام.
ولكن لماذا لا يمكن أن تساعد هذه التقنية نفسها المراسلين ومحرري الفيديو في محطات التلفزيون الذين يحتاجون إلى البحث في مقاطع الفيديو الخام عن المقطع المناسب لاستخدامه في تقرير إخباري، أو نظرائهم في الاستوديوهات الذين يبحثون عن لقطة معينة؟
للتعرف على المزيد، قمت بمقابلة همفري تشين، المؤسس المشارك والرئيس التنفيذي لشركة CLIPr.
(نص محرر.)
TVTech: CLIPr يسهل على الناس العثور على مقاطع الفيديو التي يبحثون عنها. كيف؟
همفري تشين: يمكننا التفكير في CLIPr على أنها منصة لتحليل وإدارة مقاطع الفيديو.
طريقة تفكيرنا في الأمور هي أن لحظات الفيديو ليست كلها متساوية. بعضها أكثر قيمة، وبعضها أقل قيمة. المشكلة الآن هي أننا عندما نضغط على زر التشغيل، نضطر جميعًا إلى أن نكون تحت رحمة كل ما وراءه.
لذا، ما يفعله CLIPr هو إنشاء فهرس آلي لعرض المحتوى، مما يتيح لك بعد ذلك اختيار ما تريد مشاهدته وما لا تريد مشاهدته.
إذا كنت تهتم فقط بـ 5٪ من اجتماع مدته ثلاث ساعات، فإننا نوفر لك 95٪. لا توجد اليوم أدوات تتيح لك العثور على ما تحتاجه بكفاءة عالية.
TVT: إذن، في البداية، أنت تستهدف تطبيقات CLIPr في مجال الأعمال، أليس كذلك؟
HC: خلال الجائحة، أصبح كل شيء فيديو. أصبح كل شيء رقمياً، وجاء إليّ شريكي المؤسس وقال: "يا رجل، أحتاج إلى شيء يساعدني في إنجاز أعمال الفيديو المتراكمة لديّ".
كان ذلك لحظة إيقاظ. أدركنا أنه يمكننا بناء شيء على نطاق واسع ينطبق على الجماهير لأن هناك 15 مليون اجتماع كل يوم، وجميعها عن بُعد. سمعت أن 30-40٪ منها يتم تسجيلها.
قبل CLIPr، لم يكن من السهل اللحاق بالركب. مع CLIPr، ما عليك سوى النقر لإرساله، ونحن نقوم بفهرسته وما نسميه "إثرائه". سنوفر مواضيع وتصنيفات لوصف المحتوى.
TVT: هل اتصلت بك أي قنوات تلفزيونية أو استوديوهات أفلام ترغب في استخدام هذه التكنولوجيا للبحث عن اللقطات المطلوبة؟
HC: المضحك في الأمر أن جذور كل ما نقوم به كانت في الأصل مصممة لخدمة هوليوود. لديهم آلاف وآلاف الساعات من المحتوى، ولديهم أيضًا موظفون بدوام كامل مهمتهم الوحيدة هي مراجعة هذا المحتوى.
لدينا عملاء يتواصلون معنا بعد نشر مدونة Amazon ويطلبون منا مساعدتهم في معالجة ما بعد الإنتاج المرتبطة بإنشاء المقاطع الدعائية لأنهم يبحثون عن أشياء.
الأدوات التي نصنعها، والمصممة لخدمة الجماهير، يمكن أن تساعد الاستوديوهات أيضًا.
نحن نشاهد بالفعل مقاطع دعائية للأفلام يتم تحميلها، كما يقوم اللاعبون بتحميل لحظات من ألعاب الفيديو الخاصة بهم على Twitch.
TVT: أخبرني عن كيفية استخدام الذكاء الاصطناعي والتعلم الآلي في السحابة لتشغيل CLIPr.
HC: لقد قمنا ببنائه مع وضع الحجم في الاعتبار، باستخدام حزمة Amazon AI خلف الكواليس.
من المهم أيضًا أن ندرك أنه على الرغم من أننا نعتقد أن التعلم الآلي أمر رائع، إلا أنه لا يزال غير كامل. إنه ليس مثاليًا على الإطلاق.
مع أخذ ذلك في الاعتبار، لدينا أشخاص يساعدون في توضيح وتحسين ما نراه. لذا، في التجربة المنظمة، هناك أشخاص يساعدون في جعل الأوصاف أكثر دقة ووضوحًا.
في الوقت الحالي، إذا اعتمدت بشكل كامل على الأتمتة، فلن تحصل على ملخص واضح مكون من 10 جمل. لا تسمح أحدث التقنيات بتحويل 10 جمل إلى ثلاث كلمات. هذا الأمر غير موجود بعد.
الطريقة الوحيدة للقيام بذلك هي وضع هذا في أيدي الناس — وجعلهم يستخدمونه قدر الإمكان. فهم يستفيدون منه. وعندما يكونون سعداء [بالنتائج] أو غير سعداء، نتعلم ونتمكن من تحسين نماذجنا.
يمكننا البناء على أساس مجموعة أدوات التعلم الآلي هذه — المنصة التي تمتلكها أمازون — ومواصلة التحسن.
TVT: ما الفرق بين المحتوى المنظم وغير المنظم في هذا السياق؟
HC: ركزت الخطوة الأولى من CLIPr على المحتوى المنظم. وهذا يعني عادةً وجود شريحة [مثل في اجتماع أو خطاب رئيسي] تتوافق مع مسار الحديث. أما المحتوى غير المنظم فيعني عدم وجود إشارات بصرية توضح لنا ما يحدث.
لقد حضرنا جميعًا اجتماعات يمكن أن تتشتت فيها المحادثة في كل اتجاه، أليس كذلك؟ في حين أنه من الصعب على الإنسان تنظيم ذلك، فإنه من المستحيل على الآلة تنظيم ذلك.
لذا فإن تجربتنا غير المنظمة ستكون أشبه بسحابة كلمات أو سحابة مواضيع. عند هذه النقطة، ما سيقوم CLIPr بإنشائه مسبقًا هو في الواقع خريطة كنز، صفحة افتتاحية، لأننا الآن نعرض جميع الأمور الرئيسية التي تمت مناقشتها، ويمكنك التمرير فوقها. سيأخذك ذلك إلى تلك الأجزاء داخل الفيديو.
TVT: كيف بدأ كل هذا بالنسبة لك؟
HC: خلفيتي المهنية هي العمل في فريق الرؤية الحاسوبية في شركة Amazon. كنا نمكّن المطورين من الرؤية والسمع على نطاق واسع. كان ذلك ممتعًا ومثيرًا. لكنه كان أيضًا محبطًا لأنني كنت أعطي المطورين الأدوات ثم يتعين عليهم بناء الحلول. الآن نحن نعمل على تطوير الحل.
المصدر: tvtechnology.com