همفري تشين يتحدث عن مستقبل استهلاك الفيديو في مكان العمل


20 مايو 2021


يمنحنا الذكاء الاصطناعي والتعلم الآلي القدرة على التغلب على التحدي المتمثل في العثور بسرعة على اللحظات المهمة في الفيديو.


أدى فيروس كوفيد-19 إلى اضطراب كبير في الحياة اليومية كما نعرفها، بما في ذلك كمية وطريقة تفاعل الناس مع محتوى الفيديو واستهلاكهم له. ومع ذلك، من الصعب القول إن الارتفاع الأخير في استهلاك الفيديو مرتبط حصريًا بالجائحة. يمكن القول إننا كنا بالفعل نتجه في هذا الاتجاه.


قبل بدء الإغلاق في عام 2019، كان الناس يقضون حوالي 84 دقيقة في المتوسط يوميًا في مشاهدة مقاطع الفيديو، بزيادة عن المتوسط الذي كان 67 دقيقة يوميًا في عام 2018. في عام 2020، قفز المتوسط إلى حوالي 100 دقيقة يوميًا ومن المؤكد أنه سيستمر في النمو في عام 2021 وما بعده. من المؤكد أن البقاء في المنزل وعدم القدرة على التواصل الاجتماعي بشكل شخصي ساهم في هذا الارتفاع، حيث أنهت خدمات البث المباشر الكبرى (Netflix و Hulu و Amazon Prime وغيرها) عام 2020 بزيادة تزيد عن 50٪ في عدد المشتركين في الولايات المتحدة، ولكن يمكن أيضًا أن تُعزى الزيادة في استهلاك الفيديو إلى التغيير في عاداتنا في العمل.


أدى الوباء العالمي وحركة العمل عن بُعد المرتبطة به إلى تسريع انتقال مؤتمرات الفيديو المؤسسية بشكل كبير من كونها "ميزة إضافية" إلى ضرورة. وفقًا لمنشور على مدونة Zoom، ارتفع عدد مستخدمي منصتهم إلى 300 مليون مستخدم يوميًا في أبريل 2020، مقارنة بـ 10 ملايين مستخدم في ديسمبر 2019. يعد محتوى الفيديو أساسيًا لكل ما تقوم به الشركات اليوم، من الاجتماعات وساعات الترفيه لبناء الفريق، إلى الأحداث الافتراضية والدورات التدريبية والمزيد.


تطور استهلاك الفيديو


نتيجة لهذا التغيير في عاداتنا في استهلاك الفيديو، فإننا نعاني بشكل جماعي من "إرهاق الفيديو"، وتفضيلنا لاستهلاك المحتوى، وخاصة الفيديو الطويل، يتغير مرة أخرى. يتم استهلاك الكثير من المحتوى على الصعيد الشخصي (مقاطع فيديو "إرشادية" حول تحسين المنزل بنفسك، وبث ألعاب الفيديو على Twitch، ومقاطع فيديو فتح العلب على YouTube، والبث المباشر على Facebook و Instagram، وما إلى ذلك) وعلى الصعيد المهني (اجتماعات الفيديو المسجلة، ومقاطع الفيديو التدريبية الداخلية، والكلمات الرئيسية للأحداث الافتراضية، والندوات عبر الإنترنت، وما إلى ذلك)، لدرجة أننا وصلنا إلى نقطة الانهيار. إذن، كيف ستستمر تفضيلاتنا في التغير؟


يمنحنا ارتفاع شعبية TikTok مؤشراً على شكل مستقبل استهلاك الفيديو. تحظى مقاطع الفيديو القصيرة والصغيرة بالنجاح، خاصة بين الأجيال الشابة. فهي لا تتيح للمشاهدين معالجة المعلومات بشكل أسرع فحسب، بل تتيح أيضًا صدى أكبر و"قوة تثبيت" للمعلومات المقدمة. كما يتيح المحتوى القصير إمكانية مشاهدة مقاطع الفيديو في الوقت الذي يناسبك، مثل أثناء انتظارك في طابور الدفع في السوبر ماركت، أو أثناء تعبئة خزان الوقود في محطة الوقود.


يمكن تطبيق نفس المبادئ على بيئة العمل. أظهر لنا العمل عن بُعد أن مسؤوليات المنزل وتربية الأطفال يمكن أن تعطل تركيزنا بسهولة أثناء مؤتمرات الفيديو المباشرة وعند مشاهدة المحتوى المسجل، حيث يؤدي التوقف المستمر وإعادة تشغيل الفيديو إلى تعطيل استيعاب المعلومات. تزدحم أيام الأسبوع بالعديد من اجتماعات الفيديو لدرجة أن آخر ما نرغب في فعله هو مشاهدة المزيد من مقاطع الفيديو. في الواقع، أصبحت مؤتمرات الفيديو مرهقة للغاية لدرجة أن Citigroup أطلقت مبادرة "أيام الجمعة بدون Zoom" في محاولة لمكافحة إرهاقنا الجماعي من الفيديو.


كان من المعتاد قياس مدى تفاعل المشاهدين مع الفيديو من خلال مدة مشاهدتهم له. لكن هذا المقياس لم يعد مثالياً لأن وقتنا أصبح ثميناً، ومجرد مشاهدة الناس للفيديو من البداية إلى النهاية لا يعني أنهم لا يرغبون في الحصول على المعلومات المطلوبة بسرعة أكبر. بدلاً من ذلك، يجب التركيز على مدى سرعة العثور على الموضوعات الأكثر صلة من الفيديو واستخراج المعلومات وتطبيقها على مهامنا. بمعنى آخر، قضاء المزيد من الوقت في العمل وقليل من الوقت في المشاهدة. 


التقنيات الجديدة ستؤثر على طريقة تفاعلنا مع محتوى الفيديو


يمنحنا الذكاء الاصطناعي والتعلم الآلي القدرة على التغلب على التحدي المتمثل في العثور بسرعة على اللحظات المهمة في الفيديو من خلال تحليل الإشارات الصوتية والمرئية، مما يسهل فهرسة اللحظات المحددة والبحث عنها واسترجاعها. ومع ذلك، لا يوجد حل واحد يناسب الجميع. تحديد اللحظات المهمة في الفيديو أمر نسبي؛ فكل شخص يقدّر لحظات مختلفة، ويجب أن يفهم الذكاء الاصطناعي أيضًا هذه الفروق الدقيقة والتمييزات. تدريب الآلة على فهم الفيديو هو عملية معقدة للغاية تعتمد على تنسيق محفزات يصعب تحقيقها حتى مع التقدم الحالي في مجال الذكاء الاصطناعي.


هناك العديد من العوامل التي تؤخذ في الاعتبار من أجل إبراز اللحظات المهمة في الفيديو. يحلل التعلم الآلي عناصر الفيديو والصوت مثل الموضوعات والمتحدثين والنبرة ووقت الحديث ولغة الجسد والرسوم المتحركة والوسائل البصرية لتحديد اللحظات المهمة في محتوى الفيديو. في الوقت الحالي، يمكن للذكاء الاصطناعي تحليل الكلمات والعبارات الرئيسية بسهولة؛ ومع ذلك، لا يزال هذا الأمر واسعًا جدًا ولا يساعد في تحديد إجراءات أو سياق معين. هناك متغيرات إضافية ضمن هذه الكلمات والعبارات، مثل المصطلحات والتمييز بين الأصوات المتعددة (على سبيل المثال، عرض تقديمي يقدمه عدة أشخاص بلكنات مختلفة). وللمضي قدمًا، لكي يفهم الذكاء الاصطناعي أهمية اللحظة بشكل كامل، يجب أن يأخذ في الاعتبار أيضًا الردود أو ردود الفعل عليها. على سبيل المثال، إذا أطلق أحد مقدمي العرض نكتة جذبت انتباه الجمهور وأضحكتهم، فسيحدد الذكاء الاصطناعي أهمية هذا التفاعل. خارج نطاق الذكاء الاصطناعي والتعلم الآلي، سيستمر بث الفيديو فائق الوضوح بدقة 4K والشبكات اللاسلكية 5G وزيادة عمر البطارية في التأثير على طريقة تفاعلنا مع الفيديو واستهلاكنا له.


يشير ارتفاع استهلاك الفيديو إلى أن الشركات ومبدعي المحتوى والمسوقين الذين يعتمدون على هذه الوسيلة بحاجة إلى الاستجابة لهذا الحمل الزائد من أجل العمل بفعالية. قد يظل الفيديو سلعة، لكن الوقت الذي يقضيه الناس في مشاهدته ليس كذلك. ستضطر الشركات إلى تبسيط عملية استيعاب الفيديو، خاصة المحتوى الطويل، وإلا فستخاطر بالتخلف عن الركب في السباق على جذب انتباه الناس.


المصدر: Streaming Media