TVTech: La herramienta CLIPr Cloud va al grano para ahorrar innumerables horas
24 de marzo de 2021
CLIPr tiene como objetivo organizar los vídeos para que la búsqueda del clip deseado sea rápida y eficaz.
¿Qué tienen en común una cadena de televisión o un estudio cinematográfico con el típico buzón de correo electrónico empresarial de hoy en día? Ambos son portales a horas aparentemente ilimitadas de contenido de vídeo.
Fue esa similitud lo que me llamó la atención cuando alguien de una nueva empresa llamada CLIPr se puso en contacto conmigo para hablar sobre cómo la empresa está haciendo que los vídeos sean buscables.
En pocas palabras, CLIPr aprovecha las herramientas de aprendizaje automático en la nube de Amazon para revisar horas de vídeos subidos, de modo que los usuarios puedan encontrar y ver lo que necesitan, en lugar de pasar horas y horas esperando a que llegue la parte interesante.
CLIPr aborda esta cuestión pensando en el mercado masivo: los millones y millones de horas de vídeo generadas durante videoconferencias, sesiones de conferencias virtuales, discursos virtuales y clases virtuales que han sustituido a las experiencias presenciales desde que se declaró la pandemia de COVID-19 hace un año.
Pero, ¿por qué no podría la misma tecnología ayudar a los reporteros y editores de vídeo de las cadenas de televisión que necesitan buscar en vídeos sin editar el clip adecuado para utilizarlo en una noticia, o a sus homólogos de los estudios que buscan una toma concreta?
Entrevisté a Humphrey Chen, cofundador y director ejecutivo de CLIPr, para averiguarlo.
(Transcripción editada).
TVTech: CLIPr facilita a los usuarios la búsqueda de los videoclips que desean ver. ¿Cómo?
Humphrey Chen: La forma de entender CLIPr es que somos una plataforma de análisis y gestión de vídeos.
Nuestra forma de pensar es que no todos los momentos de un vídeo son iguales. Algunos son más valiosos y otros menos. El problema actual es que, cuando pulsamos el botón de reproducción, nos vemos obligados a estar a merced de todo lo que hay detrás.
Lo que hace CLIPr es crear un índice automatizado para mostrar el contenido, lo que te permite seleccionar lo que quieres ver y lo que no quieres ver.
Si solo te interesa el 5 % de una reunión de tres horas, te estamos ahorrando el 95 %. Hoy en día no existen herramientas que te permitan encontrar de manera eficiente lo que necesitas.
TVT: Entonces, inicialmente, CLIPr está dirigido a aplicaciones de tipo empresarial, ¿verdad?
HC: Durante la pandemia, todo se convirtió en vídeo. Todo se digitalizó, y mi socio fundador vino a mí y me dijo: «Tío, necesito algo que me ayude a ponerme al día con mis vídeos atrasados».
Fue un momento revelador. Nos dimos cuenta de que podíamos crear algo a gran escala que se aplicara a las masas, ya que cada día se celebran 15 millones de reuniones, y todas ellas son a distancia. Según he oído, entre el 30 y el 40 % de ellas se graban.
Antes de CLIPr, no era fácil ponerse al día. Con CLIPr, basta con hacer clic para enviarlo y nosotros lo indexamos y lo «enriquecemos». Proporcionamos temas y etiquetas para describir el contenido.
TVT: ¿Se ha puesto en contacto con usted alguna cadena de televisión o estudio cinematográfico interesado en utilizar esta tecnología para buscar las imágenes deseadas?
HC: Lo curioso es que las raíces de todo lo que hacemos se diseñaron originalmente para servir a Hollywood. Tienen miles y miles de horas de contenido, y también cuentan con personal a tiempo completo cuya única tarea es revisarlo.
Tenemos clientes que se han puesto en contacto con nosotros después de la publicación del blog de Amazon y nos piden que les ayudemos con el posprocesamiento asociado a la creación de tráilers porque están buscando cosas.
Las herramientas que estamos creando, diseñadas para servir a las masas, también pueden ayudar a los estudios.
Ya estamos viendo tráileres de películas subidos y jugadores que suben momentos de sus videojuegos a Twitch.
TVT: Cuéntame cómo la inteligencia artificial y el aprendizaje automático en la nube impulsan CLIPr.
HC: Básicamente, lo hemos construido pensando en la escalabilidad, utilizando la pila de IA de Amazon entre bastidores.
También es muy importante darse cuenta de que, aunque creemos que el aprendizaje automático es fantástico, sigue siendo imperfecto. No es perfecto en absoluto.
Teniendo esto en cuenta, contamos con personas que ayudan a anotar y mejorar lo que vemos. Por lo tanto, en la experiencia estructurada, hay personas que ayudan a que las descripciones sean más precisas y claras.
En este momento, si simplemente confiaras plenamente en la automatización, no obtendrías un resumen conciso de 10 frases. La tecnología actual no permite que 10 frases se conviertan en tres palabras. Eso simplemente aún no existe.
La única forma de hacerlo es ponerlo en manos de la gente, conseguir que lo utilicen tanto como sea posible. Así obtienen utilidad. Cuando están contentos [con los resultados] o cuando no lo están, aprendemos y nuestros modelos pueden mejorar.
Podemos aprovechar esa pila de aprendizaje automático —la plataforma que tiene Amazon— y seguir mejorando.
TVT: ¿Cuál es la diferencia entre contenido estructurado y no estructurado en este contexto?
HC: La primera fase de CLIPr se centró en el contenido estructurado. Eso suele significar que hay una diapositiva (como en una reunión o un discurso inaugural) que se corresponde con el hilo conductor de la charla. El contenido no estructurado significa que no hay señales visuales que nos indiquen lo que está sucediendo.
Todos hemos estado en reuniones en las que la conversación puede ir por todos lados, ¿verdad? Si bien es difícil para un humano organizar eso, es imposible para una máquina.
Por lo tanto, nuestra experiencia no estructurada será más equivalente a una nube de palabras o una nube de temas. En ese momento, lo que CLIPr creará previamente será, en efecto, un mapa del tesoro, una página de inicio, porque ahora estamos mostrando todos los aspectos importantes que se han discutido, y usted pasa el cursor por encima de ellos. Eso le llevará a esas partes dentro del vídeo.
TVT: ¿Cómo empezó todo esto para ti?
HC: Mi experiencia profesional se centra en Amazon, en el equipo de visión artificial. Básicamente, ayudábamos a los desarrolladores a ver y oír a gran escala. Era divertido y emocionante, pero también frustrante, porque yo les proporcionaba las herramientas y ellos tenían que crear las soluciones. Ahora estamos desarrollando la solución.
Fuente: tvtechnology.com