Geekzillo la industria de las videoconferencias está a punto de transformarse gracias a NVIDIA Maxine, la plataforma que seguirá impulsando la creatividad de sus usuarios. Maxine permite a los desarrolladores integrar fácilmente funciones de inteligencia artificial para crear experiencias de videoconferencia personalizadas y atractivas. Conoce todos los detalles a continuación.
Las videoconferencias les han permitido a muchos ser productivos desde cualquier lugar. Ahora, NVIDIA está impulsando la productividad de los desarrolladores de aplicaciones de videoconferencia, centros de llamadas y streaming dentro de la industria valuada en 10 mil millones de dólares al permitirles integrar fácilmente la IA en sus flujos de trabajo.
La nueva versión de la plataforma para desarrolladores Maxine AI transforma la creación de aplicaciones de videoconferencia en tiempo real de última generación con características que permiten una mayor flexibilidad, participación y eficiencia del usuario.
Disponible a través de la plataforma de software NVIDIA AI Enterprise, Maxine permite a los desarrolladores aprovechar las últimas funciones impulsadas por inteligencia artificial, como calidad mejorada de video y audio y efectos de realidad aumentada, para convertir las videollamadas diarias de los usuarios en experiencias colaborativas atractivas.
Ampliación de las videoconferencias con nuevas funciones de Maxine
La plataforma para desarrolladores Maxine AI permite a los desarrolladores acceder e integrar fácilmente funciones mejoradas por inteligencia artificial en tiempo real que aumentan la calidad de la participación de los usuarios de videoconferencias.
Funciones como la reducción de ruido, la eliminación de ruido y la mejora de video y la voz de estudio mejoran la calidad de las transmisiones de audio y video. Con capacidades avanzadas como corrección de la mirada, retrato en vivo y funciones futuras como la iluminación de video y el microservicio en la nube Maxine 3D, los desarrolladores pueden mejorar la participación en las videoconferencias y la conexión personal.
La plataforma amplía la utilidad de los modelos de inteligencia artificial de última generación para efectos de audio, video y realidad aumentada con múltiples formas para que los desarrolladores ofrezcan funciones de Maxine con ofertas de kits de desarrollo de software, microservicios e incluso interfaz de programación de aplicaciones (API) puntos finales entregados desde la infraestructura de nube de NVIDIA.
Actualizaciones de funciones
Las actualizaciones de funciones de producción de Maxine disponibles ahora incluyen las siguientes:
- Contacto visual. El modelo de contacto visual mejorado proporciona redirección de la mirada con movimientos oculares naturales para que los participantes se involucren más en la reunión.
- Fuente de voz. Este nuevo modelo hace coincidir la voz del hablante con una voz objetivo manteniendo la información lingüística y la prosodia (ritmo y tono) sin cambios.
- Reducción de ruido de fondo (BNR) 2.0. Este modelo actualiza la reducción de ruido para la escucha humana y para la codificación de idiomas con un esfuerzo específico para disminuir las tasas de error de palabras en la codificación.
Las nuevas funciones disponibles para acceso anticipado esta primavera incluyen las siguientes:
- Retrato en vivo con voz. Este modelo permite al usuario dirigir su retrato con voz directa o cualquier fuente de audio. Lo que les permite lucir siempre lo mejor posible durante una conferencia telefónica.
- Voz de estudio. Este modelo permite que los micrófonos comunes de auriculares, portátiles y de escritorio ofrezcan el sonido de un micrófono de estudio de alta gama. Lo que permite a los usuarios sonar siempre lo mejor posible durante una conferencia telefónica.
También te puede interesar: Microsoft anuncia colaboración con NVIDIA para acelerar la innovación en salud y ciencias de la vida
El programa de acceso temprano a Maxine comparte versiones de preproducción y prelanzamiento de las próximas funciones para que los desarrolladores opinen sobre su utilidad y el perfeccionamiento de los modelos de Maxine. En esta versión. Solicitamos a los desarrolladores comentarios sobre las funciones que se encuentran en las primeras etapas del proceso de desarrollo. Entre las que se incluyen las siguientes:
- Maxine 3D. Este microservicio en la nube, que se mostró anteriormente como una demostración de investigación en SIGGRAPH 2023. Ofrece un nuevo nivel de participación para videoconferencias con tecnología NeRF en tiempo real que eleva el video 2D a 3D.
- Reiluminación de video. Este nuevo modelo utiliza una imagen de alto rango dinámico para iluminar al usuario. Lo que permite una combinación perfecta de la iluminación del usuario con varias imágenes de fondo.
- Puntos finales de API. Los puntos finales de API ofrecen a los desarrolladores la flexibilidad de acceder a las funciones de Maxine a través de la infraestructura de nube de NVIDIA. Lo que facilita aún más la integración de Maxine.
“En un mundo cada vez más conectado, el desarrollo de videollamadas cada vez más elaboradas desempeña un papel crucial para facilitar la colaboración y mantener la productividad en entornos virtuales. La plataforma para desarrolladores Maxine AI está a la vanguardia de este desarrollo, permitiendo a los usuarios conectarse de una forma más eficaz e inmersiva que nunca”, añade Marcio Aguiar, director de la división Enterprise de NVIDIA para América Latina.
Jugo y Arsenal Football Club marcan grandes goles
Los eventos deportivos son la experiencia humana definitiva, que une a equipos y aficionados más allá de fronteras y barreras lingüísticas. Jugo, que utiliza la función AI Green Screen de Maxine, ofrece una plataforma digital para eventos virtuales que permite a las empresas crear experiencias inmersivas con Unreal. Engine que reúnen a fanáticos de todo el mundo sin el uso de un estudio de producción completo.
El Arsenal FC, una poderosa franquicia de la Premier League de Inglaterra, está colaborando con Jugo para revolucionar la forma en que el club de fútbol se relaciona con su base de 600 millones de fanáticos en todo el mundo. La colaboración ofrece nuevas experiencias de entretenimiento deportivo virtual para impulsar la participación de los seguidores de todo el mundo. Jugo aporta el poder de la interacción humana real a los eventos del Arsenal. Creando conexiones virtuales realistas entre los seguidores y los héroes deportivos del club.
“La plataforma Jugo Experience está transformando el mercado de las marcas en su búsqueda de conciencia y compromiso global”, declaró Richard Stirk, director ejecutivo de Jugo Experience. “Arsenal F. C. es el ejemplo perfecto de extensión de marca global. La flexibilidad para crear una experiencia de marca inmersiva es clave para la oferta de Jugo y la plataforma para desarrolladores Maxine AI es un elemento básico de esta flexibilidad”.
Estableciendo un nuevo estándar de videoconferencias mejoradas con IA
Entre los primeros clientes en aprovechar el conjunto más nuevo de funciones dentro del programa de acceso anticipado. Para crear un estudio audiovisual profesional. Esto a partir de cámaras y micrófonos básicos se encuentran Gemelo, Pexip, Spectacle y VideoRequest.
“Gemelo participó en pruebas de versiones preliminares de modelos de Maxine durante varios años y valoramos la oportunidad de brindar información temprana sobre las características de Maxine a medida que se desarrollan”, dijo Paul Jaski, director ejecutivo de Gemelo. “La última característica, Speech Live Portrait, brindará a nuestros clientes una mayor flexibilidad para crear mensajes de video personalizados, abriendo las puertas a una nueva era de personalización”.
“Pexip agradece la oportunidad de probar versiones de desarrollo de las funciones de Maxine y ayudar a guiar los modelos del producto final”, dijo Ian Mortimer, director de tecnología de Pexip. “Al probar la versión más reciente de Maxine BNR, estamos observando mejoras significativas en la inteligibilidad y la calidad del habla, y tenemos previsto continuar perfeccionando nuestros parámetros de prueba para optimizar la precisión en los procesos de traducción de inteligencia artificial”.
“La API NVIDIA Maxine Eye Contact simplificó significativamente nuestro camino para brindar capacidades de procesamiento de video atractivas a los usuarios de nuestra aplicación Spectacle, eliminando la necesidad de preocuparnos por la infraestructura y las integraciones que consumen muchos recursos”, dijo Benjamin Portman, presidente de Spectacle. “Con él, pudimos crear una prueba de concepto en cuestión de días, acelerando el cronograma de implementación de nuestra aplicación de producción”.
“Nuestras primeras pruebas de Maxine Studio Voice permitieron una visión impresionante de lo que ahora es posible con la producción mejorada por inteligencia artificial y los testimonios en video”, dijo Joe Tyler, director de tecnología de VideoRequest. “Las nuevas funciones Maxine BNR y Eye Contact ayudarán a elevar la calidad de los videos de nuestros clientes al superar sus desafiantes entornos de grabación”.
También te puede interesar: La plataforma NVIDIA Blackwell llega para impulsar una nueva era de computación
Y tú, geekzillo, ¿qué opinas de que NVIDIA Maxine transformará la industria de las videoconferencias valuada en 10 mil millones de dólares? No olvides que puedes compartirnos tus opiniones en los comentarios.
Por último, puedes seguir la pista de esta y más noticias en T3 Latam, TechRadar México. Además de nuestros podcasts con Oye 89.7: Top Tech y Top Gaming en Spotify.