SoftServe – Más allá de la inteligencia artificial generativa (IA Gen) para la generación de texto, existen otras direcciones tecnológicas que están ganando terreno y que podrían transformar diversas industrias, como los algoritmos de aprendizaje automático (machine learning o ML, por sus siglas en inglés), la computación cuántica, la robótica, la realidad extendida o la biotecnología.
En su reciente informe “Hype Cycle 2024”, los analistas de Gartner señalan que las empresas deben examinar no sólo la IA Gen, sino también otras tecnologías emergentes con potencial transformador. Los inversores también están explorando tendencias alternativas: McKinsey, en su más reciente informe (publicado el 23 de octubre de este año), identifica 18 industrias que podrían remodelar la economía global y generar entre 29 y 48 billones de dólares en ingresos para 2040.
SoftServe, como proveedor líder de consultoría en TI y servicios digitales, no siempre se relaciona con el hardware y la investigación científica. Los expertos de la compañía no sólo son ingenieros de software y gerentes de proyectos, sino que también hay otros equipos técnicos que trabajan en diferentes corrientes innovadoras. Uno de ellos, el de Investigación y Desarrollo (I+D) de SoftServe, se estableció en 2008 y desde entonces ha crecido de 4 personas a más de 100 investigadores, ingenieros, desarrolladores y gerentes de producto interdisciplinarios en 8 países (Ucrania, Polonia, Reino Unido, Bulgaria, Singapur, Colombia, Alemania y Canadá).
Utilizando las últimas tecnologías y ciencia aplicada en su trabajo, el equipo supera barreras existentes para descubrir soluciones innovadoras y con beneficios inmediatos, ahorrando tiempo y dinero aparte de crear nuevas oportunidades. Estos son los últimos proyectos en los que el equipo de I+D de SoftServe está enfoncándose actualmente:
1 – Reconocimiento de voz para detectar dislexia infantil
¿Si usted alguna vez ha visto a niños usando control por voz sin éxito?, hay una razón detrás de eso. El reconocimiento de voz se centra en convertir el lenguaje hablado en texto o comandos escritos. Involucra el uso de algoritmos y modelos de aprendizaje automático para analizar e interpretar señales de audio, reconociendo y transcribiendo palabras en texto. Los productos y servicios que utilizan esta tecnología son los asistentes de voz, el software de transcripción/dictado, las funciones de control manos libres de los dispositivos y las herramientas de traducción de idiomas.
La tecnología detrás de estos servicios es el reconocimiento automático del habla (ASR, por sus siglas en inglés), que usa modelos acústicos y de lenguaje, así como redes neuronales, para convertir el lenguaje hablado en texto escrito. Según diversos informes como uno de Statista, el tamaño del mercado de ASR se estima en alrededor de 8 mil millones de dólares este año y se prevé que crezca un 15-25% anual.
Sin embargo, los sistemas actuales de reconocimiento automático de voz basados en datos de voces de adultos, a menudo malinterpretan el habla infantil con una tasa de error del 20% al 50%. Esto afecta a soluciones educativas y de entretenimiento, donde un reconocimiento de voz preciso puede mejorar las experiencias de aprendizaje y juego de los niños.
El equipo de I+D de SoftServe está trabajando en un modelo ASR específicamente para niños, ¡y tiene una precisión aproximadamente 8 veces mayor que las mejores soluciones de vanguardia disponibles hoy en día! En esto, fuimos aún más allá para ampliar las posibilidades de aprendizaje para los niños, utilizando los avances de la IA generativa de audio: el nuevo modelo puede hacer una transcripción fonética, asegurando que los patrones únicos de habla de los niños se capten con precisión.
Con una precisión mucho mayor y un costo equilibrado, la solución podría usarse para la detección de dislexia. Actualmente, el equipo está trabajando en soporte multilingüe, optimización del modelo y mejora de la precisión; y la última versión, basada en NVIDIA NIM, muestra un rendimiento aún mejor.
2 – Escáner 3D para inspección de calidad rápida y precisa
El escaneo 3D es otra herramienta prometedora para diferentes industrias, que literalmente captura el mundo real en forma digital. Los escáneres 3D utilizan luz, láser u otros sensores, capturando no sólo el tamaño y el color de los objetos (como las cámaras) sino también su forma exacta, lo que permite que las computadoras creen modelos 3D virtuales de cualquier cosa. Sin embargo, la mayoría de ellos son complicados de usar para personas que no sean ingenieros.
En este contexto, el equipo de SoftServe presentó su Escáner 3D Automático en Hannover Messe, la feria industrial líder en el mundo. Consiste en un propio escáner o unidad de escaneo, que utiliza luz estructurada proyectada y una cámara. Calcula dónde toca la luz el objeto desde cada ángulo, generando una nube de puntos 3D de la superficie con una precisión de hasta 0.1 mm. Luego sucede la “magia tecnológica”: todo el trabajo es realizado por un software personalizado basado en IA y algoritmos avanzados, desarrollados por los ingenieros de la compañía. Ese proceso de “un solo toque” no requiere la participación de especialistas en el uso del escáner, y la interfaz de la solución es amigable para cualquier usuario, lo que marca la diferencia de esta solución de SoftServe.
El motivo por el cual el equipo quiso hacerlo tan fácilmente escalable es apuntar a las industrias manufactureras, ya que dicho escáner puede integrarse en líneas de ensamblaje. Por ejemplo, puede alinear modelos escaneados (de pequeños detalles, digamos) con el diseño CAD e identificar defectos de producción, mientras que el ojo humano no suele detectar errores tan pequeños como de un milímetro, aparte de que las pruebas de muestreo aleatorias no son eficientes para garantizar la calidad.
Otro ejemplo es la inspección de empaques en la producción de alimentos o medicamentos: la solución de escáner puede leer los códigos de barras, analizar el texto e identificar defectos de packaging, lo cual complementa el control de calidad humano existente que se convierte en un proceso remoto. Hablando de la industria automotriz, la garantía de calidad de las uniones y nivelaciones es vital allí, y los fabricantes de vehículos a menudo aceptan inspecciones manuales lentas, mientras que el escáner de SoftServe puede inspeccionar todo el automóvil en tiempo real e identificar uniones con mucha más precisión.
Ahora, nuestro equipo está añadiendo NVIDIA Omniverse y modelos de lenguaje grande al escáner 3D, lo que permitirá a los usuarios comunicarse más fácilmente con la solución, por ejemplo, pidiéndole al chatbot que compare datos históricos o genere paneles de control en minutos.
3 – Ciencia de la vida: nuevas capacidades en el descubrimiento de fármacos
Crear nuevos medicamentos es un proceso complejo: una molécula debe cumplir muchas condiciones para ser eficaz y minimizar los efectos secundarios. Las mejores moléculas candidatas se adhieren sólo a sus objetivos previstos, evitando afectar otras partes del cuerpo. De principio a fin, el proceso suele durar de 10 a 15 años, y apenas uno de entre miles de candidatos llega a los pacientes. Aparte de que el costo de un medicamento convencional supera los mil millones de dólares, desde la creación hasta la aprobación y distribución comercial. en este contexto, uno de los principales desafíos en el descubrimiento de fármacos es el diseño y selección eficientes de nuevos compuestos, ya que los científicos deben crear nuevas moléculas y predecir sus propiedades a un costo computacional bajo.
Por ello, el equipo de SoftServe ha lanzado recientemente el demo “Generación de Moléculas Orgánicas Pequeñas” para mostrar cómo un enfoque innovador está transformando la química. Aquí un conjunto de soluciones basadas en IA y aprendizaje automático predicen la mayoría de las propiedades de “drogabilidad” basándose en las estructuras moleculares, lo que acelera y hace más eficiente todo el proceso, ayudando a los científicos a encontrar moléculas prometedoras para nuevos medicamentos más rápidamente.
Los expertos de la compañía han desarrollado un sistema en el que una herramienta de IA (el generador) crea nuevas moléculas, mientras que otra herramienta (el discriminador) verifica si cumplen con las propiedades deseadas. El generador mejora continuamente las moléculas según el feedback del discriminador, repitiendo el proceso hasta lograr el ajuste óptimo. Este enfoque es útil para diseñar moléculas orgánicas pequeñas e incluso péptidos, que se usan en tratamientos como la inmunoterapia contra el cáncer.
Al respecto, un estudio reciente del equipo de I+D explora el uso de la inteligencia artificial para encontrar nuevos tratamientos para problemas de coagulación sanguínea, como la trombosis o la hemofilia, generando candidatos a fármacos novedosos. Los resultados indican que el aprendizaje automático ofrece resultados prometedores en el descubrimiento de fármacos, incluso si la disponibilidad de datos es baja, acercando soluciones impactantes a la industria.
4 – Creación de contenido de marketing a un nuevo nivel
Una herramienta de creación de contenido de SoftServe automatiza la generación de imágenes y textos de alta calidad y específicos para la marca, agilizando la producción de materiales en diversas etapas, desde la investigación y el desarrollo hasta la distribución de marketing. Esta herramienta emplea IA Gen visual y otras tecnologías avanzadas para proporcionar soluciones personalizadas y eficientes para diversas industrias.
Dicha herramienta admite la generación de texto e imágenes, y se prevé una futura expansión para aceptar contenido de video.
Los usuarios pueden cargar activos digitales, como materiales 2D y 3D, y personalizar la salida utilizando indicaciones y configuraciones precisas, incluyendo especificaciones de la audiencia. El sistema utiliza funciones avanzadas como generación de texto, transformaciones de texto a imagen, y de imagen a imagen para alinearse con la marca. Funciona sobre la sólida infraestructura de NVIDIA, incluyendo NIM Stable Diffusion, Llama-3 y NeMo.
Dirigido a industrias como retail, medios y entretenimiento, esta solución es ideal para equipos de marketing, agencias creativas y diseñadores de productos. Permite generar contenido mercadológico, personalizar visuales para diferentes canales y regiones, o facilitar pruebas A/B rápidas. Las características únicas de la herramienta, como el repintado avanzado y la integración con datos específicos de la marca, la contrastan de competidores como Jasper AI y OpenAI.
Esta herramienta ha demostrado reducir el tiempo para producir y redimensionar materiales creativos hasta en un 50%, disminuyendo la carga operativa en los equipos de marketing y permitiéndoles enfocarse en iniciativas estratégicas. El impacto estimado incluye una reducción de costos operativos del 50-70% en tres años y un posible aumento del 15% en las tasas de conversión, gracias a sus capacidades avanzadas de personalización.
Los futuros desarrollos incluirán soporte mejorado para múltiples idiomas y opciones de personalización adicionales para diversas industrias. La última colaboración con NVIDIA acelera la velocidad de renderizado y permite la colaboración en tiempo real, aspecto que se presentará próximamente en el Gartner IT Symposium en España.
5 – Computación neuromórfica inspirada en la eficiencia del cerebro humano
La computación neuromórfica es una forma de diseñar computadoras, inspirada en las neuronas humanas y sus innumerables conexiones. En lugar de utilizar el método tradicional, en el que las computadoras realizan las tareas paso a paso (como seguir un conjunto de instrucciones), las computadoras neuromórficas intentan imitar la capacidad del cerebro para procesar grandes cantidades de información simultáneamente. La ingeniería neuromórfica combina principios de biología, física, matemáticas, informática e ingeniería electrónica.
A detalle, la detección neuromórfica utiliza métodos basados en eventos (como el cerebro humano), reaccionando y procesando información sólo cuando algo cambia en el entorno, en lugar de analizarlo todo constantemente (como hacen los sistemas tradicionales). Esto reduce drásticamente el consumo de energía y el procesamiento de datos, acelerando aplicaciones en visión artificial e internet de las cosas (IoT, por sus siglas en inglés) con velocidad y eficiencia sin precedentes.
El equipo de SoftServe está trabajando en soluciones que aprovechan las cámaras neuromórficas para demostrar las capacidades de esta tecnología. Por ejemplo, medir las dimensiones de cristales de azúcar podría mostrar cómo estos dispositivos pueden usarse en laboratorios científicos para medir partículas diminutas, cristales o células biológicas. Y en campos como la ciencia de materiales o la química, esto ayudaría a los científicos a estudiar la estructura de objetos minúsculos de forma rápida y precisa, acelerando descubrimientos en áreas como la medicina, la ingeniería de materiales y más.
La tecnología neuromórfica puede aplicarse en industrias como la robótica, salud, dispositivos energéticamente eficientes, espacial y seguridad. Sobresale en situaciones que requieren procesamiento rápido y en tiempo real de datos complejos (por ejemplo, en la industria espacial los sensores neuromórficos tienen un gran potencial para capturar procesos muy rápidos o en condiciones de poca luz con precisión). Por último, esta innovación hace que los sistemas sean más inteligentes, rápidos y eficientes energéticamente, en comparación con la computación tradicional.
Por: Volodymyr Karpiv, Director de I+D en SoftServe.
No olviden que pueden escuchar nuestros podcasts: Top Tech y Top Gaming disponibles en Spotify.