GeekZilla
Image default
Geekzilla » Oracle presenta MySQL HeatWave Lakehouse: permitiendo a los clientes procesar y consultar cientos de terabytes de datos de almacenamiento
Noticias

Oracle presenta MySQL HeatWave Lakehouse: permitiendo a los clientes procesar y consultar cientos de terabytes de datos de almacenamiento

geekzillos, Oracle nos presenta MySQL HeatWave Lakehouse, ¿lo mejor de todo? Nos brinda una prueba gratuita para que simplifiquemos las operaciones con un servicio de base de datos MySQL para transacciones, análisis y aprendizaje automático (ML), eliminando la complejidad y el costo de servicios independientes de base de datos de análisis, ML y ETL. ¡Increíble! ¿No es así? Quédate para descubrir todas las maravillas de esta solución.

Oracle ha presentado hoy MySQL HeatWave Lakehouse, una solución que permite a los clientes procesar y consultar cientos de terabytes de datos de almacenes de objetos en una variedad de formatos de archivos, como CSV y Parquet, así como copias de seguridad Aurora y Redshift. MySQL HeatWave Lakehouse es la adición más reciente a la cartera de MySQL HeatWave, el único servicio en la nube que combina procesamiento de transacciones, análisis, aprendizaje automático y automatización basada en aprendizaje automático en una única base de datos MySQL.

Oracle MySQL HeatWave Lakehouse

Gracias a la arquitectura de escalado horizontal paralelo masivo de MySQL HeatWave, MySQL HeatWave Lakehouse ofrece un rendimiento significativamente mejor que los servicios de bases de datos en la nube de la competencia para ejecutar consultas y cargar datos, como lo demuestran las comparativas estándar del sector.

Nuevas funcionalidades

Oracle también ha presentado nuevas funcionalidades de MySQL Autopilot que mejoran el rendimiento y facilitan el uso de MySQL HeatWave Lakehouse. MySQL HeatWave Lakehouse ya está disponible en versión beta para aquellos clientes que deseen probarlo, y su disponibilidad general está prevista para 1HCY23.

Clientes que han migrado desde AWS, Google y entornos locales han estado utilizando MySQL HeatWave para un amplio conjunto de casos de uso, incluido el análisis de marketing, en particular análisis en tiempo real del rendimiento de campañas publicitarias y análisis de datos de clientes para crear campañas eficaces. Entre los clientes que han migrado desde AWS se incluyen empresas líderes de los sectores de la automoción, las telecomunicaciones, el comercio minorista, la alta tecnología y la atención sanitaria.

¿Qué es MySQL HeatWave Lakehouse de Oracle?

“MySQL HeatWave es el resultado de años de investigación y desarrollo avanzado que estamos transformando en innovaciones revolucionarias a fin de abordar un amplio conjunto de desafíos para todos los clientes de MySQL. De hecho, MySQL HeatWave Lakehouse es la tercera gran novedad que anunciamos este año con respecto a SQL HeatWave”, apunta Edward Screven, arquitecto corporativo jefe de Oracle. “El volumen de datos almacenados fuera de bases de datos está creciendo de forma sustancial y de la mano de MySQL HeatWave Lakehouse, los clientes pueden aprovechar todas las ventajas de HeatWave en los datos que residen en almacenes de objetos. Ahora, MySQL HeatWave ofrece un servicio integrado en múltiples nubes para el procesamiento de transacciones, el análisis de distintos almacenes de datos y lagos de datos, y el aprendizaje automático sin extracción, transformación y carga (ETL). Esta combinación aporta extraordinarias mejoras en el rendimiento, la automatización y los costes, y brinda una ventaja aún mayor a MySQL HeatWave con respecto a otros servicios de bases de datos en la nube”.

“Nos alegra proseguir nuestra colaboración con Oracle contribuyendo a su evolución para respaldar su nueva oferta de MySQL HeatWave Lakehouse, que está optimizada para ejecutarse en instancias en la nube de Oracle basadas en AMD EPYC, y aprovechar las últimas innovaciones de nuestros procesadores”, señala Mark Papermaster, director de Tecnología vicepresidente ejecutivo de AMD. “El trabajo conjunto de los equipos de ingeniería de AMD y Oracle ha permitido crear una impresionante solución de MySQL que ofrece gran escalabilidad y rendimiento para el procesamiento de transacciones, el análisis, el aprendizaje automático y la automatización basada en aprendizaje automático dentro de una única base de datos MySQL”.

Oracle también ha publicado nuevas pruebas de rendimiento de lakehouse y presentado varias funcionalidades innovadoras para MySQL HeatWave Lakehouse y MySQL Autopilot.

Pruebas de rendimiento

  • Más rápido que Snowflake y Amazon Redshift, tanto en rendimiento de consulta como en carga de datos

Como demuestra una la prueba de rendimiento TPC-H* en la categoría de 400 TB (totalmente transparente y disponible públicamente), el rendimiento de consulta de MySQL HeatWave Lakehouse es:

  • 17 veces más rápido que el de Snowflake 
  • 6 veces más rápido que el de Amazon Redshift 

Carga de datos

La carga de datos de almacenes de objetos en MySQL HeatWave Lakehouse también es significativamente más rápida. Para una carga de trabajo de 400 TB, la prueba de rendimiento TPC-H* demuestra que el rendimiento de carga de MySQL HeatWave Lakehouse es:

  • 8 veces más rápido que el de Amazon Redshift 
  • 2,7 veces más rápido que el de Snowflake 

Todos estos scripts de comparación del rendimiento completamente transparentes están disponibles en GitHub para que los clientes los repliquen.

“MySQL HeatWave Lakehouse se lo pone difícil a la competencia abriendo camino hacia el territorio hasta ahora inexplorado de las pruebas de rendimiento de bases de datos en la nube de 400 TB a velocidades sin precedentes”, apunta Ron Westfall, analista sénior y director de Investigación de Futurum Research. “MySQL HeatWave Lakehouse supone un gran avance para HeatWave en términos de capacidad de procesamiento y potencia informática: de 32 TB y 64 nodos a 400 TB y 512 nodos, con un rendimiento y una relación precio-rendimiento que superan los de Amazon Redshift y Snowflake. Mientras tanto, los competidores de la industria de bases de datos en la nube aún no han dado respuesta a la convergencia en la base de datos y la presencia en múltiples nubes de MySQL HeatWave. ¿Cómo podrán hacer frente al lakehouse de 400 TB de MySQL HeatWave?”

Te recomendamos: Oracle y TELMEX ofrecerán servicios Oracle Cloud Infrastructure en todo México

Nuevas prestaciones innovadoras de MySQL HeatWave Lakehouse

  • Mayor volumen de datos, sintaxis MySQL estándar: Los clientes pueden consultar hasta 400 TB de datos con MySQL HeatWave Lakehouse y el clúster de HeatWave se escala a 512 nodos. Los clientes pueden utilizar sintaxis MySQL estándar para consultar los datos.
  • Rendimiento y compresión idénticos: MySQL HeatWave ofrece el mismo rendimiento de consulta para los datos almacenados en bases de datos MySQL o almacenes de objetos, como demuestran las pruebas de rendimiento TPC-H para 10 TB y 30 TB. Además, el volumen de compresión alcanzado y la cantidad de datos procesable por nodo es la misma en ambos casos.
  • Compatibilidad con múltiples formatos de archivo: Con MySQL HeatWave Lakehouse, los clientes pueden cargar y procesar datos almacenados en diversos formatos de archivo, como CSV y Parquet, así como copias de seguridad Aurora y Redshift de AWS. Esto permite a los clientes disfrutar de las ventajas de MySQL HeatWave incluso cuando sus datos no se almacenan dentro de una base de datos MySQL. El rendimiento de consulta es el mismo independientemente del formato de archivo en el que se almacenen los datos.
  • Capacidad para consultar datos en MySQL y combinarlos con datos de almacenes de objetos: Con MySQL HeatWave Lakehouse, los clientes pueden consultar sus datos de procesamiento de transacciones en línea (OLTP) almacenados en bases de datos MySQL y combinarlos con datos almacenados en almacenes de objetos. Cualquier cambio realizado en los datos de procesamiento de transacciones en línea (OLTP) se actualiza en tiempo real y se refleja en el resultado de la consulta.

Nuevas presentaciones de MySQL Autopilot para MySQL HeatWave Lakehouse

MySQL Autopilot proporciona automatización basada en el aprendizaje automático para MySQL HeatWave. Prestaciones ya existentes de Autopilot MySQL como el aprovisionamiento automático y la mejora automática de los planes de consulta se han mejorado en MySQL HeatWave Lakehouse, lo que reduce aún más la sobrecarga que suponen las tareas de administración de bases de datos y optimiza el rendimiento. Además, se ha agregado una serie de nuevas prestaciones MySQL Autopilot a MySQL HeatWave Lakehouse.

  • Inferencia automática de esquemas: Autopilot infiere automáticamente la asignación de los datos de los archivos a los tipos de datos de la base de datos. De este modo, los clientes no necesitan especificarla manualmente para cada nuevo archivo que consulte MySQL HeatWave Lakehouse, lo que ahorra tiempo y esfuerzo.
  • Muestreo de datos adaptativo: Autopilot toma muestras de partes de archivos del almacenamiento de objetos de forma inteligente, recopilando estadísticas precisas con un acceso mínimo a los datos. MySQL HeatWave utiliza estas estadísticas para generar y mejorar planes de consulta, determinar la asignación de esquema óptima y para otros fines.
  • Carga automática: Autopilot analiza los datos para predecir el tiempo de carga en MySQL HeatWave. Determina la asignación de los tipos de datos y genera automáticamente los scripts de carga. Los usuarios no tienen que especificar manualmente la asignación de archivos a esquemas de base de datos y tablas.
  • Flujo de datos adaptativo: MySQL HeatWave Lakehouse se adapta dinámicamente al rendimiento del almacén de objetos subyacente. De esta forma, MySQL HeatWave puede obtener el máximo rendimiento disponible de la infraestructura en la nube subyacente. Lo que mejora el rendimiento general, la relación precio-rendimiento y la disponibilidad.

Mejoras adicionales de MySQL HeatWave

Oracle ha anunciado otra serie de mejoras de MySQL HeatWave que abarcan desde el aprendizaje automático hasta el plug-in VS Code Las prestaciones de aprendizaje automático en la base de datos de MySQL HeatWave se han ampliado aún más para incluir soporte para modelos de previsión. Asimismo, se han agregado nuevas técnicas de explicación de aprendizaje automático optimizadas para MySQL HeatWave. Ahora, los científicos de datos pueden influir en varias etapas del pipeline de entrenamiento de HeatWave ML. Incluida la elección del algoritmo, la selección de funciones, la métrica de puntuación y la técnica de explicación. HeatWave ML también se ha mejorado para permitir a los clientes importar modelos de aprendizaje automático a HeatWave.

Un nuevo optimizador de consultas Hypergraph de varios motores mejora aún más el rendimiento de las consultas complejas y elimina la necesidad de especificar el orden de unión. Se ha agregado un mapa de zonas, lo que acelera un conjunto aún más amplio de consultas con MySQL HeatWave. Además, el plug-in VS Code de MySQL se ha mejorado para admitir las prestaciones de MySQL HeatWave.

Preparado para la nube distribuida

MySQL HeatWave está disponible en una variedad de nubes, incluidas OCI, AWS y ahora Microsoft Azure. También está disponible en las instalaciones como parte de la Zona privada de OCI para organizaciones que no pueden mover sus cargas de trabajo de base de datos a la nube pública. Además, los clientes pueden replicar datos de aplicaciones de procesamiento de transacciones en línea (OLTP) de MySQL locales a MySQL HeatWave para análisis casi en tiempo real. MySQL HeatWave siempre se ejecuta en la última versión de la base de datos MySQL.

Artículos relacionados

Este sitio web utiliza cookies para mejorar su experiencia. Asumimos que está de acuerdo al seguir navegando. Aceptar Leer más