https://cdn.sanity.io/images/e2r40yh6/production-i18n/d9b4779d50ae9dce77f7f510c0c879240109ed16-2438x694.png

Esta publicación de blog es la siguiente en la serie de publicaciones de blog de la Plataforma de Datos Componible (CDP). La publicación anterior, 

, entró en los detalles de la re-arquitectura de stellar-ETL usando CDP y sus beneficios. Esta publicación explica cómo hicimos la reingestión de Horizon 

El tamaño de los datos de Horizon es enorme y es impráctico para cada instancia almacenar toda la historia de la red. La mayoría de las instancias de Horizon, incluidas las alojadas por Stellar Development Foundation (SDF), están configuradas con una ventana de retención específica–recomendamos 30 días– para gestionar el tamaño de los datos.

Sin embargo, hay escenarios en los que podrías querer recuperar y procesar datos de libros mayores fuera de esta ventana de retención. Horizon admite esto a través de un proceso llamado reingestión, que recupera y reprocesa datos históricos del libro mayor de Stellar.

Hay varias situaciones clave en las que un usuario de Horizon podría necesitar realizar la reingestión:

 Para los usuarios que quieren rellenar datos dentro de su ventana de retención, la reingestión se puede usar para hidratar su base de datos con datos antiguos del libro mayor.

 La reingestión se puede usar para recuperar datos fuera de la ventana de retención, como para auditorías o propósitos de reconciliación.

Después de una pausa en las operaciones:

 Si una instancia de Horizon ha estado inactiva por un período, la reingestión puede ser necesaria para actualizarla, ya que puede ser más rápida y eficiente que usar la ingesta en vivo para ponerse al día con el estado actual de la red.

Antecedentes

Qué es la Reingestión

La reingestión es tanto consumidora de tiempo como de recursos, tomando varios días para procesar solo un mes de historia reciente del libro mayor y meses para reprocesar toda la historia.

El proceso es exigente porque depende de Captive Core para recuperar y procesar los datos del libro mayor.

Declaración del Problema

Arquitectura actual

Central para CDP es el lago de datos de metadatos precalculados del libro mayor. Para detalles sobre cómo crear este lago de datos usando Galaxie, consulta la 

Introducción a Galexie: Extracción y Almacenamiento Eficiente de Datos de Stellar

Ingerir datos desde el lago de datos es significativamente más rápido. Lo que normalmente tomaría meses para reingerir ahora toma solo unos días.

Esta mejora de velocidad se debe a dos factores principales:

No hay tiempo de inicio de Captive Core (no es necesario descargar archivos de historial para construir el estado local).

No es necesario reproducir los libros mayores para calcular los metadatos del libro mayor.

Los metadatos del libro mayor están disponibles para descarga directa desde Google Cloud Storage (GCS). Cada archivo está comprimido, lo que lo hace muy pequeño, por lo que se requiere un ancho de banda de red mínimo.

Para acomodar la nueva arquitectura, el comando de reingestión de la base de datos de Horizon 

 ahora admite la reingestión desde el almacén de datos. Lo invocas de manera similar a como lo harías para Captive Core, pero con configuración adicional para el almacén de datos, como especificar la dirección del bucket y el esquema de datos. Para detalles del comando y configuración sobre el uso de CDP para la reingestión, consulta la guía de reingestión 

Solución

Nueva arquitectura

Para evaluar el rendimiento de la reingestión de Captive Core y CDP, realizamos pruebas bajo la siguiente configuración de hardware:

Horizon admite la reingestión paralela, lo que significa que el rango de reingestión se divide en subrangos e ingiere simultáneamente. Queríamos evaluar el nivel de paralelización alcanzable con ambos métodos (Captive Core y CDP). Así que reingerimos 10,000 libros mayores usando ambos métodos con niveles variables de paralelización y estos son los resultados:

 El rendimiento estaba limitado por el I/O de disco y mostró rendimientos decrecientes con más de cuatro trabajadores.

 En contraste, CDP logró una mejor paralelización, con resultados óptimos usando 16 trabajadores.

Para detalles sobre la configuración de la ingesta paralela, consulta la 

Usando la mejor configuración paralela, estimamos el tiempo para reingerir 10,000 libros mayores. Sin embargo, los libros mayores antiguos son menos densos que los recientes, por lo que se requiere menos tiempo para reingerir datos antiguos. Para confirmar esto, muestreamos 10,000 libros mayores de cada año desde la creación de la red Stellar y extrapolamos el tiempo requerido para reingerir toda la historia.

Los resultados muestran que la reingestión usando Captive Core se proyecta que tomará aproximadamente

, mientras que el CDP (con metadatos de libros mayores precalculados) se espera que tome alrededor de 

Comparación de Rendimiento: Captive Core vs. CDP:

En esta evaluación, Captive Core corrió con 2 trabajadores paralelos, mientras que CDP corrió con 16 trabajadores paralelos.

Evaluación de Rendimiento

Captive Core vs. CDP

Con CDP, la reingestión de Horizon es ahora hasta 9x más rápida, reduciendo los tiempos de procesamiento en más del 85%. Sin embargo, incluso con estas mejoras, usar Horizon para servir datos históricos completos requiere cantidades masivas de almacenamiento—alrededor de 40 TB y creciendo rápidamente. En la mayoría de los casos, construir tus propias aplicaciones usando CDP ofrece un camino mejor hacia adelante.

Los metadatos de libros mayores precalculados de CDP te permiten construir un conjunto de datos personalizado mucho más pequeño. Y si estás buscando reingerir grandes cantidades de datos para poblar tu nuevo conjunto de datos, CDP proporciona a tu aplicación enormes beneficios de rendimiento, haciéndolo ideal para crear aplicaciones eficientes y enfocadas.

Esto hace de CDP un cambio de juego para cualquiera que quiera construir aplicaciones flexibles y escalables más allá de Horizon. ¡Te animamos a explorar todo lo que CDP ofrece para tus propias necesidades de datos!

Building Applications with Stellar Composable Data Platform (CDP)

Conclusión

CDP es Más Rápido y Eficiente

Este artículo es el primero de una serie expansiva sobre la Plataforma de Datos Componible, la próxima generación de plataforma de acceso a datos en Stellar. La Plataforma de Datos Componible (en adelante referida como CDP) es una colección de herramientas y bibliotecas de código abierto que trabajan juntas para agilizar el acceso a datos para el ecosistema Stellar. 

Plataforma de Datos Componible: Una Nueva Forma de Acceder a Datos en Stellar

Galexie es el primer componente de la Plataforma de Datos Componible de Stellar, la próxima generación de plataforma de acceso a datos. Galexie es una aplicación ligera que extrae datos de libros contables de la red de Stellar.


Introduciendo Galexie: Extraer y Almacenar Datos de Stellar de Manera Eficiente

Aprende cómo Stellar ETL, que ha sido refactorizado para usar la suite completa de beneficios de la Plataforma de Datos Componible (CDP), la próxima generación de plataforma de acceso a datos en Stellar. Este caso de estudio muestra lo rápido, barato y fácil de usar que es CDP para desarrolladores y proyectos.

Hubble: Ahora Más Rápido que la Luz

Más para ti

La Serie CDP

Entérate de nosotros primero. Suscríbete para obtener información en tiempo real sobre noticias, funcionalidades y recursos del ecosistema Stellar.

Solicitud inválida

El boletín hecho por desarrolladores, para desarrolladores. Aprende sobre nuevas actualizaciones técnicas y recursos disponibles para construir en la red de Stellar.

El boletín con algo para todos. Recibe actualizaciones regulares sobre anuncios de la red Stellar, eventos, asociaciones y más.

Al proporcionar la información de contacto requerida en este formulario, aceptas ser contactado por Stellar Development Foundation (SDF) para informarte sobre nuestros productos y servicios. Para más información sobre nuestras prácticas de privacidad o cómo darte de baja, por favor consulta nuestra 

Este sitio está protegido por reCAPTCHA y la Política de 

Los Boletines

Bienvenido a la comunidad. Te mantendremos informado. Si lo deseas, comienza con algunos de nuest

Gracias

EL CORREO QUE REALMENTE QUIERES LEER

Esta publicación explica cómo Horizon, la API HTTP para datos en la red Stellar, ahora puede reingerir datos 9x más rápido usando componentes de CDP.




La red Stellar es una blockchain open-source utilizada para una variedad de aplicaciones de pago y remesas. Saber más sobre la Stellar Development Foundation sin fines de lucro y los fundamentos de cómo funciona la red.

Aprender Stellar

La Fundación

Acerca de Stellar

Descubre cómo puedes usar la red Stellar y explora los muchos proyectos y aplicaciones que se están construyendo en ella hoy.

Stellar para

Explorar

Casos de Uso Reales

Sumérgete en la documentación o explora nuestros recursos para desarrolladores. Explora y solicita una variedad de programas de financiación.

Listo para Construir

Empezar a Crear

Stellar une a una comunidad global para crear una red abierta y transformar el sistema financiero global.

Conectar

Comunidad

Discord

LinkedIn

Twitter

Stellar, o Stellar Lumens, es un protocolo descentralizado de código abierto para transferencias de bajo costo de moneda digital a dinero fíat que permite transacciones transnacionales entre cualquier par de divisas.

Stellar

Horizon: Acelerando el Rendimiento de Reingestión con CDP 

If your preferred language is English, you can switch it in the menu.

Parece que tu idioma preferido es el español, si es así puedes cambiarlo aquí, también puedes cambiarlo en el menú.

Por favor, intenta de nuevo. Gracias por tu paciencia.

Error de búsqueda, ¡disculpas!

Por favor, intenta con un término de búsqueda diferente.

Application error: a client-side exception has occurred (see the browser console for more information).