Databricks presenta Delta Sharing, una herramienta de código abierto para compartir datos – lasnoticiases

Author

Categories

Share

Databricks lanzó hoy su quinto proyecto de código abierto, una nueva herramienta llamada Delta Sharing diseñado para ser una forma neutral del proveedor para compartir datos con cualquier infraestructura de nube o producto SaaS, siempre que tenga el conector adecuado. Es parte del código abierto más amplio de Databricks. Proyecto Delta Lake.

Como señala el CEO Ali Ghodsi, los datos se están disparando y mover datos del punto A al punto B es un problema cada vez más difícil de resolver con herramientas patentadas. “La barrera número uno para que las organizaciones tengan éxito con los datos es compartir datos, compartirlos entre diferentes puntos de vista, compartirlos entre organizaciones; ese es el problema número uno que hemos visto en las organizaciones”, explicó Ghodsi.

Delta Sharing es un protocolo de código abierto diseñado para resolver ese problema. “Este es el primer protocolo abierto de la industria, un estándar abierto para compartir un conjunto de datos de forma segura. […] Pueden estandarizar en Databricks o en algo más. Por ejemplo, es posible que se hayan estandarizado en el uso de AWS Data Exchange, Power BI o Tableau, y luego pueden acceder a esos datos de forma segura “.

La herramienta está diseñada para funcionar con múltiples infraestructuras en la nube y servicios SaaS y, desde el principio, hay varios socios involucrados, incluidos los tres grandes proveedores de infraestructura en la nube Amazon, Microsoft y Google, así como proveedores de visualización y gestión de datos como Qlik, Starburst, Collibra. y proveedores de datos y Alation como Nasdaq, S&P y Foursquare

Ghodsi dijo que la clave para que esto funcione es la naturaleza abierta del proyecto. Al hacer eso y donarlo a The Linux Foundation, está tratando de asegurarse de que pueda funcionar en diferentes entornos. Otro gran aspecto de esto son las asociaciones y las empresas involucradas. Cuando puede lograr que empresas de renombre se involucren en un proyecto como este, es más probable que tenga éxito porque funciona en este amplio conjunto de servicios populares. De hecho, hay varios conectores disponibles en la actualidad, pero Databricks espera que ese número aumente con el tiempo a medida que los contribuyentes creen más conectores para otros servicios.

Databricks opera con un modelo de precios de consumo muy parecido a Snowflake, lo que significa que cuantos más datos mueva a través de su software, más dinero generará, pero la herramienta Delta Sharing significa que puede compartir con cualquier persona, no solo con otro cliente de Databricks. Ghodsi dice que la naturaleza de código abierto de Delta Sharing significa que su empresa aún puede ganar, al tiempo que brinda a los clientes más flexibilidad para mover datos entre servicios.

A los proveedores de infraestructura también les encanta este modelo porque las herramientas del lago de datos en la nube mueven cantidades masivas de datos a través de sus servicios y también ganan dinero, lo que probablemente explica por qué todos están de acuerdo con esto.

Uno de los grandes temores de los clientes de la nube moderna es estar ligados a un solo proveedor, como solían estarlo en la década de 1990 y principios de la de 2000, cuando la mayoría de las empresas compraban una pila de servicios de un solo proveedor como Microsoft, IBM u Oracle. Por un lado, tenía la verdadera garganta única para ahogarse, pero estaba en deuda con el vendedor porque el costo de mudarse a otro era prohibitivamente alto. Las empresas no quieren volver a estar encerradas de esa manera y las herramientas de código abierto son una forma de evitarlo.

Databricks se fundó en 2013 y ha recaudado casi $ 2 mil millones desde entonces. La última ronda fue en febrero por $ 1 mil millones con una valoración de $ 28 mil millones, una cifra asombrosa para una empresa privada. Snowflake, un competidor principal, salió a bolsa en septiembre pasado. A la fecha, tiene una capitalización de mercado de más de $ 66 mil millones.

Author

Share