Delta Lake

Communauté d’assistance GitHub Gestion des données

Delta Lake est un projet open source qui permet de créer une architecture Lakehouse au-dessus des lacs de données. Delta Lake fournit des transactions ACID, une gestion évolutive des métadonnées et unifie le traitement des données en streaming et par lots au-dessus des lacs de données existants, tels que S3, ADLS, GCS et HDFS.

Caractéristiques

1. Transactions ACID

2. Gestion évolutive des métadonnées

3. Voyage dans le temps (version des données)

4. Format ouvert

5. Source et récepteur unifiés de lots et de streaming

6. Application du schéma

7. Évolution du schéma

8. Historique d’audit

9. Mises à jour et suppressions

10. 100 % Compatible avec l’API Apache Spark

11. Delta partout

Site officiel

Tutoriel et documentation

Enter your contact information to continue reading