Spark

La Fondation logicielle ApacheTraitement des données

Apache Spark est un moteur d’analyse unifié pour le traitement de données à grande échelle. Il fournit des API de haut niveau en Java, Scala, Python et R, ainsi qu’un moteur optimisé prenant en charge les graphiques d’exécution généraux. Il prend également en charge un riche ensemble d’outils de niveau supérieur, notamment Spark SQL pour SQL et le traitement de données structurées, MLlib pour l’apprentissage automatique, GraphX pour le traitement de graphiques et Structured Streaming pour le calcul incrémentiel et le traitement de flux.

Caractéristiques

Vitesse de traitement ultra-rapide

Facilité d’utilisation

Il offre un support pour des analyses sophistiquées

Traitement du flux en temps réel

C’est flexible

Communauté active et en expansion

Site officiel

Tutoriel et documentation

Enter your contact information to continue reading