Hadoop

La Fondation logicielle ApacheTraitement des données

La bibliothèque logicielle Apache Hadoop est un framework qui permet le traitement distribué de grands ensembles de données sur des clusters d’ordinateurs à l’aide de modèles de programmation simples. Il est conçu pour passer d’un seul serveur à des milliers de machines, chacune offrant un calcul et un stockage locaux. Plutôt que de s’appuyer sur du matériel pour offrir une haute disponibilité, la bibliothèque elle-même est conçue pour détecter et gérer les pannes au niveau de la couche application, fournissant ainsi un service hautement disponible au-dessus d’un cluster d’ordinateurs, dont chacun peut être sujet à des pannes.

Caractéristiques

Hadoop est un cluster Open Source

Hadoop hautement évolutif.

Hadoop offre une tolérance aux pannes.

Hadoop offre une haute disponibilité

. Hadoop est très rentable.

Hadoop est plus rapide dans le traitement des données.

Hadoop est basé sur le concept de localisation des données

. Hadoop offre une faisabilité.

Site officiel

Tutoriel et documentation

Enter your contact information to continue reading