Metacat

Netflix /MetacatCatalogue de données

Metacat est un catalogue de métadonnées et un référentiel de données flexible et open source qui cible les données scientifiques, en particulier celles de l’écologie et des sciences de l’environnement. Metacat accepte XML comme syntaxe commune pour représenter le grand nombre de normes de contenu de métadonnées pertinentes pour l’écologie et d’autres sciences. Ainsi, Metacat est une base de données XML générique qui permet le stockage, l’interrogation et la récupération de documents XML arbitraires sans connaissance préalable du schéma XML.

Metacat est conçu et implémenté comme une application de servlet Java qui utilise un système de gestion de base de données relationnelle pour stocker le XML et les informations de niveau méta associées. L’installation de Metacat recommande l’utilisation d’Apache Tomcat pour la gestion des servlets et de PostgreSQL comme SGBDR sous-jacent, bien que d’autres configurations soient possibles. Metacat fournit une interface de programmation d’application (API) client riche et prend en charge une variété de langages, notamment Java, Python et Perl.

Metacat est largement utilisé dans le monde entier pour gérer les données environnementales. Il s’agit d’un composant d’infrastructure clé pour le catalogue de données NCEAS, le catalogue de données Knowledge Network for Biocomplexity (KNB) et pour le système DataONE, entre autres.

Caractéristiques

* Abstraction des données et interopérabilité.

* Stockage de métadonnées commerciales et définies par l’utilisateur.

* Découverte de données.

* Audit et notifications de modifications de données.

* Optimisations du métastore Hive.

Site officiel

Tutoriel et documentation

Enter your contact information to continue reading