Examen du logiciel MLOps | Conception de systèmes d'IA

Une revue de plus de 250 outils et solutions MLOps

Cet outil gratuit vous aide à sélectionner les bons outils MLOps pour votre entreprise en fonction de l'examen de nos experts.

Luigi

Open source

Luigi est un package Python (testé 3.6, 3.7, 3.8, 3.9) qui vous aide à créer des pipelines complexes de tâches par lots. Il gère la résolution des dépendances, la gestion des flux de travail, la visualisation, la gestion des échecs, l’intégration de la ligne de commande et bien plus encore.

Metaflow

Open source

Metaflow est une bibliothèque Python conviviale qui aide les scientifiques et les ingénieurs à créer et à gérer des projets réels de science des données.

Kedro

Open source

Kedro est un framework Python open source permettant de créer du code de science des données reproductible, maintenable et modulaire.

Flyte

Open source

L’objectif principal de Flyte est d’augmenter la vitesse de développement pour le traitement des données et l’apprentissage automatique, permettant ainsi une exécution de calcul à grande échelle sans frais opérationnels.

MLRun

Open source

MLRun est une solution MLOps open source de bout en bout pour gérer et automatiser l’ensemble de vos analyses et apprentissage automatique

Couler

Open source

Couler vise à fournir une interface unifiée pour créer et gérer des flux de travail sur différents moteurs de flux de travail, tels qu’Argo Workflows, Tekton Pipelines et Apache Airflow.

Kale

Open source

KALE (Kubeflow Automated pipeLines Engine) est un projet qui vise à simplifier l’expérience Data Science du déploiement des workflows Kubeflow Pipelines.

Prefect

Commercial

Prefect est un nouveau système de gestion de flux de travail, conçu pour une infrastructure moderne et alimenté par le logiciel open source Prefect.

Automate Studio

Commercial

Les organisations qui se lancent dans des initiatives d’automatisation intelligente des processus peuvent rapidement créer et déployer des flux de travail basés sur l’IA et intégrer les informations qui en résultent dans les applications et processus métier.

ZenML

Open source

ZenML est un framework MLOps extensible et open source permettant de créer des pipelines d’apprentissage automatique prêts pour la production. Il a une syntaxe simple et flexible, est indépendant du cloud et des outils

Argo

Open source

Argo Workflows est un moteur de workflow open source natif de conteneur pour orchestrer des tâches parallèles sur Kubernetes. Argo Workflows est implémenté en tant que Kubernetes CRD (Custom Resource Definition).

Modin

Open source

Modin est un projet précoce du RISELab de l’UC Berkeley conçu pour faciliter l’utilisation de l’informatique distribuée pour la science des données.

MLlib

Open source

MLlib est la bibliothèque d’apprentissage automatique (ML) de Spark. Son objectif est de rendre l’apprentissage automatique pratique évolutif et simple. À un niveau élevé, il fournit des outils tels que

Yellowbrick

Open source

Yellowbrick est une suite d’outils de diagnostic visuel appelés « Visualiseurs » qui étendent l’API scikit-learn pour permettre un pilotage humain du processus de sélection du modèle.

Mahout

Open source

Apache Mahout(TM) est un cadre d’algèbre linéaire distribué et un Scala DSL mathématiquement expressif conçu pour permettre aux mathématiciens,

Netron

Open source

Netron est un visualiseur de modèles de réseaux neuronaux, d’apprentissage profond et d’apprentissage automatique.

Jax

Open source

JAX est Autograd et XLA, réunis pour une recherche en apprentissage automatique haute performance.

Horovod

Open source

Horovod a été initialement développé par Uber pour rendre l’apprentissage profond distribué rapide et facile à utiliser, réduisant ainsi le temps de formation des modèles

Manifold

Open source

Manifold est une plateforme de publication open source construite par des universitaires et des éditeurs. Il est réactif, accessible, intuitif, personnalisable et avisé. Avec Manifold, vous pouvez publier les documents que vous produisez déjà ou les utiliser pour construire quelque chose de nouveau avec vos collègues et étudiants

H2O-3

Commercial

H2O est une plateforme d’apprentissage automatique et d’analyse prédictive open source, en mémoire, distribuée, rapide et évolutive qui vous permet de créer des modèles d’apprentissage automatique sur le Big Data

Evidently

Evidently aide évidemment à évaluer et à surveiller les modèles d’apprentissage automatique en production. Il génère des rapports interactifs ou des profils JSON

Fiber

Open source

Fibre est un framework Web inspiré d’Express construit sur Fasthttp, le moteur HTTP le plus rapide pour Go. Conçu pour faciliter les choses pour

Weld

Open source

Weld est un compilateur et un runtime permettant d’améliorer les performances des applications gourmandes en données.

DeepSpeed

Open source

DeepSpeed est une bibliothèque d’optimisation du deep learning qui rend la formation distribuée simple, efficace et efficiente.

Dask

Open source

Dask est une bibliothèque flexible pour le calcul parallèle en Python. Dask est composé de deux parties :

Vulkan Kompute

Open source

Vulkan Kompute – Le cadre de calcul Vulkan à usage général. Ultra rapide, léger, compatible mobile et optimisé pour les cas d’utilisation avancés de traitement de données GPU.

CuPy

Open source

tableau multidimensionnel sur CUDA.

Vaex

Open source

Vaex est une bibliothèque Python pour les DataFrames Out-of-Core paresseux (similaires à Pandas), pour visualiser et explorer de grands ensembles de données tabulaires

CuML

Open source

cuML est une suite d’algorithmes d’apprentissage automatique rapides et accélérés par GPU, conçus pour la science des données et les tâches analytiques. Nos miroirs API

CuDF

Open source

cuDF est une bibliothèque Python GPU DataFrame (construite sur le format de mémoire en colonnes Apache Arrow) pour le chargement, la jointure, l’agrégation,

WhyLogs

Open source

Whylogs est un standard open source pour la journalisation des données et du ML l’agent de journalisation Whylogs est

Tpot

Open source

TPOT signifie Outil d’optimisation de pipeline basé sur un arbre. Considérez TPOT comme votre assistant de science des données. TPOT est un outil d’apprentissage automatique automatisé Python qui optimise les pipelines d’apprentissage automatique à l’aide de la programmation génétique.

Vespa

Open source

Vespa fournit une intégration de métriques avec CloudWatch, Datadog et Prometheus/Grafana, ainsi qu’une API HTTP JSON.

Triton Inference Server

Open source

Triton Inference Server fournit une solution d’inférence cloud et Edge optimisée pour les CPU et les GPU. Triton prend en charge un

Singa

Open source

Apache SINGA est un projet Apache de premier niveau, axé sur la formation distribuée de modèles d’apprentissage profond et d’apprentissage automatique.

Ray

Open source

Ray fournit une API simple et universelle pour créer des applications distribuées. Ray accomplit cette mission en :

Triton Inference Server

Open source

Triton Inference Server fournit une solution d’inférence cloud et Edge optimisée pour les CPU et les GPU. Triton prend en charge un protocole HTTP/REST et GRPC qui permet aux clients distants

TorchServe

Open source

TorchServe est un outil flexible et facile à utiliser pour servir les modèles PyTorch.

Rapids

Open source

La suite RAPIDS de bibliothèques de logiciels et d’API open source vous donne la possibilité d’exécuter des pipelines de science des données et d’analyse de bout en bout entièrement sur des GPU. Sous licence Apache 2.0, RAPIDS est incubé par NVIDIA® sur la base d’une vaste expérience en matière de matériel et de science des données.

TensorFlow Serving

Open source

TensorFlow Serving est un système de service flexible et hautes performances pour les modèles de machine learning, conçu pour les environnements de production.

Tempo

Open source

Tempo est un SDK python destiné aux data scientists pour les aider à mettre leurs modèles en production. Il a 4 objectifs principaux :

Petastorm

Open source

Petastorm est une bibliothèque d’accès aux données open source développée chez Uber ATG.

NumpyGroupies

Open source

Ce package consiste en une petite bibliothèque d’outils optimisés pour effectuer des choses qui peuvent être grossièrement considérées comme des « opérations d’indexation de groupe ».

Streamlit

Open source

Streamlit est une bibliothèque Python open source qui facilite la création et le partage de superbes applications Web personnalisées pour l’apprentissage automatique

Seldon

Commercial

Seldon core convertit vos modèles ML (Tensorflow, Pytorch, H2o, etc.) ou wrappers de langage

Numba

Open source

Numba est un compilateur pour les tableaux Python et les fonctions numériques qui vous donne le pouvoir d’accélérer vos applications avec des fonctions hautes performances écrites directement en Python.

Modin

Open source

Modin est un projet précoce du RISELab de l’UC Berkeley conçu pour faciliter l’utilisation de l’informatique distribuée pour la science des données. Il s’agit d’une bibliothèque Dataframe multiprocessus avec une API identique à Pandas qui permet aux utilisateurs d’accélérer leurs flux de travail Pandas.

Redis-AI

Open source

RedisAI est un module Redis permettant d’exécuter des modèles de Deep Learning/Machine Learning et de gérer leurs données. Son objectif est d’être un « cheval de bataille » pour servir de modèle, en fournissant

Model Server for Apache MXNet (MMS)

Open source

Multi Model Server (MMS) est un outil flexible et facile à utiliser pour servir des modèles d’apprentissage en profondeur formés à l’aide de n’importe quel framework ML/DL.

Merlin

Open source

Merlin est une plateforme de déploiement et de service de modèles d’apprentissage automatique. Le projet est né de la conviction que le déploiement du modèle doit être :

PredictionIO

Open source

Apache PredictionIO® est un serveur d’apprentissage automatique open source construit sur une pile open source de pointe pour les développeurs

m2cgen

Open source

m2cgen (Model 2 Code Generator) – est une bibliothèque légère qui fournit un moyen simple de transpiler des modèles statistiques entraînés dans un code natif (Python, C, Java, Go, JavaScript, Visual Basic, C#, PowerShell, R, PHP, Dart, Haskell, Ruby, Fa#, Rust).

KFServing

Open source

Le projet Kubeflow vise à rendre les déploiements de workflows d’apprentissage automatique (ML) sur Kubernetes simples, portables et évolutifs.

Jina

Open source

Jina🔊 est un framework de recherche neuronale qui permet à quiconque de créer des applications de recherche SOTA et d’apprentissage profond évolutives en quelques minutes.

Opyrator

Open source

Transformez instantanément vos fonctions Python en microservices prêts pour la production. Déployez et accédez à vos services via l’API HTTP ou l’interface utilisateur interactive. Exportez en toute transparence votre

OpenScoring

Open source

Service Web REST pour l’évaluation des modèles PMML. Openscoring est un service Java qui fournit une interface JSON REST à l’évaluateur Java Predictive Model Markup Language (PMML) JPMML.

Hydrosphere

Open source

Hydrosphere est une plateforme de déploiement, de gestion de versions et de surveillance de vos modèles d’apprentissage automatique en production. Il est indépendant du langage et du framework, avec la prise en charge de tous les principaux langages et frameworks de programmation – Python, Java, Tensorflow, Pytorch, etc.

GraphPipe

Open source

GraphPipe est un protocole et un ensemble de logiciels conçus pour simplifier le déploiement de modèles d’apprentissage automatique et le dissocier des implémentations de modèles spécifiques au framework.

ModelDB

Open source

ModelDB : un système open source pour la gestion des versions, des métadonnées et des expériences de modèles de Machine Learning.

ForestFlow

Open source

ForestFlow est un serveur de modèles d’apprentissage automatique cloud natif et basé sur des politiques évolutives. ForestFlow s’efforce de trouver un équilibre entre la flexibilité qu’il offre aux data scientists et l’adoption de normes tout en réduisant les frictions entre les équipes de science des données, d’ingénierie et d’exploitation.

Mlflow

Open source

MLflow est une plateforme open source permettant de gérer le cycle de vie du ML, y compris l’expérimentation, la reproductibilité, le déploiement et un registre central de modèles.

Keepsake

Open source

La bibliothèque Keepsake Python est utilisée pour créer des expériences et des points de contrôle dans votre train

Fiddler

Commercial

Progress® Telerik® Fiddler Everywhere est un outil de débogage Web qui surveille, inspecte, modifie et enregistre tout le trafic HTTP(S), émet des requêtes entre votre ordinateur et Internet et manipule les données entrantes et sortantes. Il s’agit d’un proxy multiplateforme hautes performances pour n’importe quel navigateur, système ou plate-forme.

Guild AI

Open source

Guild AI apporte un contrôle systématique à l’apprentissage automatique pour vous aider à mieux construire

Comet

Commercial

Comet permet aux data scientists et aux équipes de suivre, comparer, expliquer et optimiser les expériences et les modèles à travers le modèle.

Evidently

Open source

Evidently aide à évaluer et à surveiller les modèles d’apprentissage automatique en production. Il génère des rapports interactifs ou des profils JSON à partir de fichiers pandas DataFrames ou csv.

Aim

Open source

Aim est un outil de comparaison open source pour les expériences d’IA. Avec plus de ressources et de modèles complexes, plus d’expériences

DeepDetect

Open source

DeepDetect est une API et un serveur d’apprentissage profond écrits en C++11, ainsi qu’une pure plate-forme Web pour la formation et la gestion des modèles.

Cortex

Commercial

L’IA de Cortex analyse tout le contenu de :

Visual Studio Code

Commercial

Visual Studio Code est un éditeur de code source léger mais puissant qui s’exécute sur votre bureau et est disponible pour Windows, macOS

BudgetML

Open source

BudgetML est parfait pour les praticiens qui souhaitent déployer rapidement leurs modèles sur un point final, sans perdre beaucoup de temps, d’argent et d’efforts à essayer de comprendre comment le faire de bout en bout.

Thonny

Open source

Thonny est un environnement de développement intégré pour Python conçu pour les débutants. Il prend en charge différentes façons de marcher

BentoML

Open source

BentoML est un framework flexible et hautes performances permettant de servir, de gérer et de déployer des modèles d’apprentissage automatique.

Spyder

Open source

Spyder est un puissant environnement scientifique écrit en Python, pour Python, et conçu par et pour des scientifiques, ingénieurs et

Backprop

Open source

Backprop est une plate-forme de modèles sans serveur qui permet aux développeurs d’utiliser facilement des modèles d’apprentissage automatique dans n’importe quelle application.

Rstudio

Commercial

RStudio est un environnement de développement intégré (IDE) pour R. Il comprend un

XAI – eXplainableAI

Open source

XAI est une bibliothèque d’apprentissage automatique conçue avec l’explicabilité de l’IA en son cœur. XAI contient divers outils permettant l’analyse et l’évaluation des données et des modèles.

Pycharm

Commercial

PyCharm est un environnement de développement intégré (IDE) dédié à Python fournissant une large gamme d’outils essentiels pour Python.

woe

Open source

Outils de transformation WoE principalement utilisés dans le modèle ScoreCard pour la notation de crédit

TreeInterpreter

Open source

Package pour interpréter l’arbre de décision de scikit-learn et les prédictions forestières aléatoires.

themis-ml

Open source

themis-ml définit la discrimination comme la préférence (préjugé) pour ou contre un ensemble de groupes sociaux qui entraîne un traitement injuste de ses membres par rapport à un certain résultat.

Themis

Open source

Themis est une bibliothèque open source de services cryptographiques de haut niveau permettant de sécuriser les données lors de l’authentification, du stockage, de la messagerie, des échanges réseau, etc.

tensorflow’s Model Analysis

Open source

TensorFlow Model Analysis (TFMA) est une bibliothèque permettant d’évaluer les modèles TensorFlow.

tensorflow’s lucid

Open source

Lucid est un ensemble d’infrastructures et d’outils pour la recherche sur l’interprétabilité des réseaux neuronaux.

Tensorflow’s cleverhans

Open source

Ce référentiel contient le code source de CleverHans, une bibliothèque Python permettant d’évaluer la vulnérabilité des systèmes d’apprentissage automatique face à des exemples contradictoires. Vous pouvez en savoir plus sur ces vulnérabilités sur le blog ci-joint.

Eclipse

Open source

La Fondation Eclipse offre à notre communauté mondiale d’individus et d’organisations un environnement mature, évolutif et convivial pour les logiciels open source.

Tensorboard’s Tensorboard WhatIf

Open source

L’outil What-If (WIT) fournit une interface facile à utiliser pour approfondir la compréhension des modèles ML de classification et de régression par boîte noire.

Atom

Open source

Atom est un éditeur de texte piratable pour le 21e siècle, construit sur Electron et basé sur tout ce que nous aimons de nos éditeurs préférés

Snitch ai

Commercial

Validation scientifique automatisée de vos modèles ML en quelques clics.

Skater

Open source

Skater est un cadre unifié permettant l’interprétation de modèles pour toutes les formes de modèles afin d’aider à créer un système d’apprentissage automatique interprétable souvent nécessaire pour les cas d’utilisation du monde réel (** nous travaillons activement à permettre une interprétabilité fidèle pour tous les modèles de formes).

Anaconda

Commercial

Anaconda Individual Edition est un gestionnaire de packages, un gestionnaire d’environnement et une distribution Python gratuits et faciles à installer avec un

SHAPash – Shapash est une bibliothèque Python qui fournit plusieurs types de visualisation affichant des étiquettes explicites que tout le monde peut comprendre.

Open source

Shapash est une bibliothèque Python qui vise à rendre le machine learning interprétable et compréhensible par tous. Il propose plusieurs types de visualisation qui affichent des étiquettes explicites que tout le monde peut comprendre.

JSON Schema

Open source

JSON Schema est un vocabulaire qui vous permet d’annoter et de valider des documents JSON.

Great Expectations

Open source

Great Expectations est le principal outil de validation, de documentation et de profilage

SHAP

Open source

SHAP (SHapley Additive exPlanations) est une approche de la théorie des jeux pour expliquer le résultat de tout modèle d’apprentissage automatique.

SAGE

Open source

Sage est un projet open source et totalement gratuit.

responsibly

Open source

Boîte à outils pour auditer et atténuer les biais et l’équité des systèmes d’apprentissage automatique.

rationale

Open source

La justification est inspirée de RamdaJS. Il s’agit d’un ensemble de fonctions utilitaires d’assistance absentes de la bibliothèque standard OCaml/ReasonML.

pyBreakDown

Open source

La méthode Break Down est déplacée vers le package Dalex Python qui est activement maintenu

Cerberus

Open source

Cerberus fournit une fonctionnalité de validation de données puissante, simple et légère, prête à l’emploi et est conçue pour être facilement

NETRON

Open source

Netron est un visualiseur de modèles de réseaux neuronaux, d’apprentissage profond et d’apprentissage automatique.

mljar-supervised

Open source

Le mljar-supervisé est un package Python d’apprentissage automatique automatisé qui fonctionne avec des données tabulaires. Il est conçu pour faire gagner du temps à un data scientist 😎.

Spark Streaming

Open source

Spark Streaming est une extension de l’API Spark principale qui permet un traitement de flux évolutif, à haut débit et tolérant aux pannes.

MindsDB

Open source

MindsDB permet des fonctionnalités prédictives avancées directement dans votre base de données.

Lucid

Open source

Lucid est un ensemble d’infrastructures et d’outils pour la recherche sur l’interprétabilité des réseaux neuronaux.

Kafka Streams

Open source

Apache Kafka est une plateforme de streaming d’événements distribués open source utilisée par des milliers d’entreprises pour des performances élevées.

LOFO Importance

Open source

LOFO (Leave One Feature Out) Importance calcule l’importance d’un ensemble de fonctionnalités en fonction d’une métrique de choix, pour un modèle de choix, en supprimant de manière itérative chaque fonctionnalité de l’ensemble et en évaluant les performances du modèle, avec un schéma de validation. de choix, en fonction de la métrique choisie.

IBM Stream Analytics

Commercial

IBM® Streaming Analytics for IBM Cloud est optimisé par IBM® Streams, une plateforme analytique avancée que vous pouvez utiliser pour ingérer, analyser et corréler les informations à mesure qu’elles arrivent de différents types de sources de données en temps réel.

LIME

Open source

Ce projet vise à expliquer ce que font les classificateurs (ou modèles) d’apprentissage automatique.

Google Cloud DataFlow

Commercial

Google Cloud Dataflow est un service entièrement géré permettant d’exécuter des pipelines Apache Beam au sein de l’écosystème Google Cloud Platform.

Lightly

Open source

Lightly est un style de thème fork of Breeze qui vise à être visuellement moderne et minimaliste.

L2X

Open source

Code pour reproduire les expériences dans l’article Learning to Explain: An Information-Theoretic Perspective on Model Interpretation at ICML 2018, par Jianbo Chen, Mitchell Stern, Martin J. Wainwright, Michael I. Jordan.

Faust

Open source

Faust est une bibliothèque de traitement de flux, transférant les idées de Kafka Streams vers Python.

Brooklin

Open source

Brooklin est un système distribué destiné au streaming de données entre divers systèmes sources et destinations hétérogènes.

Azure Stream Analytics

Commercial

Azure Stream Analytics est un moteur d’analyse en temps réel et de traitement d’événements complexes conçu pour analyser et traiter des données élevées.

Apache Samza

Open source

Apache Samza est un moteur de traitement de données évolutif qui vous permet de traiter et d’analyser vos données en temps réel.

Apache Flink

Open source

Apache Flink est un framework et un moteur de traitement distribué pour les calculs avec état sur des surfaces illimitées et limitées.

Amazon Kinesis

Commercial

Amazon Kinesis facilite la collecte, le traitement et l’analyse des données en streaming en temps réel afin que vous puissiez obtenir des informations en temps opportun et réagir rapidement.

Talend Open Studio for Data Integration

Commercial

Talend Open Studio for Data Integration est un logiciel téléchargeable gratuitement pour démarrer vos premiers projets d’intégration de données et ETL.

Spark

Open source

Apache Spark est un moteur d’analyse unifié pour le traitement de données à grande échelle. Il fournit des API de haut niveau en Java, Scala, Python et R,

Snakemake

Open source

Le système de gestion de flux de travail Snakemake est un outil permettant de créer des analyses de données reproductibles et évolutives. Les flux de travail sont décrits via un texte lisible par l’homme

keras-vis

Open source

keras-vis est une boîte à outils de haut niveau pour visualiser et déboguer vos modèles de réseaux neuronaux keras formés.

SETL

Open source

SETL (prononcé « settle ») est un framework Scala ETL optimisé par Apache Spark qui vous aide à structurer vos projets Spark ETL,

InterpretML

Open source

InterpretML est un package open source qui intègre des techniques d’interprétabilité d’apprentissage automatique de pointe sous un même toit.

Prefect Core

Open source

La bibliothèque Python parfaite comprend tout ce dont vous avez besoin pour concevoir, créer, tester et exécuter de puissantes applications de données. Mettez à niveau instantanément

PipelineX

Open source

PipelineX : package Python pour créer des pipelines ML pour l’expérimentation avec Kedro, MLflow, etc.

Integrated-Gradients

Open source

Integrated Gradient (IG) calcule le gradient de la sortie de prédiction du modèle par rapport à ses caractéristiques d’entrée et ne nécessite aucune modification du réseau neuronal profond d’origine.

Oozie

Open source

Oozie v3 est un moteur de bundle basé sur serveur qui fournit une abstraction oozie de niveau supérieur qui regroupera un ensemble d’applications coordinatrices.

iNNvestigate

Open source

Ces dernières années, les réseaux de neurones ont fait progresser l’état de l’art dans de nombreux domaines comme par exemple la détection d’objets et la reconnaissance vocale.

Neuraxle

Open source

Neuraxle est une bibliothèque d’apprentissage automatique (ML) permettant de créer des pipelines d’apprentissage automatique.

Metaflow

Open source

Metaflow est une bibliothèque Python conviviale qui aide les scientifiques et les ingénieurs à créer et à gérer des projets réels de science des données.

IBM AI Fairness 360

Open source

AI Fairness 360, un projet d’incubation de LF AI, est une boîte à outils open source extensible qui peut aider les utilisateurs à examiner, signaler et atténuer la discrimination et les biais dans les modèles d’apprentissage automatique tout au long du cycle de vie des applications d’IA.

IBM AI Explainability 360

Open source

La boîte à outils AI Explainability 360, un projet d’incubation de la LF AI Foundation, est une bibliothèque open source qui prend en charge l’interprétabilité et l’explicabilité des ensembles de données et des modèles d’apprentissage automatique.

Luigi

Open source

L’objectif de Luigi est de traiter toute la plomberie généralement associée aux processus par lots de longue durée.

Kedro

Open source

Kedro est un framework Python open source permettant de créer du code de science des données reproductible, maintenable et modulaire.

GEBI

Open source

Explications globales pour l’identification des biais. Avec notre méthode proposée, nous avons identifié quatre clusters différents.

Informatica Power Center

Commercial

PowerCenter est une base évolutive et hautes performances pour les initiatives d’intégration de données sur site, notamment les

FairML

Commercial

FairML est une boîte à outils Python vérifiant les biais des modèles d’apprentissage automatique.

Hadoop

Open source

La bibliothèque logicielle Apache Hadoop est un framework qui permet le traitement distribué de grands ensembles de données sur des clusters d’ordinateurs à l’aide de modèles de programmation simples.

Fairlearn

Open source

Fairlearn est un package Python qui permet aux développeurs de systèmes d’intelligence artificielle (IA) d’évaluer l’équité de leur système et d’atténuer tout problème d’injustice observé.

FACETS

Open source

Le projet Facets contient deux visualisations pour comprendre et analyser les ensembles de données d’apprentissage automatique : Facets Overview et Facets Dive.

Gokart

Open source

Gokart résout la reproductibilité, les dépendances des tâches, les contraintes d’un bon code et la facilité d’utilisation du Machine Learning Pipeline.

Genie

Open source

GenieAnalytics offre une capacité d’analyse Big Data approfondie et puissante qui fournit des informations opérationnelles immédiates pour votre entreprise.

Flyte

Open source

La plateforme d’automatisation des flux de travail pour les données complexes et critiques et les processus de ML à grande échelle

Dagster

Open source

Dagster est un orchestrateur de données. Il vous permet de définir des pipelines (DAG) en termes de flux de données

Couler

Open source

Couler vise à fournir une interface unifiée pour construire et gérer des workflows sur différents moteurs de workflow,

Bonobo

Open source

Bonobo est un framework ETL (Extract-Transform-Load) léger pour Python 3.5+.

Basin

Open source

Extrayez, transformez, chargez à l’aide d’une programmation visuelle capable d’exécuter des tâches Spark dans n’importe quel environnement

Azkaban

Open source

Azkaban est un planificateur de tâches de flux de travail par lots créé sur LinkedIn pour exécuter des tâches Hadoop.

Argo Workflows

Open source

Argo Workflows est un moteur de workflow open source natif de conteneur pour orchestrer des tâches parallèles sur Kubernetes.

Apache Nifi

Open source

En termes simples, NiFi a été conçu pour automatiser le flux de données entre les systèmes. Bien que le terme « flux de données » soit utilisé dans divers contextes, nous l’utilisons ici pour désigner le flux automatisé et géré.

Airflow

Open source

Airflow est une plateforme qui vous permet de créer et d’exécuter des flux de travail. Un workflow est représenté sous la forme d’un DAG (un Directed Acyclic Graph),

ELI5

Open source

ELI5 est une bibliothèque Python qui permet de visualiser et de déboguer divers modèles de Machine Learning à l’aide d’une API unifiée.

Pinecone

Commercial

Pinecone est une base de données vectorielles entièrement gérée qui facilite l’ajout d’une recherche vectorielle aux applications de production. Il combine la recherche vectorielle

DeepVis Toolbox

Open source

Il s’agit du code requis pour exécuter la Deep Visualization Toolbox, ainsi que pour générer les visualisations neurone par neurone à l’aide d’une optimisation régularisée.

Milvus

Open source

Milvus est une base de données vectorielles open source conçue pour alimenter les applications d’IA et la recherche de similarité vectorielle.

DeepLIFT –

Open source

Cette version de DeepLIFT a été testée avec Keras 2.2.4 et tensorflow 1.14.0. Consultez cette question FAQ pour plus d’informations sur d’autres implémentations de DeepLIFT qui peuvent fonctionner avec différentes versions de tensorflow/pytorch, ainsi qu’avec un plus large éventail d’architectures. Voir les balises pour les anciennes versions.

Marquez

Open source

Marquez est un service de métadonnées open source pour la collecte, l’agrégation et la visualisation des métadonnées d’un écosystème de données.

lakeFS

Open source

LakeFS est une plate-forme open source qui offre résilience et facilité de gestion aux lacs de données basés sur le stockage objet.

ContrastiveExplanation (Foil Trees)

Open source

L’explication contrastive fournit une explication de la raison pour laquelle une instance a obtenu le résultat actuel (fait) plutôt qu’un résultat ciblé d’intérêt (feuille).

Intake

Open source

Intake est un ensemble léger d’outils permettant de charger et de partager des données dans des projets de science des données. L’apport vous aide à :

Captum

Open source

Captum (« compréhension » en latin) est une bibliothèque open source et extensible pour l’interprétabilité des modèles construite sur PyTorch.

DVC

Commercial

Data Version Control est un nouveau type de logiciel de gestion des versions, des flux de travail et des expériences de données, qui s’appuie sur Git.

anchor

Open source

Une explication d’ancrage est une règle qui « anchors » suffisamment la prédiction localement, de sorte que les modifications apportées au reste des valeurs de caractéristiques de l’instance n’ont pas d’importance. Autrement dit, pour les instances sur lesquelles l’ancre tient, la prédiction est (presque) toujours la même.

Dolt

Open source

Dolt est une base de données relationnelle à version contrôlée. Dolt implémente un sur-ensemble de MySQL.

Delta Lake

Open source

Delta Lake est un projet open source qui permet de créer une architecture Lakehouse au-dessus des lacs de données. Delta Lake propose des transactions ACID,

Alibi

Open source

Alibi est conçu pour aider à expliquer les prédictions des modèles d’apprentissage automatique et à évaluer la confiance de ces prédictions.

Arrikto

Commercial

Une plateforme complète d’apprentissage automatique qui simplifie, accélère et sécurise le développement de modèles jusqu’à la production

Visual Object Tagging Tool (VOTT)

Open source

Un outil open source d’annotation et d’étiquetage pour les ressources image et vidéo.

Valohai

Commercial

Valohai vise à supprimer les parties les moins amusantes de l’apprentissage automatique.

VGG Image Annotator (VIA)

Open source

VGG Image Annotator est un logiciel d’annotation manuelle simple et autonome pour l’image, l’audio et la vidéo. VIA fonctionne dans un navigateur Web et ne

Sagemaker

Commercial

Amazon SageMaker aide les data scientists et les développeurs à préparer, créer, former et déployer rapidement des modèles d’apprentissage automatique (ML) de haute qualité en regroupant un large ensemble de fonctionnalités spécialement conçues pour le ML.

V7 Darwin

Commercial

Permettre à toute entreprise, grande ou petite, d’exploiter le sens de la vue et d’automatiser toute tâche visuelle. Pour y parvenir, nous devons

Superintendent

Open source

surintendant fournit un outil d’étiquetage interactif basé sur ipywidget pour vos données. Il vous permet d’étiqueter de manière flexible toutes sortes de données.

Polyaxon

Open source

Polyaxon est une plateforme permettant de créer, de former et de surveiller des applications d’apprentissage profond à grande échelle. Nous créons un système pour résoudre la reproductibilité, l’automatisation et l’évolutivité des applications d’apprentissage automatique.

Super Annotate Data Labelling

Commercial

SuperAnnotate est la plateforme d’annotation d’images et de vidéos de bout en bout pour annoter, entraîner et automatiser votre pipeline de vision par ordinateur.

Semantic Segmentation Editor

Open source

Un outil d’étiquetage basé sur le Web pour créer des ensembles de données de formation d’IA (2D et 3D).

Pachyderm

Commercial

Pachyderm est un outil pour les pipelines de données de bout en bout, automatisés et contrôlés par version pour la science des données.

Sagemaker ground truth

Commercial

Amazon SageMaker Ground Truth est un service d’étiquetage de données entièrement géré qui facilite la création d’ensembles de données de formation très précis pour

Neu.ro

Commercial

La plateforme Neu.ro assemble de manière transparente vos ressources sur site et cloud, déploie des pipelines et intègre vos outils de développement open source et commerciaux.

PixelAnnotationTool

PixelAnnotationTool est un logiciel qui vous permet d’annoter manuellement et rapidement des images dans des répertoires. La méthode est pseudo manuelle car elle utilise l’algorithme watershed marqué d’OpenCV

Modzy

Commercial

Modzy est la plate-forme logicielle ModelOps et MLOps permettant aux entreprises de déployer, gérer et tirer profit de l’IA, à grande échelle.

OpenLabeling

Open source

Étiquetage des images dans plusieurs formats d’annotation : PASCAL COV (= darkflow)

ML Workspace

Open source

L’espace de travail ML est un IDE Web tout-en-un spécialisé pour l’apprentissage automatique et la science des données.

LynxKite

Open source

LynxKite est une plateforme open source de science des données graphiques « à guichet unique ».

Kubeflow

Open source

Le projet Kubeflow vise à rendre les déploiements de workflows d’apprentissage automatique (ML) sur Kubernetes simples, portables et évolutifs.

Knime

Commercial

Chez KNIME, nous construisons des logiciels pour créer et produire la science des données à l’aide d’un environnement simple et intuitif, permettant à chaque partie prenante du processus de science des données de se concentrer sur ce qu’elle fait de mieux.

MedTagger

Open source

MedTagger est un cadre collaboratif pour annoter des ensembles de données médicales

makesense.ai

Open source

makesense.ai est un outil en ligne gratuit pour étiqueter les photos. Grâce à l’utilisation d’un navigateur, il ne nécessite aucune installation compliquée : il suffit de visiter le site Web et vous êtes prêt à partir.

Iguazio

Commercial

La plateforme Iguazio Data Science transforme les projets d’IA en résultats commerciaux concrets.

Labelimg

Open source

LabelImg est un outil d’annotation d’images graphiques. Il est écrit en Python et utilise Qt pour son interface graphique.

Label Studio

Open source

Label Studio est un outil d’étiquetage de données open source. Il vous permet d’étiqueter des types de données comme l’audio,

IBM Watson Studio

Commercial

IBM Watson® Studio permet aux data scientists, aux développeurs et aux analystes de créer, d’exécuter et de gérer des modèles d’IA, et d’optimiser les décisions n’importe où sur IBM Cloud Pak® for Data.

ImgLab

Open source

Un outil Web pour étiqueter les images d’objets pouvant être utilisé pour entraîner dlib ou d’autres détecteurs d’objets.

Hopsworks

Commercial

Hopsworks est une plateforme gérée pour la science des données évolutive, prenant en charge à la fois les GPU et le Big Data, dans un environnement de développement familier.

H2O

Commercial

H2O est une plateforme en mémoire pour l’apprentissage automatique distribué et évolutif.

Gradient

Commercial

Gradient est un produit Paperspace qui simplifie le développement, la formation et le déploiement de modèles d’apprentissage automatique.

Domino

Commercial

Domino est une plateforme de science des données qui permet un travail rapide, reproductible et collaboratif sur des produits de données tels que des modèles, des tableaux de bord et des pipelines de données.

DataRobot

Commercial

Le produit DataRobot Automated Machine Learning accélère le succès de votre IA en combinant une technologie d’apprentissage automatique de pointe avec l’équipe que vous avez en place.

Dataiku

Commercial

Dataiku est une société d’intelligence artificielle et d’apprentissage automatique fondée en 2013. En décembre 2019,

ImageTagger

Open source

Il s’agit d’un outil collaboratif en ligne permettant d’étiqueter les données d’images.

Figure Eight

Commercial

La figure huit fédérale est essentielle à la création d’un système de décision de la plus haute qualité

Doccano

Open source

doccano est un outil d’annotation de texte open source pour les humains.

Dataloop

Commercial

Plateforme de données d’entreprise pour les systèmes d’IA de vision en développement et en production.

Computer Vision Annotation Tool (CVAT)

Open source

CVAT est un outil gratuit, en ligne et interactif d’annotation de vidéos et d’images pour la vision par ordinateur.

COCO Annotator

Open source

COCO Annotator est un outil d’annotation d’images basé sur le Web conçu pour être polyvalent et étiqueter efficacement les images afin de créer des données d’entraînement.

DAGsHub

Open source

DAGsHub est une plate-forme permettant aux scientifiques des données et aux ingénieurs en apprentissage automatique de versionner leurs données, modèles, expériences et codes.

CNVRG

Commercial

cnvrg.io est une plateforme d’apprentissage automatique construite par des data scientists, pour des data scientists.

Clear ML

Commercial

ClearML est une plateforme open source qui automatise et simplifie le développement et la gestion de solutions d’apprentissage automatique pour des milliers d’équipes de science des données partout dans le monde.

Bodywork

Open source

Bodywork déploie des projets d’apprentissage automatique développés en Python sur Kubernetes.

AzureML

Commercial

Azure Machine Learning est un service cloud permettant d’accélérer et de gérer le cycle de vie des projets d’apprentissage automatique.

Algorithmia

Commercial

L’algorithme offre le délai de rentabilisation le plus rapide pour l’apprentissage automatique d’entreprise. Déployez, servez et gérez rapidement des modèles de machine learning à grande échelle.

aiWARE

Commercial

La plateforme Veritone aiWARE pour Enterprise AI fournit des adaptateurs d’entrée en temps réel, des centaines de moteurs d’IA dans plus de 20 catégories cognitives.

Kyso

Commercial

Un centre de connaissances central, pour que chacun puisse apprendre de vos informations sur les données et agir en conséquence.

Knowledge Repo

Open source

Le projet Knowledge Repo vise à faciliter le partage de connaissances entre les data scientists et d’autres rôles techniques en utilisant des formats de données et des outils qui ont du sens dans ces professions.

Talend Data Fabric

Commercial

Talend Data Fabric combine les produits Talend dans un ensemble commun de solutions puissantes et faciles à utiliser.

Metacat

Open source

Metacat est un catalogue de métadonnées et un référentiel de données flexible et open source qui cible les données scientifiques, en particulier celles de l’écologie et des sciences de l’environnement. Metacat accepte XML

Magda

Open source

Magda est un système de catalogue de données qui fournit un endroit unique où toutes les données de votre organisation peuvent être cataloguées, enrichies,

Tune

Open source

Tune est une bibliothèque Python pour l’exécution d’expériences et le réglage d’hyperparamètres à n’importe quelle échelle.

Informatica Data Catalog

Commercial

Informatica Enterprise Data Catalog est un catalogue de données basé sur l’IA qui fournit un moteur de découverte basé sur le machine learning pour analyser et cataloguer les ressources de données.

IBM Data Catalog

Commercial

IBM Watson Knowledge Catalog est un catalogue de données ouvert et intelligent pour la gouvernance, la qualité et la collaboration des données d’entreprise et des modèles d’IA.

Talos

Open source

Talos change radicalement le flux de travail ordinaire de Keras, TensorFlow (tf.keras) et PyTorch en automatisant entièrement le réglage des hyperparamètres et l’évaluation des modèles.

Google Data Catalog

Commercial

GCP Data Catalog prend rapidement en charge les services de gestion des métadonnées, la disponibilité étant sur le cloud Google.

Scikit Optimize

Open source

Scikit-Optimize, ou skopt, est une bibliothèque simple et efficace permettant de minimiser les fonctions de boîte noire (très) coûteuses et bruyantes.

DataHub

Open source

DataHub est une plateforme de métadonnées open source pour la pile de données moderne. Découvrez les architectures des différents systèmes de métadonnées et pourquoi DataHub excelle ici

CKAN

Open source

Le Comprehensive Knowledge Archive Network (CKAN) est un portail de données ouvertes open source pour le stockage et la distribution de données ouvertes.

Optuna

Open source

Optuna est un framework logiciel d’optimisation automatique d’hyperparamètres, particulièrement conçu pour l’apprentissage automatique.

Katib

Open source

Katib est un projet natif de Kubernetes pour l’apprentissage automatique automatisé (AutoML). Katib prend en charge le réglage des hyperparamètres, l’arrêt anticipé et la recherche d’architecture neuronale.

Hyperopt

Open source

Hyperopt est une bibliothèque Python pour l’optimisation série et parallèle sur des espaces de recherche difficiles, qui peuvent inclure des dimensions à valeur réelle, discrète et conditionnelle.

Hypera

Open source

Un wrapper pratique très simple autour d’hyperopt pour un prototypage rapide avec des modèles keras.

Veri

Open source

Veri est un magasin d’étiquettes de fonctionnalités. Le magasin d’étiquettes de fonctionnalités permet de stocker des fonctionnalités sous forme de clés et d’étiquettes sous forme de valeurs. L’interrogation de valeurs n’est possible qu’avec knn utilisant des fonctionnalités.

Ivory

Open source

ivory définit une spécification sur la manière de stocker les données d’entité et fournit un ensemble d’outils pour les interroger.

Hopsworks Feature Store

Open source

Hopsworks et son Feature Store sont une plate-forme d’IA open source à forte intensité de données utilisée pour le développement et l’exploitation de modèles d’apprentissage automatique à grande échelle.

Azure Data Catalog

Commercial

Azure Data Catalog est un catalogue de métadonnées à l’échelle de l’entreprise permettant la découverte d’actifs de données en libre-service. Il s’agit d’un service entièrement géré dans Azure.

Feast

Open source

Feast (Feature Store) est un système de données opérationnel permettant de gérer et de fournir des fonctionnalités d’apprentissage automatique aux modèles en production.

ByteHub

Commercial

ByteHub est un magasin de fonctionnalités basé sur Python conçu pour être aussi facile à utiliser et familier que possible aux data scientists.

Atlan Data Catalog

Commercial

Il s’agit d’un outil moderne de catalogue et de découverte de données. Un catalogue de données est un inventaire soigneusement organisé des ressources de données dans toutes vos sources de données.

Apache Atlas

Open source

Apache Atlas est un système open source de gestion et de gouvernance des métadonnées conçu pour vous aider à trouver, organiser et gérer facilement les actifs de données.

Butterfree

Open source

Il s’agit d’un magasin de fonctionnalités, comme son nom l’indique, correspond à un ensemble organisé de fonctionnalités pour les modèles d’apprentissage automatique.

Amundsen

Open source

Amundsen est un moteur de découverte de données et de métadonnées permettant d’améliorer la productivité des analystes de données, des data scientists et des ingénieurs lorsqu’ils interagissent avec les données.

Papertrail

Commercial

SolarWinds® Papertrail™ fournit une gestion des journaux basée sur le cloud qui regroupe de manière transparente les journaux des applications, des serveurs, des périphériques réseau, des services, des plates-formes et bien plus encore.

Weights and biases

Commercial

Weights & Biases est la plateforme d’apprentissage automatique permettant aux développeurs de créer plus rapidement de meilleurs modèles.

HealthchecksIO

Commercial

Healthchecks est un service de surveillance des tâches cron. Vous pouvez utiliser Healthchecks.io pour une surveillance légère du serveur :

Cronitor

Commercial

Cronitor est une application de suivi basée sur le Web qui surveille, alerte et analyse les processus informatiques planifiés.

Sacred

Open source

Sacred est un outil pour configurer, organiser, enregistrer et reproduire des expériences informatiques.

GitHub Actions

GitHub Actions facilite l’automatisation de tous vos flux de travail logiciels, désormais avec CI/CD de classe mondiale. Créez, testez et déployez votre code

CML

Open source

L’apprentissage automatique continu (CML) est un outil CLI open source permettant de mettre en œuvre l’intégration et la livraison continues (CI/CD) avec

Neptune AI

Commercial

Neptune est un magasin de métadonnées pour MLOps, conçu pour les équipes qui effectuent de nombreuses expériences.‌

Azure Devops

Commercial

Azure DevOps fournit des services de développement permettant aux équipes de support de planifier le travail, de collaborer au développement de code, ainsi que de créer et de déployer des applications.

AWS CodePipeline

Commercial

AWS CodePipeline est un service de livraison continue entièrement géré qui vous aide à automatiser vos pipelines de versions pour des mises à jour rapides et fiables des applications et de l’infrastructure.

Une revue de plus de 250 outils et solutions MLOps

Cet outil gratuit vous aide à sélectionner les bons outils MLOps pour votre entreprise en fonction de l'examen de nos experts.

Catégories de produits

Luigi

Metaflow

Kedro

Flyte

MLRun

Couler

Kale

Prefect

Automate Studio

ZenML

Argo

Modin

MLlib

Yellowbrick

Mahout

Netron

Jax

Horovod

Manifold

H2O-3

Evidently

Fiber

Weld

DeepSpeed

Dask

Vulkan Kompute

CuPy

Vaex

CuML

CuDF

WhyLogs

Tpot

Vespa

Triton Inference Server

Singa

Ray

Triton Inference Server

TorchServe

Rapids

TensorFlow Serving

Tempo

Petastorm

NumpyGroupies

Streamlit

Seldon

Numba

Modin

Redis-AI

Model Server for Apache MXNet (MMS)

Merlin

PredictionIO

m2cgen

KFServing

Jina

Opyrator

OpenScoring

Hydrosphere

GraphPipe

ModelDB

ForestFlow

Mlflow

Keepsake

Fiddler

Guild AI

Comet

Evidently

Aim

DeepDetect

Cortex

Visual Studio Code

BudgetML

Thonny

BentoML

Spyder

Backprop

Rstudio

XAI – eXplainableAI