Une revue de plus de 250 outils et solutions MLOps

Cet outil gratuit vous aide à sélectionner les bons outils MLOps pour votre entreprise en fonction de l'examen de nos experts.

Luigi 

Open source

Luigi est un package Python (testé 3.6, 3.7, 3.8, 3.9) qui vous aide à créer des pipelines complexes de tâches par lots. Il gère la résolution des dépendances, la gestion des flux de travail, la visualisation, la gestion des échecs, l’intégration de la ligne de commande et bien plus encore.

Read More

Metaflow

Open source

Metaflow est une bibliothèque Python conviviale qui aide les scientifiques et les ingénieurs à créer et à gérer des projets réels de science des données.

Read More

Kedro

Open source

Kedro est un framework Python open source permettant de créer du code de science des données reproductible, maintenable et modulaire.

Read More

Flyte 

Open source

L’objectif principal de Flyte est d’augmenter la vitesse de développement pour le traitement des données et l’apprentissage automatique, permettant ainsi une exécution de calcul à grande échelle sans frais opérationnels.

Read More

MLRun

Open source

MLRun est une solution MLOps open source de bout en bout pour gérer et automatiser l’ensemble de vos analyses et apprentissage automatique

Read More

Couler 

Open source

Couler vise à fournir une interface unifiée pour créer et gérer des flux de travail sur différents moteurs de flux de travail, tels qu’Argo Workflows, Tekton Pipelines et Apache Airflow.

Read More

Kale

Open source

KALE (Kubeflow Automated pipeLines Engine) est un projet qui vise à simplifier l’expérience Data Science du déploiement des workflows Kubeflow Pipelines.

Read More

Prefect

Commercial

Prefect est un nouveau système de gestion de flux de travail, conçu pour une infrastructure moderne et alimenté par le logiciel open source Prefect.

Read More

Automate Studio

Commercial

Les organisations qui se lancent dans des initiatives d’automatisation intelligente des processus peuvent rapidement créer et déployer des flux de travail basés sur l’IA et intégrer les informations qui en résultent dans les applications et processus métier.

Read More

ZenML

Open source

ZenML est un framework MLOps extensible et open source permettant de créer des pipelines d’apprentissage automatique prêts pour la production. Il a une syntaxe simple et flexible, est indépendant du cloud et des outils

Read More

Argo 

Open source

Argo Workflows est un moteur de workflow open source natif de conteneur pour orchestrer des tâches parallèles sur Kubernetes. Argo Workflows est implémenté en tant que Kubernetes CRD (Custom Resource Definition).

Read More

Modin 

Open source

Modin est un projet précoce du RISELab de l’UC Berkeley conçu pour faciliter l’utilisation de l’informatique distribuée pour la science des données.

Read More

MLlib 

Open source

MLlib est la bibliothèque d’apprentissage automatique (ML) de Spark. Son objectif est de rendre l’apprentissage automatique pratique évolutif et simple. À un niveau élevé, il fournit des outils tels que

Read More

Yellowbrick

Open source

Yellowbrick est une suite d’outils de diagnostic visuel appelés « Visualiseurs » qui étendent l’API scikit-learn pour permettre un pilotage humain du processus de sélection du modèle.

Read More

Mahout

Open source

Apache Mahout(TM) est un cadre d’algèbre linéaire distribué et un Scala DSL mathématiquement expressif conçu pour permettre aux mathématiciens,

Read More

Netron 

Open source

Netron est un visualiseur de modèles de réseaux neuronaux, d’apprentissage profond et d’apprentissage automatique.

Read More

Jax  

Open source

JAX est Autograd et XLA, réunis pour une recherche en apprentissage automatique haute performance.

Read More

Horovod 

Open source

Horovod a été initialement développé par Uber pour rendre l’apprentissage profond distribué rapide et facile à utiliser, réduisant ainsi le temps de formation des modèles

Read More

Manifold 

Open source

Manifold est une plateforme de publication open source construite par des universitaires et des éditeurs. Il est réactif, accessible, intuitif, personnalisable et avisé. Avec Manifold, vous pouvez publier les documents que vous produisez déjà ou les utiliser pour construire quelque chose de nouveau avec vos collègues et étudiants

Read More

H2O-3 

Commercial

H2O est une plateforme d’apprentissage automatique et d’analyse prédictive open source, en mémoire, distribuée, rapide et évolutive qui vous permet de créer des modèles d’apprentissage automatique sur le Big Data

Read More

Evidently

Evidently aide évidemment à évaluer et à surveiller les modèles d’apprentissage automatique en production. Il génère des rapports interactifs ou des profils JSON

Read More

Fiber 

Open source

Fibre est un framework Web inspiré d’Express construit sur Fasthttp, le moteur HTTP le plus rapide pour Go. Conçu pour faciliter les choses pour

Read More

Weld  

Open source

Weld est un compilateur et un runtime permettant d’améliorer les performances des applications gourmandes en données.

Read More

DeepSpeed 

Open source

DeepSpeed ​​est une bibliothèque d’optimisation du deep learning qui rend la formation distribuée simple, efficace et efficiente.

Read More

Dask 

Open source

Dask est une bibliothèque flexible pour le calcul parallèle en Python. Dask est composé de deux parties :

Read More

Vulkan Kompute  

Open source

Vulkan Kompute – Le cadre de calcul Vulkan à usage général. Ultra rapide, léger, compatible mobile et optimisé pour les cas d’utilisation avancés de traitement de données GPU.

Read More

CuPy

Open source

tableau multidimensionnel sur CUDA.

Read More

Vaex  

Open source

Vaex est une bibliothèque Python pour les DataFrames Out-of-Core paresseux (similaires à Pandas), pour visualiser et explorer de grands ensembles de données tabulaires

Read More

CuML 

Open source

cuML est une suite d’algorithmes d’apprentissage automatique rapides et accélérés par GPU, conçus pour la science des données et les tâches analytiques. Nos miroirs API

Read More

CuDF  

Open source

cuDF est une bibliothèque Python GPU DataFrame (construite sur le format de mémoire en colonnes Apache Arrow) pour le chargement, la jointure, l’agrégation,

Read More

WhyLogs 

Open source

Whylogs est un standard open source pour la journalisation des données et du ML l’agent de journalisation Whylogs est

Read More

Tpot 

Open source

TPOT signifie Outil d’optimisation de pipeline basé sur un arbre. Considérez TPOT comme votre assistant de science des données. TPOT est un outil d’apprentissage automatique automatisé Python qui optimise les pipelines d’apprentissage automatique à l’aide de la programmation génétique.

Read More

Vespa 

Open source

Vespa fournit une intégration de métriques avec CloudWatch, Datadog et Prometheus/Grafana, ainsi qu’une API HTTP JSON.

Read More

Triton Inference Server 

Open source

Triton Inference Server fournit une solution d’inférence cloud et Edge optimisée pour les CPU et les GPU. Triton prend en charge un

Read More

Singa 

Open source

Apache SINGA est un projet Apache de premier niveau, axé sur la formation distribuée de modèles d’apprentissage profond et d’apprentissage automatique.

Read More

Ray 

Open source

Ray fournit une API simple et universelle pour créer des applications distribuées. Ray accomplit cette mission en :

Read More

Triton Inference Server 

Open source

Triton Inference Server fournit une solution d’inférence cloud et Edge optimisée pour les CPU et les GPU. Triton prend en charge un protocole HTTP/REST et GRPC qui permet aux clients distants

Read More

TorchServe

Open source

TorchServe est un outil flexible et facile à utiliser pour servir les modèles PyTorch.

Read More

Rapids 

Open source

La suite RAPIDS de bibliothèques de logiciels et d’API open source vous donne la possibilité d’exécuter des pipelines de science des données et d’analyse de bout en bout entièrement sur des GPU. Sous licence Apache 2.0, RAPIDS est incubé par NVIDIA® sur la base d’une vaste expérience en matière de matériel et de science des données.

Read More

TensorFlow Serving 

Open source

TensorFlow Serving est un système de service flexible et hautes performances pour les modèles de machine learning, conçu pour les environnements de production.

Read More

Tempo 

Open source

Tempo est un SDK python destiné aux data scientists pour les aider à mettre leurs modèles en production. Il a 4 objectifs principaux :

Read More

Petastorm 

Open source

Petastorm est une bibliothèque d’accès aux données open source développée chez Uber ATG.

Read More

NumpyGroupies 

Open source

Ce package consiste en une petite bibliothèque d’outils optimisés pour effectuer des choses qui peuvent être grossièrement considérées comme des « opérations d’indexation de groupe ».

Read More

Streamlit 

Open source

Streamlit est une bibliothèque Python open source qui facilite la création et le partage de superbes applications Web personnalisées pour l’apprentissage automatique

Read More

Seldon

Commercial

Seldon core convertit vos modèles ML (Tensorflow, Pytorch, H2o, etc.) ou wrappers de langage

Read More

Numba 

Open source

Numba est un compilateur pour les tableaux Python et les fonctions numériques qui vous donne le pouvoir d’accélérer vos applications avec des fonctions hautes performances écrites directement en Python.

Read More

Modin 

Open source

Modin est un projet précoce du RISELab de l’UC Berkeley conçu pour faciliter l’utilisation de l’informatique distribuée pour la science des données. Il s’agit d’une bibliothèque Dataframe multiprocessus avec une API identique à Pandas qui permet aux utilisateurs d’accélérer leurs flux de travail Pandas.

Read More

Redis-AI 

Open source

RedisAI est un module Redis permettant d’exécuter des modèles de Deep Learning/Machine Learning et de gérer leurs données. Son objectif est d’être un « cheval de bataille » pour servir de modèle, en fournissant

Read More

Model Server for Apache MXNet (MMS) 

Open source

Multi Model Server (MMS) est un outil flexible et facile à utiliser pour servir des modèles d’apprentissage en profondeur formés à l’aide de n’importe quel framework ML/DL.

Read More

Merlin 

Open source

Merlin est une plateforme de déploiement et de service de modèles d’apprentissage automatique. Le projet est né de la conviction que le déploiement du modèle doit être :

Read More

PredictionIO 

Open source

Apache PredictionIO® est un serveur d’apprentissage automatique open source construit sur une pile open source de pointe pour les développeurs

Read More

m2cgen 

Open source

m2cgen (Model 2 Code Generator) – est une bibliothèque légère qui fournit un moyen simple de transpiler des modèles statistiques entraînés dans un code natif (Python, C, Java, Go, JavaScript, Visual Basic, C#, PowerShell, R, PHP, Dart, Haskell, Ruby, Fa#, Rust).

Read More

KFServing

Open source

Le projet Kubeflow vise à rendre les déploiements de workflows d’apprentissage automatique (ML) sur Kubernetes simples, portables et évolutifs.

Read More

Jina  

Open source

Jina🔊 est un framework de recherche neuronale qui permet à quiconque de créer des applications de recherche SOTA et d’apprentissage profond évolutives en quelques minutes.

Read More

Opyrator

Open source

Transformez instantanément vos fonctions Python en microservices prêts pour la production. Déployez et accédez à vos services via l’API HTTP ou l’interface utilisateur interactive. Exportez en toute transparence votre

Read More

OpenScoring 

Open source

Service Web REST pour l’évaluation des modèles PMML. Openscoring est un service Java qui fournit une interface JSON REST à l’évaluateur Java Predictive Model Markup Language (PMML) JPMML.

Read More

Hydrosphere 

Open source

Hydrosphere est une plateforme de déploiement, de gestion de versions et de surveillance de vos modèles d’apprentissage automatique en production. Il est indépendant du langage et du framework, avec la prise en charge de tous les principaux langages et frameworks de programmation – Python, Java, Tensorflow, Pytorch, etc.

Read More

GraphPipe 

Open source

GraphPipe est un protocole et un ensemble de logiciels conçus pour simplifier le déploiement de modèles d’apprentissage automatique et le dissocier des implémentations de modèles spécifiques au framework.

Read More

ModelDB

Open source

ModelDB : un système open source pour la gestion des versions, des métadonnées et des expériences de modèles de Machine Learning.

Read More

ForestFlow 

Open source

ForestFlow est un serveur de modèles d’apprentissage automatique cloud natif et basé sur des politiques évolutives. ForestFlow s’efforce de trouver un équilibre entre la flexibilité qu’il offre aux data scientists et l’adoption de normes tout en réduisant les frictions entre les équipes de science des données, d’ingénierie et d’exploitation.

Read More

Mlflow

Open source

MLflow est une plateforme open source permettant de gérer le cycle de vie du ML, y compris l’expérimentation, la reproductibilité, le déploiement et un registre central de modèles.

Read More

Keepsake

Open source

La bibliothèque Keepsake Python est utilisée pour créer des expériences et des points de contrôle dans votre train

Read More

Fiddler

Commercial

Progress® Telerik® Fiddler Everywhere est un outil de débogage Web qui surveille, inspecte, modifie et enregistre tout le trafic HTTP(S), émet des requêtes entre votre ordinateur et Internet et manipule les données entrantes et sortantes. Il s’agit d’un proxy multiplateforme hautes performances pour n’importe quel navigateur, système ou plate-forme.

Read More

Guild AI

Open source

Guild AI apporte un contrôle systématique à l’apprentissage automatique pour vous aider à mieux construire

Read More

Comet

Commercial

Comet permet aux data scientists et aux équipes de suivre, comparer, expliquer et optimiser les expériences et les modèles à travers le modèle.

Read More

Evidently 

Open source

Evidently aide à évaluer et à surveiller les modèles d’apprentissage automatique en production. Il génère des rapports interactifs ou des profils JSON à partir de fichiers pandas DataFrames ou csv.

Read More

Aim

Open source

Aim est un outil de comparaison open source pour les expériences d’IA. Avec plus de ressources et de modèles complexes, plus d’expériences

Read More

DeepDetect  

Open source

DeepDetect est une API et un serveur d’apprentissage profond écrits en C++11, ainsi qu’une pure plate-forme Web pour la formation et la gestion des modèles.

Read More

Cortex 

Commercial

L’IA de Cortex analyse tout le contenu de :

Read More

Visual Studio Code

Commercial

Visual Studio Code est un éditeur de code source léger mais puissant qui s’exécute sur votre bureau et est disponible pour Windows, macOS

Read More

BudgetML

Open source

BudgetML est parfait pour les praticiens qui souhaitent déployer rapidement leurs modèles sur un point final, sans perdre beaucoup de temps, d’argent et d’efforts à essayer de comprendre comment le faire de bout en bout.

Read More

Thonny

Open source

Thonny est un environnement de développement intégré pour Python conçu pour les débutants. Il prend en charge différentes façons de marcher

Read More

BentoML

Open source

BentoML est un framework flexible et hautes performances permettant de servir, de gérer et de déployer des modèles d’apprentissage automatique.

Read More

Spyder

Open source

Spyder est un puissant environnement scientifique écrit en Python, pour Python, et conçu par et pour des scientifiques, ingénieurs et

Read More

Backprop  

Open source

Backprop est une plate-forme de modèles sans serveur qui permet aux développeurs d’utiliser facilement des modèles d’apprentissage automatique dans n’importe quelle application.

Read More

Rstudio

Commercial

RStudio est un environnement de développement intégré (IDE) pour R. Il comprend un

Read More

XAI – eXplainableAI 

Open source

XAI est une bibliothèque d’apprentissage automatique conçue avec l’explicabilité de l’IA en son cœur. XAI contient divers outils permettant l’analyse et l’évaluation des données et des modèles.

Read More

Pycharm

Commercial

PyCharm est un environnement de développement intégré (IDE) dédié à Python fournissant une large gamme d’outils essentiels pour Python.

Read More

woe 

Open source

Outils de transformation WoE principalement utilisés dans le modèle ScoreCard pour la notation de crédit

Read More

TreeInterpreter 

Open source

Package pour interpréter l’arbre de décision de scikit-learn et les prédictions forestières aléatoires.

Read More

themis-ml  

Open source

themis-ml définit la discrimination comme la préférence (préjugé) pour ou contre un ensemble de groupes sociaux qui entraîne un traitement injuste de ses membres par rapport à un certain résultat.

Read More

Themis 

Open source

Themis est une bibliothèque open source de services cryptographiques de haut niveau permettant de sécuriser les données lors de l’authentification, du stockage, de la messagerie, des échanges réseau, etc.

Read More

tensorflow’s Model Analysis 

Open source

TensorFlow Model Analysis (TFMA) est une bibliothèque permettant d’évaluer les modèles TensorFlow.

Read More

tensorflow’s lucid 

Open source

Lucid est un ensemble d’infrastructures et d’outils pour la recherche sur l’interprétabilité des réseaux neuronaux.

Read More

Tensorflow’s cleverhans

Open source

Ce référentiel contient le code source de CleverHans, une bibliothèque Python permettant d’évaluer la vulnérabilité des systèmes d’apprentissage automatique face à des exemples contradictoires. Vous pouvez en savoir plus sur ces vulnérabilités sur le blog ci-joint.

Read More

Eclipse

Open source

La Fondation Eclipse offre à notre communauté mondiale d’individus et d’organisations un environnement mature, évolutif et convivial pour les logiciels open source.

Read More

Tensorboard’s Tensorboard WhatIf

Open source

L’outil What-If (WIT) fournit une interface facile à utiliser pour approfondir la compréhension des modèles ML de classification et de régression par boîte noire.

Read More

Atom

Open source

Atom est un éditeur de texte piratable pour le 21e siècle, construit sur Electron et basé sur tout ce que nous aimons de nos éditeurs préférés

Read More

Snitch ai

Commercial

Validation scientifique automatisée de vos modèles ML en quelques clics.

Read More

Skater

Open source

Skater est un cadre unifié permettant l’interprétation de modèles pour toutes les formes de modèles afin d’aider à créer un système d’apprentissage automatique interprétable souvent nécessaire pour les cas d’utilisation du monde réel (** nous travaillons activement à permettre une interprétabilité fidèle pour tous les modèles de formes).

Read More

Anaconda

Commercial

Anaconda Individual Edition est un gestionnaire de packages, un gestionnaire d’environnement et une distribution Python gratuits et faciles à installer avec un

Read More

SHAPash  – Shapash est une bibliothèque Python qui fournit plusieurs types de visualisation affichant des étiquettes explicites que tout le monde peut comprendre.

Open source

Shapash est une bibliothèque Python qui vise à rendre le machine learning interprétable et compréhensible par tous. Il propose plusieurs types de visualisation qui affichent des étiquettes explicites que tout le monde peut comprendre.

Read More

JSON Schema

Open source

JSON Schema est un vocabulaire qui vous permet d’annoter et de valider des documents JSON.

Read More

Great Expectations

Open source

Great Expectations est le principal outil de validation, de documentation et de profilage

Read More

SHAP 

Open source

SHAP (SHapley Additive exPlanations) est une approche de la théorie des jeux pour expliquer le résultat de tout modèle d’apprentissage automatique.

Read More

SAGE

Open source

Sage est un projet open source et totalement gratuit.

Read More

responsibly 

Open source

Boîte à outils pour auditer et atténuer les biais et l’équité des systèmes d’apprentissage automatique.

Read More

rationale

Open source

La justification est inspirée de RamdaJS. Il s’agit d’un ensemble de fonctions utilitaires d’assistance absentes de la bibliothèque standard OCaml/ReasonML.

Read More

pyBreakDown 

Open source

La méthode Break Down est déplacée vers le package Dalex Python qui est activement maintenu

Read More

Cerberus

Open source

Cerberus fournit une fonctionnalité de validation de données puissante, simple et légère, prête à l’emploi et est conçue pour être facilement

Read More

NETRON  

Open source

Netron est un visualiseur de modèles de réseaux neuronaux, d’apprentissage profond et d’apprentissage automatique.

Read More

mljar-supervised

Open source

Le mljar-supervisé est un package Python d’apprentissage automatique automatisé qui fonctionne avec des données tabulaires. Il est conçu pour faire gagner du temps à un data scientist 😎.

Read More

Spark Streaming 

Open source

Spark Streaming est une extension de l’API Spark principale qui permet un traitement de flux évolutif, à haut débit et tolérant aux pannes.

Read More

MindsDB  

Open source

MindsDB permet des fonctionnalités prédictives avancées directement dans votre base de données.

Read More

Lucid

Open source

Lucid est un ensemble d’infrastructures et d’outils pour la recherche sur l’interprétabilité des réseaux neuronaux.

Read More

Kafka Streams

Open source

Apache Kafka est une plateforme de streaming d’événements distribués open source utilisée par des milliers d’entreprises pour des performances élevées.

Read More

LOFO Importance  

Open source

LOFO (Leave One Feature Out) Importance calcule l’importance d’un ensemble de fonctionnalités en fonction d’une métrique de choix, pour un modèle de choix, en supprimant de manière itérative chaque fonctionnalité de l’ensemble et en évaluant les performances du modèle, avec un schéma de validation. de choix, en fonction de la métrique choisie.

Read More

IBM Stream Analytics

Commercial

IBM® Streaming Analytics for IBM Cloud est optimisé par IBM® Streams, une plateforme analytique avancée que vous pouvez utiliser pour ingérer, analyser et corréler les informations à mesure qu’elles arrivent de différents types de sources de données en temps réel.

Read More

LIME

Open source

Ce projet vise à expliquer ce que font les classificateurs (ou modèles) d’apprentissage automatique.

Read More

Google Cloud DataFlow

Commercial

Google Cloud Dataflow est un service entièrement géré permettant d’exécuter des pipelines Apache Beam au sein de l’écosystème Google Cloud Platform.

Read More

Lightly  

Open source

Lightly est un style de thème fork of Breeze qui vise à être visuellement moderne et minimaliste.

Read More

L2X  

Open source

Code pour reproduire les expériences dans l’article Learning to Explain: An Information-Theoretic Perspective on Model Interpretation at ICML 2018, par Jianbo Chen, Mitchell Stern, Martin J. Wainwright, Michael I. Jordan.

Read More

Faust 

Open source

Faust est une bibliothèque de traitement de flux, transférant les idées de Kafka Streams vers Python.

Read More

Brooklin

Open source

Brooklin est un système distribué destiné au streaming de données entre divers systèmes sources et destinations hétérogènes.

Read More

Azure Stream Analytics

Commercial

Azure Stream Analytics est un moteur d’analyse en temps réel et de traitement d’événements complexes conçu pour analyser et traiter des données élevées.

Read More

Apache Samza

Open source

Apache Samza est un moteur de traitement de données évolutif qui vous permet de traiter et d’analyser vos données en temps réel.

Read More

Apache Flink

Open source

Apache Flink est un framework et un moteur de traitement distribué pour les calculs avec état sur des surfaces illimitées et limitées.

Read More

Amazon Kinesis

Commercial

Amazon Kinesis facilite la collecte, le traitement et l’analyse des données en streaming en temps réel afin que vous puissiez obtenir des informations en temps opportun et réagir rapidement.

Read More

Talend Open Studio for Data Integration

Commercial

Talend Open Studio for Data Integration est un logiciel téléchargeable gratuitement pour démarrer vos premiers projets d’intégration de données et ETL.

Read More

Spark

Open source

Apache Spark est un moteur d’analyse unifié pour le traitement de données à grande échelle. Il fournit des API de haut niveau en Java, Scala, Python et R,

Read More

Snakemake

Open source

Le système de gestion de flux de travail Snakemake est un outil permettant de créer des analyses de données reproductibles et évolutives. Les flux de travail sont décrits via un texte lisible par l’homme

Read More

keras-vis

Open source

keras-vis est une boîte à outils de haut niveau pour visualiser et déboguer vos modèles de réseaux neuronaux keras formés.

Read More

SETL

Open source

SETL (prononcé « settle ») est un framework Scala ETL optimisé par Apache Spark qui vous aide à structurer vos projets Spark ETL,

Read More

InterpretML

Open source

InterpretML est un package open source qui intègre des techniques d’interprétabilité d’apprentissage automatique de pointe sous un même toit.

Read More

Prefect Core

Open source

La bibliothèque Python parfaite comprend tout ce dont vous avez besoin pour concevoir, créer, tester et exécuter de puissantes applications de données. Mettez à niveau instantanément

Read More

PipelineX

Open source

PipelineX : package Python pour créer des pipelines ML pour l’expérimentation avec Kedro, MLflow, etc.

Read More

Integrated-Gradients 

Open source

Integrated Gradient (IG) calcule le gradient de la sortie de prédiction du modèle par rapport à ses caractéristiques d’entrée et ne nécessite aucune modification du réseau neuronal profond d’origine.

Read More

Oozie

Open source

Oozie v3 est un moteur de bundle basé sur serveur qui fournit une abstraction oozie de niveau supérieur qui regroupera un ensemble d’applications coordinatrices.

Read More

iNNvestigate 

Open source

Ces dernières années, les réseaux de neurones ont fait progresser l’état de l’art dans de nombreux domaines comme par exemple la détection d’objets et la reconnaissance vocale.

Read More

Neuraxle

Open source

Neuraxle est une bibliothèque d’apprentissage automatique (ML) permettant de créer des pipelines d’apprentissage automatique.

Read More

Metaflow

Open source

Metaflow est une bibliothèque Python conviviale qui aide les scientifiques et les ingénieurs à créer et à gérer des projets réels de science des données.

Read More

IBM AI Fairness 360  

Open source

AI Fairness 360, un projet d’incubation de LF AI, est une boîte à outils open source extensible qui peut aider les utilisateurs à examiner, signaler et atténuer la discrimination et les biais dans les modèles d’apprentissage automatique tout au long du cycle de vie des applications d’IA.

Read More

IBM AI Explainability 360 

Open source

La boîte à outils AI Explainability 360, un projet d’incubation de la LF AI Foundation, est une bibliothèque open source qui prend en charge l’interprétabilité et l’explicabilité des ensembles de données et des modèles d’apprentissage automatique.

Read More

Luigi

Open source

L’objectif de Luigi est de traiter toute la plomberie généralement associée aux processus par lots de longue durée.

Read More

Kedro

Open source

Kedro est un framework Python open source permettant de créer du code de science des données reproductible, maintenable et modulaire.

Read More

GEBI

Open source

Explications globales pour l’identification des biais. Avec notre méthode proposée, nous avons identifié quatre clusters différents.

Read More

Informatica Power Center

Commercial

PowerCenter est une base évolutive et hautes performances pour les initiatives d’intégration de données sur site, notamment les

Read More

FairML  

Commercial

FairML est une boîte à outils Python vérifiant les biais des modèles d’apprentissage automatique.

Read More

Hadoop

Open source

La bibliothèque logicielle Apache Hadoop est un framework qui permet le traitement distribué de grands ensembles de données sur des clusters d’ordinateurs à l’aide de modèles de programmation simples.

Read More

Fairlearn

Open source

Fairlearn est un package Python qui permet aux développeurs de systèmes d’intelligence artificielle (IA) d’évaluer l’équité de leur système et d’atténuer tout problème d’injustice observé.

Read More

FACETS 

Open source

Le projet Facets contient deux visualisations pour comprendre et analyser les ensembles de données d’apprentissage automatique : Facets Overview et Facets Dive.

Read More

Gokart 

Open source

Gokart résout la reproductibilité, les dépendances des tâches, les contraintes d’un bon code et la facilité d’utilisation du Machine Learning Pipeline.

Read More

Genie

Open source

GenieAnalytics offre une capacité d’analyse Big Data approfondie et puissante qui fournit des informations opérationnelles immédiates pour votre entreprise.

Read More

Flyte

Open source

La plateforme d’automatisation des flux de travail pour les données complexes et critiques et les processus de ML à grande échelle

Read More

Dagster

Open source

Dagster est un orchestrateur de données. Il vous permet de définir des pipelines (DAG) en termes de flux de données

Read More

Couler 

Open source

Couler vise à fournir une interface unifiée pour construire et gérer des workflows sur différents moteurs de workflow,

Read More

Bonobo 

Open source

Bonobo est un framework ETL (Extract-Transform-Load) léger pour Python 3.5+.

Read More

Basin

Open source

Extrayez, transformez, chargez à l’aide d’une programmation visuelle capable d’exécuter des tâches Spark dans n’importe quel environnement

Read More

Azkaban

Open source

Azkaban est un planificateur de tâches de flux de travail par lots créé sur LinkedIn pour exécuter des tâches Hadoop.

Read More

Argo Workflows

Open source

Argo Workflows est un moteur de workflow open source natif de conteneur pour orchestrer des tâches parallèles sur Kubernetes.

Read More

Apache Nifi 

Open source

En termes simples, NiFi a été conçu pour automatiser le flux de données entre les systèmes. Bien que le terme « flux de données » soit utilisé dans divers contextes, nous l’utilisons ici pour désigner le flux automatisé et géré.

Read More

Airflow

Open source

Airflow est une plateforme qui vous permet de créer et d’exécuter des flux de travail. Un workflow est représenté sous la forme d’un DAG (un Directed Acyclic Graph),

Read More

ELI5 

Open source

ELI5 est une bibliothèque Python qui permet de visualiser et de déboguer divers modèles de Machine Learning à l’aide d’une API unifiée.

Read More

Pinecone 

Commercial

Pinecone est une base de données vectorielles entièrement gérée qui facilite l’ajout d’une recherche vectorielle aux applications de production. Il combine la recherche vectorielle

Read More

DeepVis Toolbox 

Open source

Il s’agit du code requis pour exécuter la Deep Visualization Toolbox, ainsi que pour générer les visualisations neurone par neurone à l’aide d’une optimisation régularisée.

Read More

Milvus 

Open source

Milvus est une base de données vectorielles open source conçue pour alimenter les applications d’IA et la recherche de similarité vectorielle.

Read More

DeepLIFT  –

Open source

Cette version de DeepLIFT a été testée avec Keras 2.2.4 et tensorflow 1.14.0. Consultez cette question FAQ pour plus d’informations sur d’autres implémentations de DeepLIFT qui peuvent fonctionner avec différentes versions de tensorflow/pytorch, ainsi qu’avec un plus large éventail d’architectures. Voir les balises pour les anciennes versions.

Read More

Marquez

Open source

Marquez est un service de métadonnées open source pour la collecte, l’agrégation et la visualisation des métadonnées d’un écosystème de données.

Read More

lakeFS 

Open source

LakeFS est une plate-forme open source qui offre résilience et facilité de gestion aux lacs de données basés sur le stockage objet.

Read More

ContrastiveExplanation (Foil Trees) 

Open source

L’explication contrastive fournit une explication de la raison pour laquelle une instance a obtenu le résultat actuel (fait) plutôt qu’un résultat ciblé d’intérêt (feuille).

Read More

Intake

Open source

Intake est un ensemble léger d’outils permettant de charger et de partager des données dans des projets de science des données. L’apport vous aide à :

Read More

Captum 

Open source

Captum (« compréhension » en latin) est une bibliothèque open source et extensible pour l’interprétabilité des modèles construite sur PyTorch.

Read More

DVC

Commercial

Data Version Control est un nouveau type de logiciel de gestion des versions, des flux de travail et des expériences de données, qui s’appuie sur Git.

Read More

anchor 

Open source

Une explication d’ancrage est une règle qui « anchors » suffisamment la prédiction localement, de sorte que les modifications apportées au reste des valeurs de caractéristiques de l’instance n’ont pas d’importance. Autrement dit, pour les instances sur lesquelles l’ancre tient, la prédiction est (presque) toujours la même.

Read More

Dolt 

Open source

Dolt est une base de données relationnelle à version contrôlée. Dolt implémente un sur-ensemble de MySQL.

Read More

Delta Lake

Open source

Delta Lake est un projet open source qui permet de créer une architecture Lakehouse au-dessus des lacs de données. Delta Lake propose des transactions ACID,

Read More

Alibi 

Open source

Alibi est conçu pour aider à expliquer les prédictions des modèles d’apprentissage automatique et à évaluer la confiance de ces prédictions.

Read More

Arrikto

Commercial

Une plateforme complète d’apprentissage automatique qui simplifie, accélère et sécurise le développement de modèles jusqu’à la production

Read More

Visual Object Tagging Tool (VOTT)

Open source

Un outil open source d’annotation et d’étiquetage pour les ressources image et vidéo.

Read More

Valohai

Commercial

Valohai vise à supprimer les parties les moins amusantes de l’apprentissage automatique.

Read More

VGG Image Annotator (VIA)

Open source

VGG Image Annotator est un logiciel d’annotation manuelle simple et autonome pour l’image, l’audio et la vidéo. VIA fonctionne dans un navigateur Web et ne

Read More

Sagemaker

Commercial

Amazon SageMaker aide les data scientists et les développeurs à préparer, créer, former et déployer rapidement des modèles d’apprentissage automatique (ML) de haute qualité en regroupant un large ensemble de fonctionnalités spécialement conçues pour le ML.

Read More

V7 Darwin

Commercial

Permettre à toute entreprise, grande ou petite, d’exploiter le sens de la vue et d’automatiser toute tâche visuelle. Pour y parvenir, nous devons

Read More

Superintendent

Open source

surintendant fournit un outil d’étiquetage interactif basé sur ipywidget pour vos données. Il vous permet d’étiqueter de manière flexible toutes sortes de données.

Read More

Polyaxon

Open source

Polyaxon est une plateforme permettant de créer, de former et de surveiller des applications d’apprentissage profond à grande échelle. Nous créons un système pour résoudre la reproductibilité, l’automatisation et l’évolutivité des applications d’apprentissage automatique.

Read More

Super Annotate Data Labelling

Commercial

SuperAnnotate est la plateforme d’annotation d’images et de vidéos de bout en bout pour annoter, entraîner et automatiser votre pipeline de vision par ordinateur.

Read More

Semantic Segmentation Editor

Open source

Un outil d’étiquetage basé sur le Web pour créer des ensembles de données de formation d’IA (2D et 3D).

Read More

Pachyderm

Commercial

Pachyderm est un outil pour les pipelines de données de bout en bout, automatisés et contrôlés par version pour la science des données.

Read More

Sagemaker ground truth

Commercial

Amazon SageMaker Ground Truth est un service d’étiquetage de données entièrement géré qui facilite la création d’ensembles de données de formation très précis pour

Read More

Neu.ro

Commercial

La plateforme Neu.ro assemble de manière transparente vos ressources sur site et cloud, déploie des pipelines et intègre vos outils de développement open source et commerciaux.

Read More

PixelAnnotationTool

PixelAnnotationTool est un logiciel qui vous permet d’annoter manuellement et rapidement des images dans des répertoires. La méthode est pseudo manuelle car elle utilise l’algorithme watershed marqué d’OpenCV

Read More

Modzy 

Commercial

Modzy est la plate-forme logicielle ModelOps et MLOps permettant aux entreprises de déployer, gérer et tirer profit de l’IA, à grande échelle.

Read More

OpenLabeling

Open source

Étiquetage des images dans plusieurs formats d’annotation : PASCAL COV (= darkflow)

Read More

ML Workspace 

Open source

L’espace de travail ML est un IDE Web tout-en-un spécialisé pour l’apprentissage automatique et la science des données.

Read More

LynxKite

Open source

LynxKite est une plateforme open source de science des données graphiques « à guichet unique ».

Read More

Kubeflow 

Open source

Le projet Kubeflow vise à rendre les déploiements de workflows d’apprentissage automatique (ML) sur Kubernetes simples, portables et évolutifs.

Read More

Knime

Commercial

Chez KNIME, nous construisons des logiciels pour créer et produire la science des données à l’aide d’un environnement simple et intuitif, permettant à chaque partie prenante du processus de science des données de se concentrer sur ce qu’elle fait de mieux.

Read More

MedTagger

Open source

MedTagger est un cadre collaboratif pour annoter des ensembles de données médicales

Read More

makesense.ai

Open source

makesense.ai est un outil en ligne gratuit pour étiqueter les photos. Grâce à l’utilisation d’un navigateur, il ne nécessite aucune installation compliquée : il suffit de visiter le site Web et vous êtes prêt à partir.

Read More

Iguazio

Commercial

La plateforme Iguazio Data Science transforme les projets d’IA en résultats commerciaux concrets.

Read More

Labelimg 

Open source

LabelImg est un outil d’annotation d’images graphiques. Il est écrit en Python et utilise Qt pour son interface graphique.

Read More

Label Studio

Open source

Label Studio est un outil d’étiquetage de données open source. Il vous permet d’étiqueter des types de données comme l’audio,

Read More

IBM Watson Studio

Commercial

IBM Watson® Studio permet aux data scientists, aux développeurs et aux analystes de créer, d’exécuter et de gérer des modèles d’IA, et d’optimiser les décisions n’importe où sur IBM Cloud Pak® for Data.

Read More

ImgLab

Open source

Un outil Web pour étiqueter les images d’objets pouvant être utilisé pour entraîner dlib ou d’autres détecteurs d’objets.

Read More

Hopsworks

Commercial

Hopsworks est une plateforme gérée pour la science des données évolutive, prenant en charge à la fois les GPU et le Big Data, dans un environnement de développement familier.

Read More

H2O

Commercial

H2O est une plateforme en mémoire pour l’apprentissage automatique distribué et évolutif.

Read More

Gradient

Commercial

Gradient est un produit Paperspace qui simplifie le développement, la formation et le déploiement de modèles d’apprentissage automatique.

Read More

Domino

Commercial

Domino est une plateforme de science des données qui permet un travail rapide, reproductible et collaboratif sur des produits de données tels que des modèles, des tableaux de bord et des pipelines de données.

Read More

DataRobot

Commercial

Le produit DataRobot Automated Machine Learning accélère le succès de votre IA en combinant une technologie d’apprentissage automatique de pointe avec l’équipe que vous avez en place.

Read More

Dataiku

Commercial

Dataiku est une société d’intelligence artificielle et d’apprentissage automatique fondée en 2013. En décembre 2019,

Read More

ImageTagger

Open source

Il s’agit d’un outil collaboratif en ligne permettant d’étiqueter les données d’images.

Read More

Figure Eight

Commercial

La figure huit fédérale est essentielle à la création d’un système de décision de la plus haute qualité

Read More

Doccano 

Open source

doccano est un outil d’annotation de texte open source pour les humains.

Read More

Dataloop

Commercial

Plateforme de données d’entreprise pour les systèmes d’IA de vision en développement et en production.

Read More

Computer Vision Annotation Tool (CVAT)

Open source

CVAT est un outil gratuit, en ligne et interactif d’annotation de vidéos et d’images pour la vision par ordinateur.

Read More

COCO Annotator

Open source

COCO Annotator est un outil d’annotation d’images basé sur le Web conçu pour être polyvalent et étiqueter efficacement les images afin de créer des données d’entraînement.

Read More

DAGsHub

Open source

DAGsHub est une plate-forme permettant aux scientifiques des données et aux ingénieurs en apprentissage automatique de versionner leurs données, modèles, expériences et codes.

Read More

CNVRG

Commercial

cnvrg.io est une plateforme d’apprentissage automatique construite par des data scientists, pour des data scientists.

Read More

Clear ML

Commercial

ClearML est une plateforme open source qui automatise et simplifie le développement et la gestion de solutions d’apprentissage automatique pour des milliers d’équipes de science des données partout dans le monde.

Read More

Bodywork

Open source

Bodywork déploie des projets d’apprentissage automatique développés en Python sur Kubernetes.

Read More

AzureML

Commercial

Azure Machine Learning est un service cloud permettant d’accélérer et de gérer le cycle de vie des projets d’apprentissage automatique.

Read More

Algorithmia

Commercial

L’algorithme offre le délai de rentabilisation le plus rapide pour l’apprentissage automatique d’entreprise. Déployez, servez et gérez rapidement des modèles de machine learning à grande échelle.

Read More

aiWARE 

Commercial

La plateforme Veritone aiWARE pour Enterprise AI fournit des adaptateurs d’entrée en temps réel, des centaines de moteurs d’IA dans plus de 20 catégories cognitives.

Read More

Kyso 

Commercial

Un centre de connaissances central, pour que chacun puisse apprendre de vos informations sur les données et agir en conséquence.

Read More

Knowledge Repo

Open source

Le projet Knowledge Repo vise à faciliter le partage de connaissances entre les data scientists et d’autres rôles techniques en utilisant des formats de données et des outils qui ont du sens dans ces professions.

Read More

Talend Data Fabric

Commercial

Talend Data Fabric combine les produits Talend dans un ensemble commun de solutions puissantes et faciles à utiliser.

Read More

Metacat

Open source

Metacat est un catalogue de métadonnées et un référentiel de données flexible et open source qui cible les données scientifiques, en particulier celles de l’écologie et des sciences de l’environnement. Metacat accepte XML

Read More

Magda

Open source

Magda est un système de catalogue de données qui fournit un endroit unique où toutes les données de votre organisation peuvent être cataloguées, enrichies,

Read More

Tune 

Open source

Tune est une bibliothèque Python pour l’exécution d’expériences et le réglage d’hyperparamètres à n’importe quelle échelle.

Read More

Informatica Data Catalog

Commercial

Informatica Enterprise Data Catalog est un catalogue de données basé sur l’IA qui fournit un moteur de découverte basé sur le machine learning pour analyser et cataloguer les ressources de données.

Read More

IBM Data Catalog

Commercial

IBM Watson Knowledge Catalog est un catalogue de données ouvert et intelligent pour la gouvernance, la qualité et la collaboration des données d’entreprise et des modèles d’IA.

Read More

Talos

Open source

Talos change radicalement le flux de travail ordinaire de Keras, TensorFlow (tf.keras) et PyTorch en automatisant entièrement le réglage des hyperparamètres et l’évaluation des modèles.

Read More

Google Data Catalog

Commercial

GCP Data Catalog prend rapidement en charge les services de gestion des métadonnées, la disponibilité étant sur le cloud Google.

Read More

Scikit Optimize

Open source

Scikit-Optimize, ou skopt, est une bibliothèque simple et efficace permettant de minimiser les fonctions de boîte noire (très) coûteuses et bruyantes.

Read More

DataHub

Open source

DataHub est une plateforme de métadonnées open source pour la pile de données moderne. Découvrez les architectures des différents systèmes de métadonnées et pourquoi DataHub excelle ici

Read More

CKAN

Open source

Le Comprehensive Knowledge Archive Network (CKAN) est un portail de données ouvertes open source pour le stockage et la distribution de données ouvertes.

Read More

Optuna 

Open source

Optuna est un framework logiciel d’optimisation automatique d’hyperparamètres, particulièrement conçu pour l’apprentissage automatique.

Read More

Katib 

Open source

Katib est un projet natif de Kubernetes pour l’apprentissage automatique automatisé (AutoML). Katib prend en charge le réglage des hyperparamètres, l’arrêt anticipé et la recherche d’architecture neuronale.

Read More

Hyperopt 

Open source

Hyperopt est une bibliothèque Python pour l’optimisation série et parallèle sur des espaces de recherche difficiles, qui peuvent inclure des dimensions à valeur réelle, discrète et conditionnelle.

Read More

Hypera

Open source

Un wrapper pratique très simple autour d’hyperopt pour un prototypage rapide avec des modèles keras.

Read More

Veri 

Open source

Veri est un magasin d’étiquettes de fonctionnalités. Le magasin d’étiquettes de fonctionnalités permet de stocker des fonctionnalités sous forme de clés et d’étiquettes sous forme de valeurs. L’interrogation de valeurs n’est possible qu’avec knn utilisant des fonctionnalités.

Read More

Ivory  

Open source

ivory définit une spécification sur la manière de stocker les données d’entité et fournit un ensemble d’outils pour les interroger.

Read More

Hopsworks Feature Store  

Open source

Hopsworks et son Feature Store sont une plate-forme d’IA open source à forte intensité de données utilisée pour le développement et l’exploitation de modèles d’apprentissage automatique à grande échelle.

Read More

Azure Data Catalog

Commercial

Azure Data Catalog est un catalogue de métadonnées à l’échelle de l’entreprise permettant la découverte d’actifs de données en libre-service. Il s’agit d’un service entièrement géré dans Azure.

Read More

Feast

Open source

Feast (Feature Store) est un système de données opérationnel permettant de gérer et de fournir des fonctionnalités d’apprentissage automatique aux modèles en production.

Read More

ByteHub 

Commercial

ByteHub est un magasin de fonctionnalités basé sur Python conçu pour être aussi facile à utiliser et familier que possible aux data scientists.

Read More

Atlan Data Catalog

Commercial

Il s’agit d’un outil moderne de catalogue et de découverte de données. Un catalogue de données est un inventaire soigneusement organisé des ressources de données dans toutes vos sources de données.

Read More

Apache Atlas

Open source

Apache Atlas est un système open source de gestion et de gouvernance des métadonnées conçu pour vous aider à trouver, organiser et gérer facilement les actifs de données.

Read More

Butterfree

Open source

Il s’agit d’un magasin de fonctionnalités, comme son nom l’indique, correspond à un ensemble organisé de fonctionnalités pour les modèles d’apprentissage automatique.

Read More

Amundsen 

Open source

Amundsen est un moteur de découverte de données et de métadonnées permettant d’améliorer la productivité des analystes de données, des data scientists et des ingénieurs lorsqu’ils interagissent avec les données.

Read More

Papertrail

Commercial

SolarWinds® Papertrail™ fournit une gestion des journaux basée sur le cloud qui regroupe de manière transparente les journaux des applications, des serveurs, des périphériques réseau, des services, des plates-formes et bien plus encore.

Read More

Weights and biases

Commercial

Weights & Biases est la plateforme d’apprentissage automatique permettant aux développeurs de créer plus rapidement de meilleurs modèles.

Read More

HealthchecksIO

Commercial

Healthchecks est un service de surveillance des tâches cron. Vous pouvez utiliser Healthchecks.io pour une surveillance légère du serveur :

Read More

Cronitor

Commercial

Cronitor est une application de suivi basée sur le Web qui surveille, alerte et analyse les processus informatiques planifiés.

Read More

Sacred

Open source

Sacred est un outil pour configurer, organiser, enregistrer et reproduire des expériences informatiques.

Read More

GitHub Actions

GitHub Actions facilite l’automatisation de tous vos flux de travail logiciels, désormais avec CI/CD de classe mondiale. Créez, testez et déployez votre code

Read More

CML

Open source

L’apprentissage automatique continu (CML) est un outil CLI open source permettant de mettre en œuvre l’intégration et la livraison continues (CI/CD) avec

Read More

Neptune AI

Commercial

Neptune est un magasin de métadonnées pour MLOps, conçu pour les équipes qui effectuent de nombreuses expériences.‌

Read More

Azure Devops

Commercial

Azure DevOps fournit des services de développement permettant aux équipes de support de planifier le travail, de collaborer au développement de code, ainsi que de créer et de déployer des applications.

Read More

AWS CodePipeline

Commercial

AWS CodePipeline est un service de livraison continue entièrement géré qui vous aide à automatiser vos pipelines de versions pour des mises à jour rapides et fiables des applications et de l’infrastructure.

Read More

Enter your contact information to continue reading