Tpot 

Communauté d’assistance GitHub Outils d’optimisation

TPOT signifie Outil d’optimisation de pipeline basé sur un arbre. Considérez TPOT comme votre assistant de science des données. TPOT est un outil d’apprentissage automatique automatisé Python qui optimise les pipelines d’apprentissage automatique à l’aide de la programmation génétique.

TPOT automatisera la partie la plus fastidieuse de l’apprentissage automatique en explorant intelligemment des milliers de pipelines possibles pour trouver celui qui convient le mieux à vos données.

Caractéristiques

FeatureSetSelector est un nouvel opérateur spécial dans TPOT. Cet opérateur permet une sélection de fonctionnalités basée sur des connaissances expertes a priori. Par exemple, dans l’analyse de l’expression génique RNA-seq, cet opérateur peut être utilisé pour sélectionner un ou plusieurs ensembles de gènes (caractéristiques) en fonction des termes GO (Gene Ontology) ou des ensembles de gènes annotés Base de données de signatures moléculaires (MSigDB) dans le 1er étape du pipeline via l’option de modèle ci-dessus, afin de réduire les dimensions et le temps de calcul TPOT. Cet opérateur nécessite une liste d’ensembles de données au format csv. Dans ce fichier csv, il n’y a que trois colonnes : la 1ère colonne contient les noms des ensembles de fonctionnalités, la 2ème colonne est le nombre total de fonctionnalités dans un ensemble et la 3ème colonne est une liste de noms de fonctionnalités (si l’entrée X est pandas.DataFrame) ou d’index ( si l’entrée X est numpy.ndarray) délimité par « ; ». Vous trouverez ci-dessous un exemple d’utilisation de cet opérateur dans TPOT.

Site officiel

Tutoriel et documentation

Enter your contact information to continue reading