EvalAP
Évaluer des modèles et pipeline d’IA pour orienter des choix produits
EvalAP, c’est quoi ?
Une plateforme d’évaluation des modèles d’IA, développée par Etalab.
Elle permet de tester, comparer et analyser des modèles (comme Mistrall Small ou Llama 70b) sur différents jeux de données.
À quoi ça sert concrètement ?
-
Comparer plusieurs modèles d’IA pour voir lequel est le plus performant sur une tâche donnée.
-
Naviguer facilement entre les modèles, les datasets, les expériences et les résultats.
-
Piloter les évaluations via une API ou une interface web.
-
Aider à choisir les bons modèles IA pour les projets de l’administration ou de la recherche.
Côté technique :
-
Interface publique : evalap.etalab.gouv.fr
-
Documentation: evalap.etalab.gouv.fr/doc
-
Compatible avec des notebooks Jupyter
-
Entièrement open source, sous licence MIT
À propos
EvalAP est portée par ALLiaNCE.
Ce service numérique est sponsorisé par Direction interministérielle du numérique
Standards de qualité
L'évaluation des standards de beta.gouv.fr n'a pas encore été réalisée sur ce produit.
En savoir plus sur les standardsEn quelques dates
Investigation
Construction
3 septembre 2025
Accélération
Transfert
Pérennisé
L'équipe
Audrey Clevy
Data Scientist MLOps