Etalab recrute

Data-Scientiste + appétence backend

Une offre à pourvoir chez nos camarades
Voir l'offre sur le site de Etalab
Ce poste a été pourvu depuis son ouverture le

Choix technologiques :

  • python

L’équipe Piaf recrute un·e Data-Scientiste expérimenté·e avec une appétence pour le dev backend

Qui sommes-nous :

La branche IA d’Etalab

La branche intelligence artificielle d’Etalab accompagne les administrations dans l’usage des datasciences et de l’Intelligence Artificielle. Elle créé aussi des outils en open-source là où des besoins en IA ont été identifiés. Piaf est l’un de ces outils.

Piaf

Piaf permet aux administrations publiques qui ont de nombreux documents de mettre en place la recherche d’information dans ces documents, à moindre coût, et en quelques jours seulement, tout en gardant le contrôle des données. Le cas d’usage classique est la barre de recherche, mais ce n’est pas le seul. La solution mélange des modèles d’indexation classiques (type ElasticSearch) avec des modèles d’IA francophones afin d’améliorer considérablement les performances, et d’aller jusqu’à la réponse précise (Question-Answering) quand les solutions actuelles ne retrouvent que les documents. Pour en savoir plus sur les origines de Piaf, c’est ici

Missions et rôle

Tu travailleras avec l’équipe actuelle (3 personnes) pour automatiser le produit actuel, et lui permettre de passer à l’échelle. Piaf est un produit puissant qui permet de configurer des chaines de traitement de texte pour obtenir la recherche de l’information la plus précise possible. Par exemple, Piaf permet de combiner Elasticsearch avec des embeddings de type Sentence-Bert afin de palier aux limites des représentations creuses avec les avantages sémantiques des représentations denses (prendre en compte les synonymes par exemple). Piaf permet aussi d’intégrer le Question-Answering en bout de recherche d’Information.

  • Extraction, transformation et chargement des données
  • Expériences NLP/ML pour maximiser la performance de notre outil pour chaque cas d’usage
    • automatisation du choix des paramètres (ex: méthodologie grid search)
    • analyses et documentation des résultats
    • test de performances continu: nous améliorons nos pipelines en continu et leurs déploiements sont automatiques
  • Question-answering: fine-tuner les modèles de QA francophones que nous avons développé
  • Prise en compte du feedback utilisateur pour améliorer les performances

Les technologies sont :

  • Haystack
  • Transformers
  • Python (debugging, code modulaire, notebooks)
  • pandas, scikit-learn, pytorch, fairseq, sentence-bert
  • ElasticSearch

Compétences :

  • D’au moins 3 ans d’expérience dans le web
  • Familier des technologies listées
  • Un bon sens du design
  • Une préférence pour des solutions simples et durables
  • Une connaissance des méthodes de développement agile
  • Une connaissance des outils classiques (GitHub, CI, Figma, etc.)
  • Dynamisme, autonomie et bienveillance

Modalités de travail :

  • Début de la mission dès que possible.
  • Télétravail possible. Déplacements à Paris possible
  • Contrat de 4 mois
  • À 3 jours par semaine
  • Taux Journalier Moyen à discuter, indicatif ici

Postuler :

Expliquez-nous pourquoi vous avez envie de nous rejoindre et envoyez-nous votre LinkedIn & GitHub
piaf@data.gouv.fr

Participer à la communauté

En travaillant pour une Startup d’Etat et de Territoire, vous devenez membre de la communauté beta.gouv. Celle-ci se construit par l’investissement volontaire de ses membres ce qui veut dire que chaque membre peut proposer de nouvelles idées, les mettre en oeuvre ou rejoindre un travail en cours.

L’engagement dans la communauté peut prendre différentes formes, de faire le café à participer à une équipe transverse en passant par organiser une conférence.

L’objectif est de faire de beta.gouv une communauté vivante, riche des expériences et de l’engagement de chacun, et qui apporte un cadre de travail stimulant pour ces membres.

En tant que membre, vous pouvez et êtes invités à vous engager dans la communauté. Si vous avez des questions, n’hésitez pas à les poser lors de votre entretien.