L’Annuaire des Entreprises recrute

un.e data / search engineer

Ce poste a été pourvu depuis son ouverture le

🤓 Contexte

L’équipe de l’Annuaire des Entreprises (le moteur de recherche des informations des entreprises) cherche son ou sa responsable moteur de recherche.

Qui sommes-nous ?

L’équipe de l’Annuaire des Entreprises fait partie d’Etalab, au sein de la direction interministérielle du numérique (DINUM).

Etalab compte une cinquantaine de collaborateurs, fonctionnaires, contractuels et prestataires. Nos bureaux sont à Paris, avenue de Ségur, mais nous travaillons parfois d’un peu partout. Nous avons des compétences, profils et des centres d’intérêt variés au sein de l’équipe, mais nous sommes réunis par des objectifs communs : mettre la technologie au service de l’intérêt général et moderniser l’administration grâce au numérique.

Le produit

L’Annuaire des Entreprises est le site public sur lequel tous les citoyens, entrepreneurs ou agents d’administration peuvent retrouver les données publiques détenues par l’administration au sujet d’une entreprise française.

N’hésitez pas, 👉 faites un petit tour !

Rôle et mission

En tant que responsable moteur de recherche, vous serez amené.e à collecter, traiter, et exposer les données des entreprises françaises afin d’alimenter le site annuaire-entreprises.data.gouv.fr. Vous devrez concevoir une architecture robuste et performante permettant au site de monter en charge tout en améliorant la pertinence des résultats de la recherche.

Vous assurerez notamment les missions suivantes:

🔍 Moteur de recherche :

  • Conception, implémentation et maintien en condition opérationnel du moteur de recherche (indexation de plusieurs dizaines de millions d’entreprises, avec des dizaines de critères de recherche)
  • Amélioration de la fréquence de rafraichissement des données sources (passage d’une mise à jour mensuelle à une mise à jour quotidienne)
  • Implémentation de nouvelles fonctionnalités pour l’amélioration de la pertinence des résultats de recherche (recherche fuzzy, filtres à facettes etc.)
  • Mise en place de tests de pertinence des résultats de recherche
  • Réflexion à mener sur les données à intégrer dans la recherche afin d’en améliorer la pertinence

🛠 Infrastructure :

  • Mise en place d’une infrastructure résiliente, scalable et performante permettant de :
    • Mettre en place des pipelines de données (ETL) permettant la récupération, le traitement et l’indexation des données
    • Mettre les données à disposition des utilisateurs via une API REST
  • Challenge continu sur les technologies utilisées
  • Travail de concert avec la direction technique d’Etalab et les outils mutualisés mis à disposition, notamment sur la partie ops

Nos bonnes pratiques

  • Code open source
  • Sprint hebdomadaire
  • Amélioration continue de nos process
  • Développement de produit centrés utilisateurs
  • Partage de connaissances et expériences avec les autres pôle d’Etalab

Profil recherché

  • Technologies de moteur de recherche (Elasticsearch, Postgrest, Meilisearch, Solr etc.)
  • Traitement et pipelines de données / ETL (Python, Spark, Shell etc.)
  • Administration System (Debian) / Infrastructure OPS (Ansible, Docker)
  • Base de données (Postgres, Mongo, S3, etc.)

Environnement de travail

  • 4-5 jours par semaine
  • 6 mois renouvelables
  • Début souhaité dès que possible
  • Freelance
  • Télétravail possible avec un jour par semaine à Paris

Intéressé.e ?

Aujourd’hui, l’Annuaire, c’est une petite équipe d’individus rassemblés par l’envie de construire ensemble un produit qui change la vie des entrepreneurs. Si tu as envie de nous prêter main forte, n’hésite pas ! Envoie nous ton CV à annuaire-entreprises@data.gouv.fr ✉️

Participer à la communauté

En travaillant pour une Startup d’Etat et de Territoire, vous devenez membre de la communauté beta.gouv. Celle-ci se construit par l’investissement volontaire de ses membres ce qui veut dire que chaque membre peut proposer de nouvelles idées, les mettre en oeuvre ou rejoindre un travail en cours.

L’engagement dans la communauté peut prendre différentes formes, de faire le café à participer à une équipe transverse en passant par organiser une conférence.

L’objectif est de faire de beta.gouv une communauté vivante, riche des expériences et de l’engagement de chacun, et qui apporte un cadre de travail stimulant pour ces membres.

En tant que membre, vous pouvez et êtes invités à vous engager dans la communauté. Si vous avez des questions, n’hésitez pas à les poser lors de votre entretien.