data.gouv.fr recrute

Data Engineer

Poste ouvert le

Etalab recrute un Data Engineer !

Etalab cherche un·e Data engineer pour renforcer ses compétences sur le traitement, l’analyse et la qualité des données, notamment auprès de l’équipe data.gouv.fr.

Vos missions en quelques mots

Sous le pilotage du Directeur Technique et du lead Data Engineer d’Etalab, le ou la Data Engineer sera amené(e) à travailler sur différents axes, décrits ci-dessous.

La réutilisation des données publiques passe par leur normalisation. Etalab adresse notamment ce problème avec l’initiative schema.data.gouv.fr, qui vise à référencer un maximum de standards utiles à la production de données open data.

  • Accompagner les producteurs de schémas de données
  • Animer le réseau de producteurs et de fédération de producteurs
  • Maintenir et développer des outils autour de la qualité des données : schema.data.gouv.fr, publier.etalab.studio…
  • Améliorer l’intégration des produits “schémas” avec la plateforme : consolidation, détection de schémas, visualisations…
  • Accompagner les producteurs de données : aide à la publication de jeux de données majeurs, enrichissement (géolocalisation, croisement de données)…
  • Gérer l’infrastructure des données : mise en place d’un datalake généralise, d’éventuels datalakes thématisés, analyse automatisée des fichiers référencés sur data.gouv.fr, interfaçage du pôle IA avec les données…
  • Améliorer les usages autour des statistiques et des métriques de data.gouv.fr

La polyvalence est un pré-requis important puisqu’il s’agit aussi bien d’animer des groupes de travail que de développer des outils web, en plus des compétences inhérentes au métier du Data Engineering. La ou le Data Engineer travaillera avec d’autres administrations sur de nombreuses politiques publiques.

Profil recherché

Vous êtes titulaire d’un diplôme de niveau master en data sciences ou informatique et vous avez une expérience d’au moins 5 ans dans ce domaine. Vous avez de solides connaissances en traitement des données et bases de données.

Les compétences attendues sont :

  • Connaître le langage Python, notamment pour travailler sur la la qualité et l’enrichissement des données ; des outils de construction de de traitements des données (ex : Airflow) et déploiement d’API (ex : Flask, FastAPI) ; des outils de visualisation de données (ex : Dash, Metabase)
  • Maîtriser des solutions de base de données (ex : PostGreSQL, MongoDB, ElaticSearch, S3, etc) pour requêter, stocker ou transférer de gros volumes de données
  • Avoir une bonne autonomie en administration système (Unix/Linux, Docker)
  • Savoir travailler en équipe et de manière agile tout en documentant son travail
  • Connaître des données publiques et bases en développement web front
  • Faire preuve de curiosité pour aborder les sujets très différents qui peuvent émerger

Informations administratives

  • Contrat CDD 3 ans
  • Rémunération à déterminer en fonction de l’expérience du candidat
  • Télétravail jusqu’à trois jours par semaine
  • Basé à Paris (20 avenue de Ségur 75007 Paris)

Postuler par mail

Participer à la communauté

En travaillant pour une Startup d’Etat et de Territoire, vous devenez membre de la communauté beta.gouv. Celle-ci se construit par l’investissement volontaire de ses membres ce qui veut dire que chaque membre peut proposer de nouvelles idées, les mettre en oeuvre ou rejoindre un travail en cours.

L’engagement dans la communauté peut prendre différentes formes, de faire le café à participer à une équipe transverse en passant par organiser une conférence.

L’objectif est de faire de beta.gouv une communauté vivante, riche des expériences et de l’engagement de chacun, et qui apporte un cadre de travail stimulant pour ces membres.

En tant que membre, vous pouvez et êtes invités à vous engager dans la communauté. Si vous avez des questions, n’hésitez pas à les poser lors de votre entretien.