Stage Data Engineer pour la Mise en Oeuvre d'Un Pipeline de Données pour un Rex sur une Station de Traitement des Eaux Usées H/F
Stage Aubervilliers (Seine-Saint-Denis)
Description de l'offre
Description
- Objectifs Le numérique, et l'innovation au sens large, permettent à Veolia de transformer en profondeur ses méthodes de travail et ses offres. De par ses activités, le groupe Veolia génère des volumétries de données importantes et de typologies différentes (capteurs, images, essais pilote). L'objectif de ce stage est de travailler sur les différentes phases des projets pour valoriser ces données, devenues des matières premières, afin de répondre aux problématiques des métiers du groupe. Le stage vise à mettre en oeuvre un pipeline de données pour mener un REX sur une station de traitement des eaux usées. - Missions principales Rattaché(e) à l'équipe Calcul Scientifique et Modélisation, vous travaillerez en étroite relation avec les experts métiers (fournisseurs ou utilisateurs des données dans le cadre du suivi des installations, process et pilotes), les data scientists (consommateurs des données), les architectes cloud et les développeurs informatiques. Vos principales missions seront : - Prendre connaissance des outils informatiques utilisés par le groupe ainsi que de la documentation existante - Comprendre les enjeux et les besoins des différents projets dans lesquels vous interviendrez - Explorer et analyser les données mise à disposition par les experts métier - Développer et tester les solutions techniques de traitement des données et création de variables explicatives en lien avec les data scientist - Développer et tester les solutions de visualisation des données en lien avec les développeurs cloud - Tester et valider les choix techniques - Documenter les solutions et les résultats obtenus
Date de début
29 oct., 2025
Profil
- Formation Niveau Master 2 ou élève en école d'ingénieur (Bac +5) en spécialisation informatique - Vos compétences - Bagage en mathématiques/statistiques, en analyse de données volumineuses - Maîtrise du langage SQL - Bonne connaissance du langage de programmation (Python) - Connaissance du versioning avec Git - Connaissance des APIs REST (flask ou FastAPI) - Connaissance des services Google Cloud Platform, notamment Bigquery et Looker Studio seraient appréciées - Familiarité avec le système d'exploitation Linux - Vos qualités, votre savoir-être - Bonne communication - Capacité d'analyse - Rigueur, réactivité - Aptitude à travailler en équipe - Autonomie
Répartition du temps de travail
Full time
Fonction
Informatique_syst_info
Formation
RJ/Qualif/Ingenieur_B5
Secteur
Environnement