Data Engineer - Alternance H/F
Alternance Palaiseau (Essonne) Développement informatique
Description de l'offre
Description
SOCOTEC Monitoring France, leader dans le domaine de l'inspection et de la certification, offre des services dans les secteurs de la construction, des infrastructures et de l'industrie.Le Data & AI Hub SOCOTEC, composé de spécialistes en Data Engineering et Data Science, est chargé non seulement de la gestion et de l'optimisation des données, mais aussi de la mise en place de traitements et d'analyses de données. Nous développons des applications basées sur les données pour soutenir les activités métiers de SOCOTEC.En rejoignant notre équipe Data, vous aurez l'opportunité de travailler sur des projets innovants autour de notre Datalake, un élément central de notre stratégie data.Cette alternance vous permettra de faire partie de notre équipe de Data Engineers et de contribuer activement à nos initiatives data. Rejoignez-nous pour transformer les données en valeur ajoutée, développer des solutions pratiques et participer à des projets stimulants au sein d'une entreprise leader de son secteur.Description du posteNous recherchons un(e) alternant(e) Data Engineer pour intégrer notre équipe Data SOCOTEC.Accompagné par un Data Engineer, vous participerez activement à la maintenance et l'optimisation de notre Datalake, ainsi qu'à la création et la mise à jour des flux de données. Vous serez également responsable de la documentation et de la validation de ces flux, ainsi que de la création et de la mise en place d'outils de reporting tels que Power BI.Vous travaillerez sur trois missions principales :- Au sein de l'entité Socotec Monitoring France (10%), vous participerez à la définition de la stratégie optimale de données pour Socotec Monitoring (structuration, processus, open data, achats de données externes)- Pour le compte du groupe Socotec (70%), vous participez à la construction du Data Lake à l'échelle monde. Votre objectif sera de développer les flux de donner pour leur analyse en lien avec les équipes BI et Data Science. Vous apprendrez à organiser et ordonnancer les flux d'extraction, de transformation et de chargement des données en garantissant leur fiabilité, leur disponibilité, etc.- Auprès des clients (20%), vous participerez au pilotage de A à Z de projets finaux : collecte des données, pipeline de prétraitement, modélisation et déploiement.Stack technique utilisée :- Amazon Web Services (AWS)- Apache Airflow comme ordonnanceur- Spark pour les pipelines ETL- GitLab pour le versionnement des sources- Kubernetes- DeltaLake- Amazon S3- Gestion des métadonnées avec OpenMetadata- Power BI pour la business intelligence, en collaboration avec les équipes BI
Date de début
13 mai, 2025
Expérience
Inf_1
Profil
Nous recherchons un profil motivé, rigoureux et passionné par les données, prêt à s'investir pleinement dans des projets ambitieux et à développer ses compétences au sein d'une équipe dynamique et innovante. Rejoignez-nous pour une expérience enrichissante qui pourrait se transformer en un CDI à l'issue de votre alternance.- Master en Big Data ou Ingénieur Informatique avec appétence en data- Maîtrise des bases de données (SQL, NoSQL) et concepts asosciés- Connaissance de la Stack Big data (airflow, spark, hadoop)- Utilisation des outils collaboratifs de développement (GIT, GITLAB, NoteBooks Jupyter, etc.)- Connaissance AWS appréciée (Lambda, EMR, S3)- Goût affirmé pour les technologies innovantes- Esprit d'équipe- Anglais courant et technique
Répartition du temps de travail
Full time
Fonction
Informatique_syst_info
Formation
RJ/Qualif/Ingenieur_B5
Secteur
Qualité, sécurité, santé, environnement