Les offres de “Edf”

Nouveau Edf

STAGE Application des systèmes multi-agents pour la fouille documentaire F/H (2025-130584)

  • Stage
  • Palaiseau (Essonne)
  • Développement informatique

Description de l'offre

Description de l'offre

Application des systèmes multi-agents pour la fouille documentaire : optimisation des performances des OCRs dans l’extraction de données textuelles

 
Avec près de 2000 collaborateurs de 29 nationalités, EDF Lab Paris Saclay travaille sur plus de 250 projets de recherche et de développement qui visent à répondre aux enjeux du Groupe EDF d'aujourd'hui et aux évolutions de demain.
Dans ce cadre, au sein du Département PERICLES (PErformance et prévention des Risques Industriels du parC par la simuLation et les EtudeS), le groupe ARTEMIS réunit les compétences de modélisation / interaction 3D et d'analyse visuelle de données et d’intelligence artificielle. Le projet PING (Performance des INGénieries) mène des activités de développement d’outils innovants pour rendre la documentation intelligente.

Cette documentation se compose de plans, essentiellement sous forme de documents images, qui sont organisés selon une architecture complexe, chaque plan faisant référence à une dizaine d’autres plans apportant des informations sur la continuité de celui-ci (plans voisins) ou des informations complémentaires (plans de différentes typologies ; schémas mécaniques, électriques, ...). Les installations électronucléaires d’EDF ayant entre 20 et 40 ans, la documentation historique a été pensée pour une gestion papier et non informatique. Aujourd’hui, les plans sont très chronophages à exploiter ; la ressaisie de toutes les informations relatives au plan, localisation (bâtiment, local), numéros de contrat, applicabilité sur les technologies ou sur les unités de production concernées, … sont assez variables en fonction de l’année d’édition du document et cette ressaisie n’a pas forcément été réalisée exhaustivement.

Le lot Fouille Documentaire du projet PING (Performance des Ingénieries) cherche à améliorer les performances d’une IA de type OCR permettant de détecter des références dans des corpus de documents pdfs non-intelligents. Plusieurs OCR sont actuellement disponibles, avec des bonnes performances. Il n’en reste pas moins qu’ils peuvent produire des hallucinations pouvant coûter cher.

Pour améliorer les performances de prédiction, l’équipe R&D cherche à investiguer l’usage d’algorithmes de consensus pour fiabiliser les prédictions. Ces algorithmes permettent d’assurer un consensus au sein d’un réseau, avec certaines garanties de fiabilité malgré la présence de noeuds “malveillants” (ou qui produisent des hallucinations pour une IA). L’une des difficultés est de s’affranchir d’entrainements, d’où l’idée d’explorer des algorithmes d’IA multi-agents qui “échangent entre elles” et produisent des réponses les plus performantes possibles, plutôt que des modèles de types soupe d’experts.

Plusieurs frameworks sont disponibles aujourd’hui pour pouvoir mettre en place des IA multi-agents avec différents degrés d’autonomies : Autogen de Microsoft, LangGraph de LangChain, smolagents d’HuggingFace, etc.

 

 

 

 

 

Profil souhaité

L’objectif de ce stage est donc de mettre au point un système d’IA multi-agents et de s’assurer de sa fiabilité (i.e. limiter les hallucinations collectives) en injectant le “bon” degré d’autonomie. L’étudiant pourra pour cela s’appuyer sur des résultats classiques d’algorithmes de consensus.

 

Compétences requises

• Compétences en mathématiques appliquées (probabilités)
• Utilisation de réseaux de neurones profonds pour les images
• Développement Python, bibliothèques de vision par ordinateur, bibliothèques de statistiques et apprentissage automatique.
• Des connaissances en systèmes distribuées
Profil souhaité : Bac+5, élève ingénieur ou étudiant en Master 2 en informatique, mathématiques appliquées, vision par ordinateur, machine learning.

 

Conditions matérielles

Lieu du stage :

EDF/Division R&D, 7 boulevard Gaspard Monge, 91120 PALAISEAU, Département PERICLES / Groupe I2C (ARTEMIS)

Durée :

5-6 mois, début souhaité en mars 2025.

Indemnité de stage :

Approximativement 1200 € / mois, possibilité d’aide au logement.

Encadrement du stage :

Frédérique ROBIN, Ingénieur Chercheur

Faire de chaque avenir une réussite.
  • Annuaire emplois
  • Annuaire entreprises
  • Événements