Stage Innovation Ingénieur Intelligence Artificielle - Nlp H/F
Stage FRANCE
Description de l'offre
Description
Au sein de notre Lab de Rennes, vous serez accompagné(e) par un Pilote Innovation (Chef de projet) pour vous permettre de développer vos compétences sur les activités d'un des projets suivants (plusieurs stages à pourvoir).Projet : Illustrateur RAG (LLM) sur des données d'entreprises hétérogènesLes entreprises possèdent beaucoup de données internes sous exploitées. En cause, les données sont souvent hétérogènes, volumineuses, multi-sources, de faible qualité et confidentielles/protégées. Pourtant, rendre accessible ces données en une base de connaissances permettrait un gain de temps important pour les entreprises. A partir des avancées récentes des modèles de langues LLM, et en s'appuyant sur l'expertise acquise via deux projets ALTEN, l'objectif sera de mettre en place un illustrateur permettant d'illustrer l'intérêt de construire une telle base de connaissances avec des données réelles internes et externes.Le travail consistera notamment à : - Intégrer/Améliorer des composants IA existants dans la plateforme (OCR, RAG, IA pour augmenter la qualité des données QoD) - Construire un illustrateur à partir des plateformes et interfaces existantes - Livrable final : une vidéo et un scénario démo live utilisant les composantsProjet : Pilotage en langage naturel dans un environnement multi-agentsAujourd'hui il est possible de commander un appareil (un agent) à la voix via des instructions paramétrées. Or, pour faciliter la reconnaissance, ces instructions sont souvent simples et spécifiques à l'agent. Nous souhaitons mettre en place un environnement dans lequel plusieurs agents co-existent ensemble, et pour lequel un seul système de reconnaissance vocale permet de piloter l'ensemble de ces agents à partir de peu de données. Dans ce contexte, l'objectif de ce stage sera de : - Utiliser des modèles de NLP (LLM, NER, POS tagging) pour détecter des intentions et les champs associés - Mettre en place un modèle de rejets pour filtrer l'information pertinente - Programmer en langage naturel à partir de l'interprétation des instructions : "drone suis-moi !" = Détecter ma position + Avancer jusqu'à ma position tant qu'il n'y a pas de contre ordreProjet : Exploration de la programmation en langage naturel vers un langage exécutableALTEN souhaite disposer d'une plateforme expérimentale donnant les moyens de montrer à ses clients de nouvelles approches en matière d'écriture et d'exécution de scénario en langage naturel (NLP). Nous avons déjà posé l'approche à travers deux cas d'usage basics. Aujourd'hui nous voulons aller plus loin dans le passage de scripts en langage naturel vers leur équivalent en langage. - Poursuivre l'état de l'art en la matière - Explorer des pistes de réalisation (utilisation des outils du NLP : distance sémantique, IA génératives, Ontologies) - Expérimenter à travers un cas d'usage (exemple : l'automatisation des tests d'une application) - Evaluer les différentes expérimentations (mesures, critiques et perspectives)Projet : Extraction d'information dans les documents pour détecter le GreenWashingLe développement durable devient un enjeu majeur pour la société publique et les entreprises. Les placements dans les ISR (Investissement Socialement Responsable) sont un moyen d' infléchir l'économie vers un développement plus durable. Néanmoins, la réglementation est floue et peu exigeante, ce qui laisse à certaines entreprises malveillantes la possibilité de tromper les investisseurs et consommateurs pour se présenter faussement en faveur de l'écologie (GreenWashing). Dans ce contexte, les objectifs sont les suivants : - Collecter des données publiques des entreprises indiquant leur stratégie de développement durable (RSE, Rapport Annuel) - Extraire les entités en lien avec la stratégie green et les contextualiser - Définir des critères d'évaluation des stratégies greenProjet : llustrateur d'un assistant vocal s'appuyant sur les LLM dans un environnement multi-agentsLes assistants vocaux apparus depuis les années 90 se sont développés et ont pu s'améliorer avec les techniques d'Intelligence Artificielle (IA). Aujourd'hui les LLM (Intelligences Artificielles Génératives) permettent une utilisation de ces assistants de manière plus naturelle, intuitive et personnalisée à l'utilisateur. Dans ce contexte, nous avons développé une solution permettant d'interagir avec différents agents (robot, logiciel métier) dans un environnement multi-agents évolutif. Ces systèmes permettent non seulement de reconnaitre des commandes, mais aussi de générer des scripts plus complexes à partir de ces commandes primitives. Par exemple : "drone suis moi" s'interprète de la manière suivante : 1. Allumer la caméra 2. Détecter ma position 3. Avancer jusqu'à ma position 4. boucler tant qu'il n'y a pas de contre indication. Dans ce contexte, les missions confiées sont les suivantes : - Contribuer à l'amélioration du modèle d'IA - Améliorer l'interaction avec ces agents (ROS2, Python) - Construire un scénario/illustrateur mettant en avant : l'intérêt de la communication vocale dans un contexte métier ainsi que la simplicité de la communication avec les agents et entre les agents.
Date de début
13 mai, 2025
Expérience
Inf_1
Profil
Vous êtes étudiant(e) en dernière année d'École d'Ingénieur à la recherche d'un stage de fin d'étude et vous avez suivi une spécialité en Intelligence Artificielle / Data Science (deep learning, NLP, BERT, NER, BLOOM, GPT). Vous justifiez de bonnes connaissances en IA/NLP, en développement (Python, Java) et avez des bases en IHM. Vous maîtrisez plusieurs outils associés tels que Spacy, Flask, Pands, Hugging Face - Transformers, que vous avez su mettre en application lors de votre formation.Une appétence à la recherche et / ou à la communication seraient fortement appréciées.Réactif(ve), rigoureux(se), autonome et doté(e) du sens du service, vous souhaitez évoluer dans un environnement challengeant.
Fonction
Informatique_syst_info
Formation
RJ/Qualif/Ingenieur_B5
Secteur
Inform_SSII