Stage Data Scientist H/F
Stage Saint-Géréon (Loire-Atlantique)
Description de l'offre
Description
* Nettoyage & Documentation du code existant. * Mise en place d'un framework d'évaluation (RAGAs/TruLens). * Optimisation RAG : Meilleur parsing de tableaux, amélioration du retrieval et prompt engineering. * Amélioration Vocale : Tests de modèles Whisper (STT) et Coqui TTS (TTS/Clonage). * Démonstration : Création d'une interface (Streamlit/Gradio) et exploration multimodale. * Environnement technologique: * Python 3, LangChain, Ollama (Llama 3.1, Mistral), FAISS, PyMuPDF, Whisper, Coqui TTS.
Date de début
03 déc., 2025
Expérience
Inf_1
Profil
Étudiant(e) en dernière année d'école d'ingénieur ou Master 2 (Bac +5) en Informatique. Spécialisation en Intelligence Artificielle, Data Science ou Traitement du Langage Naturel (NLP). Compétences techniques nécessaires: Excellente maîtrise du langage Python et de son écosystème scientifique. Solide compréhension théorique et pratique du Machine Learning, Deep Learning et NLP (embeddings, LLMs). Connaissance des concepts de l'architecture RAG. Compétences souhaitables : Expérience avec des frameworks comme LangChain. Connaissance des bases de données vectorielles (ex: FAISS). Utilisation de LLMs locaux (ex: via Ollama) ou Cloud (API). Notions en parsing PDF (ex: PyMuPDF) et en interaction vocale (Whisper, Coqui TTS). Expérience avec Streamlit ou Gradio. Vous Curiosité technique et goût prononcé pour l'expérimentation Autonomie, rigueur et capacité à résoudre des problèmes complexes Bonnes capacités d'analyse et de synthèse Bonne communication (écrite et orale) et anglais technique (lecture de documentation).
Fonction
Informatique_syst_info
Durée (Mois)
6
Formation
RJ/Qualif/Agent_maitrise_B3
Secteur
Matériel de manutention et de levage