Ingénieur en traitement automatique de la langue - CDD 18 mois - Paris-Saclay F/H
CDD Palaiseau (Essonne) Développement informatique
Description de l'offre
Détail de l'offre
Informations générales
Entité de rattachement
Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat.Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un socle de recherche fondamentale. Le CEA s'engage depuis plus de 75 ans au service de la souveraineté scientifique, technologique et industrielle de la France et de l'Europe pour un présent et un avenir mieux maîtrisés et plus sûrs.
Implanté au cœur des territoires équipés de très grandes infrastructures de recherche, le CEA dispose d'un large éventail de partenaires académiques et industriels en France, en Europe et à l'international.
Les 20 000 collaboratrices et collaborateurs du CEA partagent trois valeurs fondamentales :
• La conscience des responsabilités
• La coopération
• La curiosité
Référence
2024-31427Description de la Direction
La direction de la recherche technologique du CEA (DRT), dispose d'un portefeuille de technologies dans les domaines de l'information et de la communication, de l'énergie et de la santé. Interface entre la recherche et l'industrie nous avons pour mission la maturation et le transfert technologique, en allant de la preuve de concept théorique jusqu'au démonstrateur industriel, pour en faire bénéficier l'industrie.Le CEA List, Laboratoire de recherche spécialisé dans les systèmes numériques intelligents est situé au cœur du pôle scientifique et technologique de Paris-Saclay.
Description de l'unité
Au sein du CEA List, vous serez intégré au Service d'Intelligence Artificielle pour le Langage et la Vision (SIALV) et collaborerez avec des chercheurs spécialisé sur (i) la compression de réseaux de neurones (ii) la vision par ordinateur frugale à partir de nuages de points 3D (iii) les modèles génératifs visuels.
Vous travaillerez dans un projet en collaboration avec un autre laboratoire du CEA List, le Laboratoire Intelligence Artificielle Embarquée (LIAE), qui a pour mission le développement de solutions innovantes pour l'IA embarquée et est le principal contributeur de la plateforme logicielle open source de conception, d'optimisation et d'intégration de réseaux de neurones pour l'embarqué, N2D2 (https://github.com/CEA-LIST/N2D2). Cette plateforme a pour vocation d'être la plateforme européenne de référence pour l'IA embarquée, avec le soutien d'un large consortium d'industriels et de fournisseurs de composants.
Description du poste
Domaine
Mathématiques, information scientifique, logiciel
Contrat
CDD
Intitulé de l'offre
Ingénieur en traitement automatique de la langue - CDD 18 mois - Paris-Saclay F/H
Statut du poste
Cadre
Durée du contrat (en mois)
18
Description de l'offre
« Rejoignez le CEA pour donner du sens à votre activité, mener et soutenir des projets de R&D nationaux et internationaux, cultiver et faire vivre votre esprit de curiosité. »
EN SYNTHESE, QU’EST-CE QUE NOUS VOUS PROPOSONS ?
Dans le cadre du développement de ses activités pour l’amélioration dutraitement des donnéesen particulier sur des aspects deconfianceet defrugalité, le laboratoire recherche uningénieurpour développer et intégrer des briques technologiques dans le domaine dutraitement automatique des langues. Les tâches visées par ces technologies concernent l’extraction d’informations.
Ce poste de cadre enCDDde18 moisest basé sur le site Nano-Innov deParis-Saclay,Essonne(91).
Il s'agit d'un poste à pourvoir dès que possible.
POURQUOI NOUS REJOINDRE ?
Vous intégrez une équipedynamique, au cœur del’écosystème IAen France, qui anouédesliensprivilégiés avec les principaux acteursindustrielsetacadémiquesdu domaine.
Le laboratoire développe desalgorithmesrobustes pourl'extraction,l'analyseet lel'interprétationde grands volumes de donnéesmultimédia(texte/image).
Nos technologies ont contribué à l'émergence de nouvelles activités économiques par lacréation de startups.
Le laboratoire participe à de nombreuxprojets collaboratifs(ANR, Horizon Europe, Pôle de Compétitivité) avec des partenaires académiques, PMEs ou grands industriels
QU’ATTENDONS-NOUS DE VOUS ?
Dans l'objectif demettre en place ces outils d'analysede textes pour ladétection d’évènements d’intérêtà partir des informations disponibles sur leWebet lesréseaux sociaux, votre mission consistera plus particulièrement à :
- prendre en mainetaméliorerles outils existants d'analyse de textes développés au sein du laboratoire
- intégreret/oudévelopperde nouveaux outils de reconnaissance d’entités nommées et détection d’évènements, selon la nature des informations à associer aux données (qui dépendra des taxonomies et terminologies fournies par les partenaires)
- favoriserles approches multilingues ou indépendantes de la langue dans les outils développés afin de pouvoir traiter des contenus textuels multilingues
- assurer l'intégrationde ces briques technologiques au sein des plateformes logicielles des partenaires
- réaliser le packaging,définiravec les autres partenaires lesenvironnements,assurer les teststechniques et la compatibilité entre les packages ;
- rédiger, contrôler et mettre à jourles documents nécessaires à la mise en exploitation
- améliorer le fonctionnementet la qualité des briques développées en interaction avec les utilisateurs/partenaires
- assurer la liaisonavec les autres partenaires et prendre en charge lesupport technique
- effectuer de la veille technologique et scientifique
L’application de ce travail pourra se faire dans le cadre d’un domaine spécifique à un projet, mais les approches mises en œuvre devront être suffisamment génériques pour s’appliquer sur n’importe quel domaine.
Profil recherché
Profil du candidat
COMPÉTENCES REQUISES :
NiveauBac+5ouDoctoratavec des connaissances en machine learning, deep learning et traitement automatique des langues.
Compétences techniques :
Le candidat sera amené à travailler surtous les aspects du développementde la solution:conception,programmation,packagingetdéploiement.
Dans ce contexte, une familiarité avecLinuxet l’outilDockerest un avantage.
Par ailleurs, le langage de programmation principal seraPython.
- Langages de programmation:Python, JavaScript, HTML/CSS, C++;
- Librairies et frameworks: scikit-learn, Pytorch, optuna, spaCy, FastAPI;
- DevOps:docker, docker-compose, slurm, git
Compétences savoir-être :
- Autonomietout en appréciant le travail enéquipe;
- Adaptabilitéet capacité de renouvellement et d'enrichissement des compétences de manière continue, étant donné larapidité d’évolutiondes développements en IA;
- Capacités d'expression, orale et écrite, en français et anglais
VOUS AVEZ ENCORE UN DOUTE ?
Les à-côtés de votre mission principale peuvent nous intéresser :
- Unécosystèmede recherche à la pointe, unique en son genre et dédié à des thématiques à fortenjeu sociétal, qui donne dusensà votre mission
- Desformationspour renforcer voscompétences, en acquérir de nouvelles etboostervotre mission
- Unéquilibrevie privée / vie professionnelle reconnu par nos collaborateurs
- La possibilité detélétravaillerpouréquilibrerles temps de transport et contribuer à votre qualité de vie
- UnCE richeen avantages et en activités sociales, culturelles et sportives
- Un lieu de travail au cœur d’un plateaudynamique, entouré d’écoles et d’entreprises de la tech
Cela vous tente ? Postulez, ce poste est fait pour vous !
Conformément aux engagements pris par le CEA en faveur de l'intégration des personnes en situation de handicap, cet emploi est ouvert à toutes et à tous
#CEA-List #NumericalSimulation #AI