Les offres de “Crédit Agricole”

Expire bientôt Crédit Agricole

Assistant Infolinguiste H/F

  • Stage
  • Boulogne-Billancourt (Hauts-de-Seine)
  • Études / Statistiques / Data

Description de l'offre

Contexte et objectifs du stage :

Dans l’industrie bancaire, les corpus textuels internes ou externes sont nombreuses et exploitées par différents métiers de la banque: conformité, marketing et communication, conseil, etc.
Les experts métiers ont souvent recours à ces corpus au quotidien, pour réaliser différentes tâches d’analyse sémantique d’une façon manuelle ou semi-manuelle : extraction de l’information pertinente, reconnaissance de type de document, recherche d’information, etc. Ces tâches sont le plus souvent consommatrices en temps et effort humain. Proposer des systèmes d’analyse sémantique qui aident les experts dans ces tâches est donc d’une grande valeur d’un point de vue opérationnel.

L’objectif du stage consiste à concevoir et développer des briques de linguistique qui alimenteront les chaines de traitement en analyse sémantique développées en interne par le Datalab. Ces chaines reposent essentiellement sur du machine learning et analyse morpho-syntaxique des données textuelles, et manquent dans certains cas d’usage une personnalisation liée aux règles métier et/ou spécificité du langage et champs lexical utilisé.
Les briques qui seront développées seront expérimentées et validées à la fois sur un corpus interne au groupe et sur des corpus externes et donc publiques.


Organisation et livrables :

Le stage se déroulera en quatre étapes principales, sous l’encadrement d’un infolinguiste expérimenté :

Participation dans la mise en place du socle d’outillage sémantique/linguistique dans l’infrastructure interne;

Réalisation d’un état de l’art sur les approches symboliques en analyse sémantique pour un cas d’usage donné : extraction d’information, classification de document, moteur de recherche, etc.;

Sélection et implémentation des algorithmes les plus adaptés à la problématique et au corpus;
Réalisation d’une étude comparative pour évaluer les approches implémentées.

Intégration des développements dans la plateforme sémantique du DataLab
 
Des interactions avec des services métier du groupe seront organisées.

Profil recherché

Formation : Université ou Ecole d'ingénieur

Formation comportant une dominante NLP (traitement de langage naturel), Linguistique, Machine Learning, Intelligence artificielle, incluant de solides connaissances en développement logiciel.

Outils informatiques : Outils informatiques :

- Librairies de développement : Scikit-learn, NLTK, Spacy, etc.
- IDE : pycharm
- Outils : Gate, Unitex, Protege

Compétences recherchées : Compétences techniques ou spécifiques au poste:

- Traitement de langage naturel (NLP)
- Linguistique
- Développement python

Compétences générales et transverses :

- Autonomie, rigueur et communication
- Innovation/R&D et force de proposition
- Travail en équipe
- Ecoute et partage

À propos de Crédit Agricole

Société cotée, Crédit Agricole SA est l'organe central de contrôle du Groupe Crédit Agricole.
Son organisation est au service de la stratégie et de la performance du Groupe en coordination avec les filiales et les lignes métiers.
Crédit Agricole SA regroupe et anime ses filiales spécialisées, au service des Caisses régionales et des réseaux bancaires du Groupe.

Faire de chaque avenir une réussite.
  • Annuaire emplois
  • Annuaire entreprises
  • Événements