Les offres de “Atos”

Expire bientôt Atos

STAGE Data Science : Classification d'applications HPC à partir de leur comportement IO (H/F)

  • Stage
  • Grenoble (Isère)
  • Développement informatique

Description de l'offre

Atos est un leader international de la transformation digitale avec environ 100 000 collaborateurs dans 72 pays et un chiffre d’affaires annuel de l’ordre 12 milliards d’euros. Numéro un européen du Big Data, de la Cybersécurité, des supercalculateurs et de l’environnement de travail connecté, le Groupe fournit des services Cloud, solutions d’infrastructure et gestion de données, applications et plateformes métiers, ainsi que des services transactionnels par l’intermédiaire de Worldline, le leader européen des services de paiement. Grâce à ses technologies de pointe et son expertise digitale & sectorielle, Atos accompagne la transformation digitale de ses clients dans les secteurs Défense, Finance, Santé, Industrie, Médias, Énergie & Utilities, Secteur Public, Distribution, Télécoms, et Transports. Partenaire informatique mondial des Jeux Olympiques et Paralympiques, le Groupe exerce ses activités sous les marques Atos, Atos Consulting, Atos Worldgrid, Bull, Canopy, Unify et Worldline. Atos SE (Societas Europea) est une entreprise cotée sur Euronext Paris et fait partie de l’indice CAC 40.

Au sein de la division «Big Data and Security», dans le groupe agile R&D HPC - Data Management, nous développons les solutions de stockage de données de très haute performance qui seront le cœur des futurs supercalculateurs ExaScale (Bull Sequana). Les limites des solutions de stockages actuelles vont imposer une refonte complète des méthodes d’accès aux données et impliquer la mise en œuvre de composants logiciels et matériels intelligents : accélérateurs adaptatifs, analyse et prédiction des modes d’accès aux données.

Nous disposons actuellement d’un système de monitoring et de visualisation complet qui nous permet d’enregistrer, en temps réel, de nombreuses métriques relatives au fonctionnement de l’exécution des programmes sur un cluster HPC (volume IO, temps des IO, processus actifs, etc.). L’ensemble des métriques collectées au cour du temps constitue une description du comportement des applications. Le produit IO Pattern Analyzer a pour objectif de tirer parti de cette base de connaissance pour réaliser des analyses du comportement des applications à partir de méthodes statistiques avancées, et ce de manière automatique.

Une nouvelle fonctionnalité que nous souhaiterions proposer à l’utilisateur de l’IO Pattern Analyzer, est la mise en évidence de groupes d’applications partageant un comportement IO commun, par exemple via une vue graphique. Cela implique de mettre en place une méthode de classification des exécutions de différentes applications, à partir des métriques IO collectées sous forme de séries temporelles. Le stage proposé a pour but d’explorer les différentes possibilités de classification permettant de d’exploiter au mieux les métriques IO actuellement disponibles. Il est à noter que la partie de représentation graphique dans l’interface utilisateur du produit n’est pas l’objectif principal de ce stage, mais pourra faire l’objet d’une collaboration avec un autre étudiant traitant ce sujet.

Mission

Dans ce contexte, le stage consiste utiliser des méthodes de Machine Learning (classification supervisée et non-supervisée) permettant de mettre en évidence les similarités/dissimilarités du comportement IO des exécutions d’applications, à partir des métriques collectées par notre outils d’instrumentation et représentées sous forme de séries temporelles.

Plus précisément, le candidat sera amené à :

- Faire un état de l’art des différentes méthodes de classification supervisée et non-supervisée de time-series

- Prendre en main les outils d’analyse des I/Os développés par l’équipe Data Management

- Réaliser un plan d’expérience afin de générer une base de traces d’exécution d’applications pouvant être utilisée comme cas d’étude

- Mettre en place une méthode de sélection des métriques IO afin de n’utiliser que les plus pertinentes pour la classification

- Comparer les performances (en termes de précision et de cout de calcul) de différentes méthodes de classification à partir du jeu de traces d’exécutions d’applications généré

- Présenter un prototype à l’équipe de développement et au chef de produit

Job Requirements

Actuellement en dernier année du cycle de formation Ingénieur / Master (Bac+5)

Vous avez des compétences en développement Python, test et intégration en continue.

Vous maîtrisez les environnements Linux.

Des compétences en Data Science et particulièrement une connaissance des principes de classifications supervisées et non-supervisées seraient un plus.

Vous possédez un bon niveau d'anglais.

Vous faîtes preuve de curiosité, d'autonomie et d'une capacité à finaliser un projet. Par ailleurs, vous êtes reconnus pour votre aptitude à travailler en équipe.

Venez exprimer tout votre potentiel en rejoignant la communauté Atos !

La diversité de nos missions au plus près de nos clients entouré d'une équipe agile et soudée vous permettront d'exploiter et de faire évoluer vos compétences dans une entreprise soucieuse du wellbeing@work de ses employés.

Chez Atos la diversité est au cœur de notre politique RH. C'est pourquoi Atos a mis en place un accord relatif à l’égalité professionnelle entre les hommes et les femmes. Par ailleurs, nos métiers sont tous accessibles aux personnes en situation de handicap, et ce quelle que soit la nature de leur handicap.

Faire de chaque avenir une réussite.
  • Annuaire emplois
  • Annuaire entreprises
  • Événements