Valeo

Stagiaire Recherche en Intelligence Artificielle / Apprentissage par Renforcement (F/H)

Créteil Full time

Valeo is a tech global company, designing breakthrough solutions to reinvent the mobility. We are an automotive supplier partner to automakers and new mobility actors worldwide. Our vision? Invent a greener and more secured mobility, thanks to solutions focusing on intuitive driving and reducing CO2 emissions. We are leader on our businesses, and recognized as one of the largest global innovative companies.

Stagiaire Recherche en Intelligence Artificielle / Apprentissage par Renforcement (F/H)

Rejoignez la révolution technologique du véhicule autonome et connecté au sein de Valeo !

Leader mondial des aides à la conduite, Valeo réinvente la vie à bord du véhicule et révolutionne l’expérience de conduite. Des solutions de connectivité et de commande intérieure aux systèmes de détection, la division Valeo Brain du Groupe vise à rendre la mobilité plus sûre et plus intuitive.

Le Valeo Mobility Tech Center basé à Créteil (94) est le siège de la Division Valeo Brain. Ce centre de Recherche & Développement regroupe 1180 collaborateurs autour de la conception de systèmes avancés d’assistance à la conduite (ADAS), de solutions de connectivité, d’interfaces homme machine et de systèmes de surveillance de l’habitacle.

Nous recrutons un(e) Stagiaire Recherche en Intelligence Artificielle, plus spécifiquement en apprentissage par renforcement. Le stage proposé s'articule autour de la participation au Waymo Open Sim Agents Challenge (WOSAC), une compétition internationale qui établit l'état de l'art en matière de simulation comportementale. Le/La stagiaire aura pour mission d'explorer, d'implémenter et d'optimiser des algorithmes d'Apprentissage par Renforcement (RL) et d'Apprentissage par Imitation (IL) au sein du simulateur open-source de nouvelle génération PufferDrive. Ce projet s'inscrit en complémentarité avec les travaux internes de Valeo offrant une opportunité de contribuer directement à la communauté scientifique.

Vos missions :

  • Prendre en main l'environnement de recherche : Maîtriser le simulateur PufferDrive et implémenter le pipeline d'évaluation et les métriques du challenge WOSAC.

  • Implémenter des modèles de référence (Baselines) : Entraîner et évaluer des premiers agents basés sur l'Apprentissage par Imitation (Behavior Cloning) et l'Apprentissage par Renforcement simple (PPO) pour établir un score de base.

  • Innover et optimiser les algorithmes : Concevoir des architectures avancées (Transformers, Graph Neural Networks) et explorer l'apprentissage Multi-Agents (MARL) pour améliorer le réalisme et la diversité des comportements simulés.

  • Analyser et valoriser les résultats : Mener des tests de robustesse (simulation en boucle fermée), rédiger un rapport scientifique et potentiellement soumettre un article à une conférence internationale (ex: NeurIPS Workshop, ICRA).

À propos de vous :

Vous êtes passionné(e) par l'IA et souhaitez contribuer à définir la mobilité de demain au travers d'un sujet à la frontière entre ingénierie logicielle et recherche théorique.

  • Formation : Étudiant(e) en Master 2 Recherche ou en dernière année d'École d'Ingénieur avec une spécialisation en Mathématiques Appliquées, IA ou Robotique.

  • Compétences Techniques :

    • Maîtrise impérative de Python et connaissances en C++.

    • Expérience solide avec un framework de Deep Learning (PyTorch).

  • Expertise IA : Connaissance théorique (MDP, Bellman) et pratique des algorithmes d'Apprentissage par Renforcement (PPO, SAC, TD3). L'usage de librairies comme Stable Baselines 3 ou Ray RLLib est un plus.

  • Savoir-être : Autonomie, rigueur scientifique et capacité à appréhender des concepts abstraits complexes.

Nos avantages : 

  • Présence d’un comité social & économique (CSE) : voyages, activités sociales et culturelles

  • Remboursement transport à hauteur de 70%

Pourquoi Valeo ?

  • Pour rejoindre un leader technologique et industriel, pionnier français dans l’innovation automobile

  • Pour une carrière dynamique avec des opportunités de CDI, de thèse ou de Volontariat International en Entreprise (Programme VIE)

  • Pour contribuer au développement d’une mobilité plus propre, plus sûre et plus intelligente

Valeo accorde une grande importance à la diversité, qu’elle soit culturelle, intergénérationnelle, de genre ou qu’elle concerne les personnes en situation de handicap.

Job:

R&D Trainee/Apprentice/VIE

Organization:

Software

Schedule:

Full time

Employee Status:

Trainee (Fixed Term) (Trainee)

Job Type:

Trainee paid

Job Posting Date:

2025-12-08

Join Us !
Being part of our team, you will join:
- one of the largest global innovative companies, with more than 20,000 engineers working in Research & Development
- a multi-cultural environment that values diversity and international collaboration
- more than 100,000 colleagues in 31 countries... which make a lot of opportunity for career growth
- a business highly committed to limiting the environmental impact if its activities and ranked by Corporate Knights as the number one company in the automotive sector in terms of sustainable development

More information on Valeo: https://www.valeo.com