En tant que Data Engineer spécialisé en MLOps, vous êtes responsable de l'industrialisation et du déploiement en production des modèles de machine learning. Vous veillez à la fiabilité, la scalabilité et la performance des modèles à travers des pratiques MLOps avancées.
Vous avez une forte appétence pour l’IA.
1. Déploiement et Automatisation
-
Pipelines CI/CD : Automatisation du déploiement des modèles avec des pipelines CI/CD robustes.
-
Gestion d’environnements : Utilisation de Docker pour des environnements standardisés (développement, validation, production).
2. Monitoring et Maintenance
-
Suivi des performances : Mise en place de métriques et d’alertes pour détecter les dérives et maintenir la performance des modèles.
-
Maintenance proactive : Automatisation du recalibrage des modèles pour les garder à jour avec les évolutions des données.
3. Gestion des Versions et Sécurisation
-
Versioning et lock : Gestion des versions de modèles et verrouillages pour assurer la stabilité et la traçabilité.
-
Gestion des accès : Autorisations de modification contrôlées pour garantir la sécurité en production.
4. Gestion du Cycle de Vie des Modèles
-
Pipelines d’entraînement/ré-entraînement : Automatisation des workflows pour un déploiement continu et une documentation complète du cycle de vie des modèles.
Compétences Techniques
-
Langages : Python, PySpark
-
Traitement des données : Spark
-
Cloud : Azure (Azure ML, ADLS, Databricks avec Delta Tables et Unity Catalog)
-
Conteneurisation : Docker
-
CI/CD : GitHub Actions ou alternatives (Jenkins, XLD)
-
Qualité de code : Black, isort, pylint, Ruff
-
Le truc en + qu’on adore : Dataiku
- Issu d’une formation Grande École d’Ingénieur/Doctorant, spécialisée en Data Science ou Intelligence Artificielle
- Vous disposez d’au moins 6 années d’expérience dans le domaine
- Maîtrise des techniques d’analyses statistiques, de modélisations prédictives, de Machine Learning, de Deep Learning,...
- Maîtrise des techniques de data management et de DataViz
- Maîtrise de Python, R, SQL…
- Bonnes connaissances Big Data : pySpark, Spark, NoSQL…
- Autonomie, organisation, sens du partage
- Excellente communication
- Orientation métier.
Avantages :
- Top 5 du Palmarès Great Place to Work
- Management de proximité par des experts
- Organisation sous forme de communautés
- Un parcours excellence Agile devops
- Financement de plusieurs certifications officielles à l’année grâce à nos partenaires éditeurs
- Un accès à la plateforme CampusTalan avec plus de 1000 formations disponibles dès votre arrivée
- Une mobilité interne facilitée
- Un engagement auprès des travailleurs en situation de handicap
- Des événements et afterworks réguliers
- Siège parisien situé à Charles-De-Gaulle Etoile
- Tickets restaurants digitalisés
- Prime vacances
- Primes de cooptation
- Actionnariat
- RTT.
L’équipe recrutement s’engage à vous proposer un processus de recrutement rapide et fluide :
- Un premier échange de 30 min en visio avec le recruteur pour vous présenter le poste et comprendre votre projet professionnel
- 2 entretiens métier, dont au moins 1 dans nos locaux, pour entrer dans les détails du poste et rencontrer votre futur manager