À propos de l'équipe:
Nous sommes à la recherche d'un·e développeur·se principal·e de plateforme infonuagique pour rejoindre notre équipe et faire progresser notre plateforme de démocratisation des données. Dans ce rôle, vous concevrez, mettrez en œuvre et gérerez notre infrastructure de données basée sur le cloud et nos pipelines de déploiement sur AWS. Combinant une expertise en ingénierie des données et en ingénierie de l'apprentissage automatique, vous vous concentrez sur la construction de pipelines évolutifs, de composants réutilisables et de capacités en libre-service. En tirant parti d'une pile AWS robuste et d'outils innovants, vous donnerez aux équipes de domaine les moyens de fournir de manière indépendante des solutions de données et d'apprentissage automatique percutantes.
Why join us:
Construire, concevoir et maintenir des composants de plateforme pour soutenir les flux de travail d'ingénierie des données et les pipelines d'apprentissage automatique, permettant l'évolutivité et le libre-service pour les équipes de domaine;
Développer des pipelines CI/CD robustes à l'aide de Jenkins pour une intégration et un déploiement transparents des données et des flux de travail de ML;
Concevoir et mettre en œuvre des pipelines de données évolutifs en temps réel et par lots en utilisant AWS S3, Glue, Lambda, Step Functions, Redshift et Lake Formation;
Collaborer avec les équipes du domaine pour concevoir des produits de données spécifiques au domaine qui sont fiables, réutilisables et alignés sur les principes de Data Mesh;
Concevoir et déployer des pipelines de ML à l'aide d'outils tels que MLflow, Bedrock et SageMaker pour soutenir le développement, la formation et le déploiement de modèles de bout en bout.
Comment exceller dans ce rôle
Un minimum de 5 à 7 ans d'expérience en ingénierie des données, en ingénierie ML ou dans un domaine connexe, incluant un minimum de 3 ans d'expérience avec Apache Spark pour le traitement des big data;
Compréhension approfondie des principes du Data Mesh, y compris la propriété des produits de données orientée vers le domaine et la gouvernance fédérée ainsi qu'une compréhension approfondie du cycle de vie de l'apprentissage automatique;
Maîtrise de la conception et de la construction de pipelines utilisant des services AWS tels que S3, Glue, Lambda, Redshift, Athena, SageMaker et Kinesis combiné à une forte expérience des pipelines CI/CD, notamment à l'aide de Jenkins;
Connaissance approfondie du langage de programmation Python et de ses bibliothèques de manipulation de données (Pyspark, Pandas et Numpy).
Ce qui vous distingue :
Analytique et souci du détail : Grande capacité d'analyse avec une forte attention aux détails et un état d'esprit axé sur les solutions pour relever efficacement les défis.
Encadrement et mentorat : Aptitude à encadrer et à mentorer les employé·e·s junior·e·s pour soutenir leur développement personnel et professionnel.
Responsabilité et prise en charge : Fait preuve d'un fort esprit d'équipe, d'une grande responsabilité et d'une prise en charge des tâches et des projets.
Adaptabilité et influence : Capacité à conduire le changement, à influencer les autres et à s'épanouir dans un environnement dynamique avec des technologies web en constante évolution.
Ce que nous offrons:
SSENSE est un employeur qui souscrit au principe de l'égalité des chances. Nous célébrons la diversité et nous nous engageons à créer un environnement inclusif pour tous les employés. Si vous avez besoin d'aménagements particuliers, faites-le nous savoir. Nous ferons de notre mieux pour vous satisfaire !
#LI-Hybride #SSENSEFR
Hybride