Description de l'offre d'emploi
Quantmetry - part of Capgemini Invent, est un cabinet de conseil spécialisé dans l'intelligence artificielle de pointe. Lauréat du consortium “Confiance.ai”, Quantmetry et son laboratoire de R&D contribuent activement au développement de l'IA de confiance en France.
Les collaborateurs et chercheurs-consultants de Quantmetry mettent leur passion au service des entreprises de tous secteurs (santé, industrie, retail, assurances…), et accompagnent les grands groupes français et internationaux dans leurs projets de data transformation, de la stratégie à l’industrialisation des cas d’usage.
Quantmetry - part of Capgemini Invent, c’est :
Quantmetry a de nouveau été labellisé HappyAtWork et TechAtWork en 2023, via le sondage anonyme de Choose My Company !
L’heure est arrivée de booster ta carrière ! Quantmetry - part of Capgemini Invent est fait pour toi ! Nous t’aiderons à construire ta carrière en mettant en place tout un panel d’outils pour te challenger techniquement dans un environnement bienveillant porté par nos 4 valeurs : l’excellence, l’exceptionnalité, l’accomplissement humain, et l’esprit d’équipe. 🚀 Rejoins-nous !
Contenu du stage
Le stage Data Scientist Quantmetry sera réparti entre la réalisation d’un projet de R&D porté par l’une de nos Expertises scientifiques parmi les 4 proposés ci-dessous, et la participation à une mission de conseil en Data Science pour un client de Quantmetry.
1) Projet R&D :
Projet R&D par expertises:
Computer vision: Domaines de validité en Computer Vision
L'évolution croissante des algorithmes de vision par ordinateur a atteint un stade où ils sont largement déployés dans des domaines cruciaux tels que les véhicules autonomes, la santé et l'industrie.
Dans cette perspective, garantir la capacité d'un algorithme à effectuer des prédictions de haute qualité revêt une importance capitale. Une approche essentielle pour garantir cette qualité consiste à contrôler la pertinence des données sur lesquelles l'intelligence artificielle s'appuie, en particulier en identifiant les données qui se situent en dehors de la distribution ou "out-of-distribution" (OOD) du jeu d'entraînement.
NLP: Retriever et LLM Fine-tuning
L’utilisation des LLMs (Large Languange Model), modèles génératifs par excellence, ne cesse d’accroître avec en particulier un cas d’usage : le RAG ou Retrieval Augmented Generation. Ce dernier nécessitant l’ajout d’une brique supplémentaire appelée retriever afin de donner au LLM le contexte nécessaire à la réalisation de sa tâche.
Time series: Apprentissage des motifs de valeurs manquantes et open-source
Le succès des projets IA repose largement sur la qualité des données utilisées en entrée des modèles. Dans le cas des données tabulaires ou des séries temporelles, les deux problèmes les plus courants sont la présence de valeurs aberrantes et de données manquantes, des trous dans la donnée.
Ces lacunes posent deux problèmes : d’une part les statistiques calculées sur le jeu de données peuvent être incomplètes et/ou biaisées, et nuire à la restitution de l’information (ex : dashboarding) ; d’autre part la plupart des modèles de machine learning nécessite des jeux de donnée structurés sans aucune valeur manquante.
IA de confiance: Méthode de quantification d’incertitude adaptative pour l’IA de confiance
Dans le cadre de ces travaux R&D et d’interactions avec ses partenaires académiques et industriels, Quantmetry a développé la librairie open-source MAPIE qui permet d’utiliser les méthodes de prédiction conformes, compatible avec scikit-learn. La librairie MAPIE propose des outils industrialisables qui sont utilisés dans le cadre de nos missions de conseil, par nos clients et plus généralement par la communauté industrielle et académique en Data Science et IA.
Dans la poursuite de nos recherches menées actuellement à Quantmetry, l’enjeu de ce stage est de rendre les méthodes de prédiction conformes plus adaptatives.
2) Mission de conseil :