Senior Data Scientist NLP/GenAI - Catalog

Paris
Mirakl est le leader des solutions logicielles pour le e-commerce. Nous proposons aux entreprises une suite unique de solutions leur permettant de transformer significativement leur activité digitale afin d'accélérer de façon durable et rentable leur croissance.

Depuis 2012, Mirakl accompagne les entreprises B2C et B2B avec la technologie la plus avancée, sécurisée et évolutive leur permettant de digitaliser leur activité et d'élargir leur offre via la marketplace ou le dropship, faciliter la gestion des catalogues et des paiements de leurs fournisseurs pour plus d'efficacité, offrir une expérience d'achat personnalisée à leurs clients, et augmenter leurs profits grâce au retail media.

Mirakl est le partenaire de choix de plus de 450 entreprises leaders dans le monde, dont Airbus, Maisons du Monde, Decathlon, H&M, Sonepar et Toyota Material Handling. Pour plus d'informations :

A propos de Mirakl Labs

Nos équipes techniques et produits, nommées Mirakl Labs, sont principalement réparties entre nos 2 hubs situés à Paris et à Bordeaux. Elles collaborent au quotidien afin d'adresser les problématiques de nos clients et utilisateurs en répondant à différents challenges liés aux nouvelles fonctionnalités, à la scalabilité, la sécurité et l'ergonomie...

Elles opèrent en mode agile et s'organisent en Squads composées d'un Squad Lead, de 5 développeurs, d'un Product Manager et d'un QA. Chaque Squad est spécialisée sur un scope fonctionnel afin de concevoir et réaliser de nouvelles features, leurs évolutions et des APIs (avec un découpage en micro-services). Nos équipes Infrastructure, Architecture, Sécurité, Documentation, Product Design, Data et Support opèrent en transverse en apportant leur expertise et de la cohérence sur l'ensemble des produits.

Toutes les équipes sont responsables de leur périmètre et chacun des collaborateurs apporte son expérience et ses idées. Innovation, feedback et implication dans les prises de décision sont au cœur de notre philosophie.

Et pour favoriser ce partage avec d'autres passionnés, nous sommes sponsors, speakers, et hôtes de différents événements, meetups, et associations de la scène Tech en France. Au cours des dernières années, nous avons participé à des événements tels que Devoxx, ReactEurope, ProductConf et Flupa UX Days.

A propos du job

Intégré.e dans notre équipe Data Science, votre principale mission sera de prototyper, itérer, et mettre en production des algorithmes en collaboration avec les équipes Produit, les Data Engineers et les équipes de développement.

Vos projets seront centrés sur les enjeux du catalogue Marketplace, comprenant le NLP, la Computer Vision et l'utilisation de Generative AI (LLMs customs) à grande échelle. Les sujets que vous traiterez auront un impact significatif sur nos clients : notre ambition est d'exploiter au mieux nos données riches et variées pour augmenter leur chiffre d'affaires, optimiser la gestion de leur marketplace et garantir la sécurité des utilisateurs et des transactions.

Nous cherchons une personne en CDI, sur Paris, Bordeaux ou en full remote

Sujets catalogue :
  • Réécriture automatique du contenu Marketing en fonction des attentes métier
  • Extraction d'attributs produit à partir d'image et de texte libre
  • Détection de produits variants
  • Catégorisation de produits
  • Onboarding automatique des produits vendeurs
  • Fusion de fiches produits provenant de sources multiples
  • Prédiction de produits tendance
Ce qu'il y a pour vous dans ce job :
  • Implémenter des algorithmes qui auront un impact visible sur plus de 500 sites e-commerce/marketplaces dans 40 pays dont certains une volumétrie très importantes (millions de produits, de clients, de commandes par an)
  • Des techniques de pointe variées (modèles multimodaux, fine-tuning de LLM, etc.). Mirakl est aujourd'hui l'un des rares acteurs français à avoir des LLM finetunés en production à grande échelle. Rejoignez-nous pour continuer à cultiver cet esprit pionnier
  • Une vraie autonomie et responsabilité dans les projets dont vous avez ownership
Notre stack et nos outils

Python, Tensorflow, Pytorch, Hugging Face, Databricks, Spark, AWS (Amazon Redshift, s3, etc.), SQL, Airflow, Delta Lake. Spécifiques LLM : Autotrain, Unsloth, Galileo, LangChain, Anyscale.

Au quotidien, vous allez :
  • Analyser, préparer les données, prototyper des algorithmes
  • Les mettre en production en collaboration avec les Data Engineers et les équipes de développement
  • Faire des dashboards afin d'illustrer la pertinence des algorithmes et de monitorer la production
  • Présenter les résultats au weekly data science et participer aux sessions de brainstorming de l'équipe
  • Échanger avec les autres équipes pour affiner les cas d'utilisation, l'expérience utilisateur et les modes d'intégration
Vous aimerez ce job si :
  • Vous avez 4 ans d'expérience minimum en tant que Data Scientist, avec une expérience significative en NLP et ML appliqué en entreprise
  • Vous avez déjà mis en production des algorithmes de Machine Learning
  • Vous avez une bonne connaissance des algorithmes de NLP et Computer Vision et des architectures State-Of-the-Art - par exemple les Transformers. (Avoir des connaissances sur les derniers LLMs est un plus)
  • Vous maîtrisez Python, Tensorflow ou/et PyTorch
  • Vous avez une expérience en développement Spark
  • Vous êtes pragmatique, data-driven et orienté métier
  • Vous aimez avoir l'ownership de vos sujets et vous êtes autonome et avez un très bon esprit d'équipe
  • Vous avez un esprit positif : respect et bienveillance font partie de vos valeurs
  • Vous aimez partager votre travail dans le cadre de présentations internes, dans des conférences ou en rédigeant des articles
Découvrez Arthur, Manager Data Science sur l'équipe :

Envie de nous rejoindre? ☆
  • Un échange téléphonique de 30 minutes avec un de nos recruteurs Tech. Ce sera l'occasion de discuter de votre parcours, de vos attentes et de découvrir ce que Mirakl peut vous offrir en retour.
  • Un premier échange technique par zoom de 30 minutes avec une personne de l'équipe Data Science, qui permettra de plonger dans des aspects plus concrets de votre expertise et de découvrir comment vos compétences peuvent s'intégrer à nos projets.
  • Un cas pratique à réaliser à la maison.
  • Une restitution et échange technique avec le manager de l'équipe Data Science de 75 minutes.
  • Un dernier échange de 1H par zoom avec des futurs collègues Mirakl autour de nos valeurs et de notre culture d'entreprise.
Mirakl est engagée en faveur de la diversité, de l'égalité des chances et de l'inclusion. Nous célébrons nos différences car nous sommes convaincus que les qualités visibles et invisibles de chaque Mirakl Worker sont une source de force et d'innovation. Dans le cadre de cet engagement, nous étudions toutes les candidatures sans distinction de : genre, ethnicité, religion, orientation sexuelle, handicap, âge ou toute autre caractéristique protégée par la loi.
Publié le 2025-11-15

Emplois Recommandés

Chargé de développement commercial H/F

Crédit Agricole Assurances
Paris

Notre ambition est d'être l'assureur Dommages préféré de nos clients. Pour cela, notre entité Pacifica est au service de nos banques partenaires et protège chaque client face aux aléas de la vie dans…

Voir les Détails
Publié le 2025-10-18

Technicien Support IT - Evolutif Admin - Medtech - CDI

Octopus IT
Paris

La société Cette MedTech en pleine expansion, acteur de référence dans la radiothérapie, combine innovation technologique et excellence médicale pour offrir des traitements de pointe à des millier…

Voir les Détails
Publié le 2025-11-08

Retail Sales Administration Assistant - Stage (6 mois) Janvier 2026 (F/H/NB)

Ubisoft
Paris

Ubisoft est une référence mondiale du jeu vidéo, avec des équipes réparties aux quatre coins du monde qui créent des expériences de jeu originales et mémorables, de Assassin’s Creed à Rainbow Six en …

Voir les Détails
Publié le 2025-11-06

Consultant Expérimenté Wealth & Asset Management - Transformation de la Fonction Finance F/H (Paris)

EY
Paris

Requisition ID: 1493045 Les services financiers chez EY, c'est une organisation unique parmi les Big four : 1200 personnes dédiées à la banque, l'assurance, la gestion d'actif, les paiements, le priva…

Voir les Détails
Publié le 2025-08-15

Infirmier Diplômé d'Etat - NEURO-USINV Jour - CDD (H/F)

Hôpital Paris Saint-Joseph
Paris

Description de l'entreprise Les Hôpitaux  Paris Saint-Joseph  (Paris 14e) et  Marie-Lannelongue  (Le Plessis-Robinson - 92) forment un groupement hospitalier privé à but non lucratif, rattaché à …

Voir les Détails
Publié le 2025-11-18

Conseiller en investissement immobilier IDF (Paris Intra-Muros) H/F

LCL
Paris

Angle Neuf  est la filiale de transaction immobilière de LCL. Elle conseille et accompagne les clients LCL dans la construction de leur patrimoine immobilier résidentiel : locatif, principal ou sec…

Voir les Détails
Publié le 2025-07-26

Consultant in Digital Transformation - Project Owner Support H/F

Paris

mc2i is an independent consulting firm that supports its key clients with their digital transformation projects. For over 35 years, we've been active in diverse sectors and areas, including Human …

Voir les Détails
Publié le 2025-11-15

AI Client Service Developer Intern

Kering
Paris

Kering seeks an AI Client Service Developer Intern to join the Customer Care Tech team in Paris. This role involves collaborating with experienced developers to design and implement AI features in Sal…

Voir les Détails
Publié le 2025-11-03

E-Retail Intern

Guerlain
Paris

Guerlain is seeking an E-Retail Intern to join its Digital Department in Paris. The role involves supporting the development of e-commerce strategies and content for global markets, managing creative …

Voir les Détails
Publié le 2025-11-06

Ingénieur Devops / scrum master

Visian
Paris

Le besoin Une entité a entamé sa transformation Agilescale, au sein de la factory plusieurs équipes travaillent en agile afin de construire le cloud de demain. Un cloud as code opéré depuis une ma…

Voir les Détails
Publié le 2025-10-31