ARCHITECTE INFRA CLOUD & GPU INTELLIGENCE ARTIFICIELLE (F/H)
• Concevoir et déployer une infrastructure GPU scalable et performante pour l'inférence des LLMs, capable de supporter jusqu'à plusieurs dizaines de milliers d'utilisateurs ;
• Mettre en place des mécanismes robustes de gestion des quotas, rate limiting et sécurité avancée ;
• Implémenter des solutions de monitoring et observabilité avancées (Prometheus, Grafana) ;
• Etablir les choix de système d'exploitation et des middlewares associés à ce contexte ;
• Effectuer une veille technologique sur les meilleures pratiques de déploiement à grande échelle de modèles LLM (Triton, vLLM, Ray Serve)
• Assurer un support interne de niveau 3 sur ces produits ;
• Superviser le choix des frameworks, outils et technologies en collaboration avec les data scientists, ML engineers et devOps ;
• Garantir la scalabilité, la maintenabilité et la sécurité de l'infrastructure ;
• Évaluer l'impact technique et fonctionnel des choix architecturaux ;
• Mettre en place et développer des outils d'analyse et d'amélioration des performances ;
• Maitriser les couts d'usage et identifier et proposer des optimisations ;
• Assurer l'optimisation continue (load balancing, auto-scaling) et la haute disponibilité des systèmes ; Votre profil Intéressé(e) par le monde judiciaire et par le fonctionnement de la justice en France, vous êtes diplômé(e) d'une école d'ingénieur ou équivalent universitaire. Vous justifiez également 5 ans d'expérience dans un poste similaire. Compétences requises
• Expérience dans le déploiement à grande échelle de systèmes distribués (multi-GPU, multi-modèles) ;
• Environnements matériels : processeurs, GPU, serveurs multiprocesseurs, interfaces de communication ;
• Compétences solides en sécurité et architecture Cloud (IAAS, CAAS)
• Environnement de développement liés aux GPUs : C/C++, CUDA, ROCM ;
• Système d'exploitation Linux : administration système, scripts d'automatisation (Bash, python, etc.), DHCP, Diskless, PXE ;
• Environnements de mesure et de gestion du rendement : logiciels de mesure de performances, outils de développement et de débogage système ;
• Connaissance du noyau et des sous-systèmes majeurs ;
• Maîtrise avancée des architectures microservices et conteneurisation (OpenShift, Kubernetes) ;
• Connaissance des pratiques CI/CD et Infrastructure as Code (Terraform, Kubernetes, GitLab) ;
• Connaissance des bases de données vectorielles (FAISS, Pinecode) ;
• Connaissance des langages Python, Java, Scala ;
• Connaissance en machine learning, deep learning ;
• Connaissance en gestion de modèles IA (MLOps, MLFlow, SageMaker...) ;
• Connaissance en data engineering (Spark, Kafka, Airflow) ;
• Connaissance en sécurité des systèmes IA (authentification protection des modèles, RGPD) ;
• Connaissances des process de Production et d'exploitation process ITIL ;
• Anglais technique est requis. Avantages
- Restauration d'entreprise à tarif dégressif
- Télétravail jusqu'à 3 jours par semaine
- Accessibilité en transport (RER E Rosa Parks, T3b, M12 Front populaire, M7 Corentin Cariou puis navette fluviale)
- Parking privatif (vélo, voiture, scooter...)
- Remboursement des frais des transports en communs à hauteur de 50% (selon plafonds fixé)
- Association sportive et culturelle
- Partenariat avec une crèche d'entreprise en Ile-de-France (Babilou)
- Des opportunités d'évolutions (mobilité interne, ascendante)
- Des opportunités de formation allant jusqu'à 3 formations par an
Emplois Recommandés
COMMIS DE CUISINE H/F
Pour Podium, notre restaurant festif de Paris dont la carte est élaborée par un Glenn Viel ***, notre équipe recherche activement un ou une : commis de cuisine. Le Chef de partie compte sur vous :…
Stagiaire pâtisserie (h/f)
À propos de nous Engagées, nos équipes en cuisine, en salle et dans les fonctions supports, portent haut et loin les couleurs d'une cuisine créative française, celle de Yannick Alléno. Il est un des p…
R&D Data Scientist - Intern
ABOUT DESCARTES UNDERWRITING Descartes was born out of the conviction that the ever-increasing complexity of risks faced by corporations, governments and vulnerable communities calls for a renewed…
Conseiller de Clientèle professionnel (f/h) PARIS
POUR VOUS, TOUT COMMENCE ICI ! Envie de faire vraiment la différence dans les projets de vie de vos clients et de relever tous les challenges qui s’offrent à vous ? Oui ? Alors, vous êtes au bon en…
Business Analyst Intern
Chanel is seeking a Business Analyst Intern to join the Fashion Division's Finance Department in Paris. This role involves assisting the Strategic Studies team with international reporting and analysi…
Auditeur Manager Banque - F/H
Evoluez au côté de talents passionnés ! 5ème réseau mondial d'audit, d'expertise comptable et de conseil, BDO emploie 2000 collaborateurs en France. 1 er cabinet d'Audit et de Conseil à adopter le …
Global Talent Acquisition Intern
Moët Hennessy seeks a Global Talent Acquisition Intern for a six-month internship in Paris. This role involves contributing to recruitment projects, facilitating global engagement, and supporting cros…
Directeur Magasin F/H Pigalle CDI
Nous sommes à la recherche d'un(e) Directeur Magasin , passionné(e) par le conseil et la vente pour rejoindre notre équipe dynamique. Si vous aimez relever des défis et offrir un service client exce…
LOCATION BUREAUX - ORTHOPEDISTE MEMBRE INFERIEUR - PARIS 15ème
Location de trois bureaux au sein d'un cabinet de 300M2 entièrement refait à neuf - - Cabinet médical mixte 300M2: médical et radio( avec radio echo, mammo, osteodensitométrie...) ayant déjà une activ…
Responsable Administratif et Financier H/F
Description du poste Rattaché au directeur de filiale et accompagnée de 5 collaborateurs vous prenez en charge les missions suivantes : Supervision de l'ensemble de la production comptable quot…