ARCHITECTE INFRA CLOUD & GPU INTELLIGENCE ARTIFICIELLE (F/H)
• Concevoir et déployer une infrastructure GPU scalable et performante pour l'inférence des LLMs, capable de supporter jusqu'à plusieurs dizaines de milliers d'utilisateurs ;
• Mettre en place des mécanismes robustes de gestion des quotas, rate limiting et sécurité avancée ;
• Implémenter des solutions de monitoring et observabilité avancées (Prometheus, Grafana) ;
• Etablir les choix de système d'exploitation et des middlewares associés à ce contexte ;
• Effectuer une veille technologique sur les meilleures pratiques de déploiement à grande échelle de modèles LLM (Triton, vLLM, Ray Serve)
• Assurer un support interne de niveau 3 sur ces produits ;
• Superviser le choix des frameworks, outils et technologies en collaboration avec les data scientists, ML engineers et devOps ;
• Garantir la scalabilité, la maintenabilité et la sécurité de l'infrastructure ;
• Évaluer l'impact technique et fonctionnel des choix architecturaux ;
• Mettre en place et développer des outils d'analyse et d'amélioration des performances ;
• Maitriser les couts d'usage et identifier et proposer des optimisations ;
• Assurer l'optimisation continue (load balancing, auto-scaling) et la haute disponibilité des systèmes ; Votre profil Intéressé(e) par le monde judiciaire et par le fonctionnement de la justice en France, vous êtes diplômé(e) d'une école d'ingénieur ou équivalent universitaire. Vous justifiez également 5 ans d'expérience dans un poste similaire. Compétences requises
• Expérience dans le déploiement à grande échelle de systèmes distribués (multi-GPU, multi-modèles) ;
• Environnements matériels : processeurs, GPU, serveurs multiprocesseurs, interfaces de communication ;
• Compétences solides en sécurité et architecture Cloud (IAAS, CAAS)
• Environnement de développement liés aux GPUs : C/C++, CUDA, ROCM ;
• Système d'exploitation Linux : administration système, scripts d'automatisation (Bash, python, etc.), DHCP, Diskless, PXE ;
• Environnements de mesure et de gestion du rendement : logiciels de mesure de performances, outils de développement et de débogage système ;
• Connaissance du noyau et des sous-systèmes majeurs ;
• Maîtrise avancée des architectures microservices et conteneurisation (OpenShift, Kubernetes) ;
• Connaissance des pratiques CI/CD et Infrastructure as Code (Terraform, Kubernetes, GitLab) ;
• Connaissance des bases de données vectorielles (FAISS, Pinecode) ;
• Connaissance des langages Python, Java, Scala ;
• Connaissance en machine learning, deep learning ;
• Connaissance en gestion de modèles IA (MLOps, MLFlow, SageMaker...) ;
• Connaissance en data engineering (Spark, Kafka, Airflow) ;
• Connaissance en sécurité des systèmes IA (authentification protection des modèles, RGPD) ;
• Connaissances des process de Production et d'exploitation process ITIL ;
• Anglais technique est requis. Avantages
- Restauration d'entreprise à tarif dégressif
- Télétravail jusqu'à 3 jours par semaine
- Accessibilité en transport (RER E Rosa Parks, T3b, M12 Front populaire, M7 Corentin Cariou puis navette fluviale)
- Parking privatif (vélo, voiture, scooter...)
- Remboursement des frais des transports en communs à hauteur de 50% (selon plafonds fixé)
- Association sportive et culturelle
- Partenariat avec une crèche d'entreprise en Ile-de-France (Babilou)
- Des opportunités d'évolutions (mobilité interne, ascendante)
- Des opportunités de formation allant jusqu'à 3 formations par an
Emplois Recommandés
Directeur de projet LCBFT assurance VIE H/F
&##127775; Quel sera ton poste ? &##127775;Directeur de projet LCBFT assurance vie H/F &##128205;Lieu : Paris &##127968; Télétravail : 2 jours par semaine &##128073; Contexte client : Dans un…
Technicien en Radiocommunication Itinérant H/F
Le poste de Technicien en Radiocommunication Itinérant H/F Vos missions principales seront : * Installation et tests d'équipements de radiocommunication sur site, * Montage, intégration et…
Apprenti(e) Guest Experience Agent H/F
Installé dans le Quartier Latin, cœur battant du Paris artistique, l’Hôtel Dame des Arts incarne l’esprit de la Rive Gauche, libre, créatif et épris de culture. Il se veut un hommage sincère à l’âme …
Babysitter H/F, idéal job étudiant ou temps partiel ♂️
Vous cherchez de la flexibilité ? Un bon salaire ? De la motivation en vous levant le matin ? Bienvenue chez nous ! Vous garderez des enfants entre 4h et 20h par semaine et serez payé de 13€ à 15€ bru…
Sales Assistant
Ginori 1735 seeks a Sales Assistant in Paris to deliver exceptional customer service and drive sales in a luxury retail setting. The role involves promoting brand culture, supporting store processes, …
Oftalmologos en Francia - Paris 75
Offre emploi Ophtalmologue H/F à Paris , proposant d'excellentes conditions d'exercices. Plus d'informations sur ce poste ? Contactez-nous au 06 67 17 15 28 Centro de salud busca un oftalmologo/a a t…
Conseiller(e) clientèle en alternance - H/F - BUSINESS SPEAKING
Description de l'entreprise : Business Speaking est un organisme de formation linguistique créé en 2011 qui connait une croissance organique de 35%/an. Notre mission est de former les professionnel.…
Assistant.e RH - Alternance
Poste ouvert aux personnes en situation de handicap.Au sein de l’équipe RH, nous recherchons un.e Assistant.e RH en alternance. Dans un environnement dynamique, stimulant et bienveillant, vous partic…
Ingénieur Industrialisation - Secteur Spatial H/F️
L'entreprise VACOA, c’est avant tout une ambition : relever les grands défis industriels de demain grâce à une expertise technique solide. Spécialisés dans l’Aéronautique, la D…
Psychomotricien H/F
Réseau d'agences d'intérim et de recrutement développé en franchise, Vitalis Médical a été imaginé par des professionnels expérimentés du secteur. Il s'appuie sur deux valeurs fortes : l'esprit entrep…