Intern AI Evaluation Engineering (f/m/d)

Allianz
Paris

Assurance

IT / Informatique

Publiée depuis 1 jour

Allianz

Die Allianz Gruppe gehört zu den größten und renommiertesten Finanzdienstleistern der Welt und bietet ein internationales Netzwerk bekannter Marken mit erstklassigen Produkten. Vor allem streben wir nach Spitzenleistungen in unserem Alltag - das heißt, in den Beziehungen zu unseren Kunden, unseren Aktionären, unseren Mitarbeitern und zur Gesellschaft. Die Allianz Gruppe ist für über 76 Millionen Kunden in rund 70 Ländern tätig.

Als verlässlicher Partner verwaltet Allianz Global Investors Vermögen in allen wesentlichen Anlage-klassen und -regionen. Unsere Experten sind in 19 Märkten weltweit vertreten, mit umfassender Prä-senz in Europa, den USA und in Asien. Mit rund 650 Anlagespezialisten deckt unser Investment-Ma-nagement alle wichtigen Finanz- und Wachstumsmärkte der Welt ab. Erstklassiger Service vor Ort sorgt dafür, dass die globale Expertise beim Kunden ankommt.

Tasks

  • Conduct a structured benchmark of GenAI evaluation frameworks, both open-source (Ragas, DeepEval, TruLens, Phoenix/Arize, ARES, promptfoo) and commercial SaaS platforms (LangSmith, Braintrust, Humanloop, Galileo, Azure AI Evaluation); Compare metrics coverage, ease of integration, cost, licensing, scalability, and enterprise readiness
  • Curate a gold-standard evaluation dataset (queries, expected outputs, source documents, edge cases) across GenAI Hub's core features
  • Implement evaluation pipelines using the top 2–3 frameworks, measuring faithfulness, answer relevance, context precision, context recall, hallucination rate, and task-specific quality metrics
  • Produce a quality baseline report identifying strengths and weaknesses per feature and per search index, with cross-framework comparison of metric consistency
  • Experiment with programmatic prompt optimization tools (DSPy, TextGrad, MIPRO) to automatically improve retrieval and generation quality against the established baseline
  • Integrate Responsible AI considerations into the evaluation framework — assessing outputs for bias, toxicity, fairness, and content safety — and recommend guardrails and automated checks for production deployments
  • Deliver a tool selection recommendation, a reusable evaluation harness, optimized prompt candidates, and a comparative benchmark report (before/after) with cost/quality/safety trade-off analysis.

Profile

  • Currently pursuing M1/M2 in Data Science, Machine Learning, Computer Science, or a related field
  • Solid Python programming skills (scripting, data manipulation, API integration)
  • Foundational understanding of NLP/ML concepts (embeddings, language models, retrieval systems)
  • Familiarity with evaluation methodology and metrics design
  • Ability to synthesize findings from multiple tools and produce clear, structured written reports
  • Curiosity for applied research, tooling evaluation, and emerging AI practices
  • Working proficiency in English (French is a plus)
  • No prior enterprise experience required.

Apply

Ces postes pourraient également vous intéresser :


OFAJ / DFJW 48028


Hachette Collections 48066


mobiklasse.de 42916

Publié le 2026-03-13

Emplois Recommandés

Data Scientist Intern F/H

Indefi
Paris

Description Join Indefi , a leading strategy advisor, where we are redefining the boundaries of strategy consulting through data and innovation. We are looking for a talented Data Scientist Int…

Voir les Détails
Publié le 2026-01-22

Chargé.e des réseaux sociaux et du community management

Hello Watt
Paris

Tu es passionné.e par les réseaux sociaux et les questions liées à l’écologie ? Tu as l’habitude de créer du contenu et TikTok comme Insta n’ont aucun secret pour toi ? Tu es attiré.e par le secte…

Voir les Détails
Publié le 2026-02-12

Ingénieur brevets mécanique et matériaux (H/F)

Paris 1er

L'entreprise Actual Talent, est la division spécialisée d’Actual group, 5 acteur du travail et de l’emploi en France à la vision résolument humaniste. Nous déployons avec nos clients les solu…

Voir les Détails
Publié le 2026-03-15

Développeur Back-End Java — Moteurs de Notation Risque (IT) / Freelance

Hexagone Digitale
Paris

Descriptif de l'offre Dans le cadre d’un renfort d’équipe, nous recherchons un Développeur Backend Java pour intervenir au sein de la DSI Risques d’un grand groupe bancaire. La mission concerne …

Voir les Détails
Publié le 2026-03-15

Consultant - Nutrivigilance / Sécurité des ingrédients H/F

Ividata Life Sciences
Paris

Vous avez un profil solide en nutrition, compléments alimentaires et agroalimentaire, une expertise confirmée en nutrivigilance & sécurité des ingrédients, et souhaitez intégrer une structure dynamiq…

Voir les Détails
Publié le 2026-01-15

Stage - Chef de projet communication et animation - H/F

BNP Paribas Mission Handicap
Paris

Poste ouvert aux personnes en situation de handicap. Stage- Chef de projet Communication et animation - H/F   AU QUOTIDIEN ÇA DONNE QUOI ? BNP Paribas Consulting & Transformation, l'alternat…

Voir les Détails
Publié le 2026-02-28

Comptable Recouvrement de créances H/F

Page personnel
Paris

En tant que COMPTABLE RECOUVREMENT DE CRÉANCES, vous aurez les responsabilités suivantes : * Assurer les relances auprès des client·e·s ainsi que des équipes internes. * Effectuer le contrôle mens…

Voir les Détails
Publié le 2026-03-18

Expert Middleware

Nyou
Paris

Nous recherchons un profil Middleware pour réaliser les missions suivantes : Conception et Architecture - Participer à la définition des architectures techniques pour les plateformes middleware …

Voir les Détails
Publié le 2026-03-18

Apprenti Consultant Manufacturing and Operations F/H

Forums Talents Handicap
Paris 1er

Poste ouvert aux personnes en situation de handicap. Imaginez, transformez et impactez le monde positivement : venez vivre au cœur du changement en tant qu'Apprenti Consultant Manufacturing & Operati…

Voir les Détails
Publié le 2026-03-14

Product Manager - Oncology

Robeaute
Paris

Robeauté is redefining the future of brain therapies with the first microrobotic platform of its kind, designed to navigate the human brain with unprecedented precision. The new generation of microro…

Voir les Détails
Publié le 2026-03-17