Evaluation Scenario Writer - AI Agent Testing Specialist
Please submit your CV in English and indicate your level of English proficiency.
Mindrift connects specialists with project-based AI opportunities for leading tech companies, focused on testing, evaluating, and improving AI systems. Participation isproject-based, not permanent employment.
What this opportunity involves
You’ll create challenging coding test cases that push AI coding systems to their limits:
- Review and refine realistic coding tasks based on provided production codebases with realistic scope, requirements and information sources
- Write comprehensive functional tests that validate actual end-to-end behavior and edge-cases, not just superficial checks
- Craft “fair but hard” challenges where the AI has all the context it needs, but has to work for it (information scattered across files and external sources, complex reasoning required)
- Analyze AI failures to understand what the model struggles with vs. what it masters
- Iterate based on feedback from expert QA reviewers who score your work on 7 quality criteria
What we look for
This opportunity is a good fit for experienced developers, software engineers, and/or test automation specialists open to part-time, non-permanent projects. Ideally, contributors will have:
- Degree in Computer Science, Software Engineering or related fields
- 5+ years in software development, primarily Python (pytest, async/await, subprocess, file operations)
- Background in Full-Stack development, with an equal focus on building React-based interfaces and robust Back-end systems
- Experience writing tests (functional, integration – not just running them)
- Docker containers (running evaluations locally in containers)
- CI/CD understanding (GitHub Actions as a user: triggers, labels, reading results)
- English proficiency - B2
How it works
Apply → Pass qualification(s) → Join a project → Complete tasks → Get paid
Effort estimate
Tasks for this project are estimated to take 20 hours to complete, depending on complexity. This is an estimate and not a schedule requirement; you choose when and how to work. Tasks must be submitted by the deadline and meet the listed acceptance criteria to be accepted.
Payment
- Paid contributions, with rates up to $50/hour*
- Fixed project rate or individual rates, depending on the project
- Some projects include incentive payments
*Note: Rates vary based on expertise, skills assessment, location, project needs, and other factors. Higher rates may be offered to highly specialized experts. Lower rates may apply during onboarding or non-core project phases. Payment details are shared per project.
Emplois Recommandés
Acheteu.r.se Projet Référent H/F
Poste ouvert aux personnes en situation de handicap. NaTran construit, entretient et développe l'un des plus importants réseaux de transport de gaz en Europe. Notre ambition ? Acheminer le gaz de nos…
Promoteur des Ventes F/H
Description de l'entreprise Le Groupe Actiale accompagne depuis plus de 40 ans de nombreux groupes industriels dans le développement de leurs marques en GMS. Notre quotidien ? Ap…
Expert-Comptable avec association possible H/F - Paris (09)
Le poste : Votre mission ? Dans le cadre du départ à la retraite de l'expert-comptable associé, vous aurez une transition d'un an avec l'expert-comptable. Véritable interlocuteur privilégié, v…
Chef(fe) de chantier H/F
Talents Construction est un cabinet de recrutement spécialisé dans le BTP, l’Urbanisme et le Facility Management, héritant du savoir-faire de plus de 15 ans du groupe Linking Talents, comptant parmi …
Consultant SAP RETAIL SD-MM ECC6 / EHP8
Le poste : Contexte Au sein de la direction informatique, rattaché au domaine applicatif Supply chain, le consultant SAP a pour mission de concevoir, développer/piloter le développement, recette…
Assistant de Direction (h/f)
Votre mission LHH Recruitment Solutions, cabinet de conseil en recrutement, travail temporaire spécialisé, gestion de transition et évaluation d'experts, cadres et dirigeants recherche pour son …
Full-Stack Engineer - NestJS / VueJS H/F
Description En postulant à cette offre, vous aurez l'opportunité de rejoindre une entreprise innovante dans le secteur de la cybersécurité, proposant une solution de défense contre le phishing bas…
Secrétaire Médical CRMR Wilson - H/F
Secrétaire Médical CRMR Wilson - H/F req997 Notre établissement : L'Hôpital Fondation Adolphe de Rothschild est un établissement hospitalo-universitaire de référence dans le domaine des pathologies tê…
Infirmier Unité de jour Bleu Virgule (H/F)
Infirmier Unité de jour Bleu Virgule (H/F) Infirmier Unité de jour Bleu Virgule (H/F) Au sein d'une équipe de soins pluridisciplinaire, vous aurez pour mission : - Accueillir, informer, évaluer et ac…
ERGOTHERAPEUTE F/H H/F
ERGOTHERAPEUTE F/H H/F 231427 TAGA MEDICAL, agence de recrutement et d'intérim, spécialisée dans les métiers de la rééducation, est à la recherche de ERGOTHERAPEUTE DIPLÔMÉ(E)S D'ÉTAT dans le cadre de…