Anleitungen

KI-Screening richtig einrichten - Prompt schreiben, validieren, kalibrieren

Die KI-Vorsortigung steht und fällt mit dem Prompt. Hier ist, wie du einen guten Prompt schreibst, in 20 Bewerbungen testest und im Lauf der Zeit nachjustierst - ohne deine HR-Einschätzung zu überschreiben.

KI
Anleitung
Setup
Finn Glas
Finn GlasCo-Founder + Engineering
·16. Januar 2026·
4 Min. Lesezeit

Auf einen Blick

Ein guter Prompt ist drei Sätze lang. Längere Prompts werden vom LLM unterschiedlich gewichtet und produzieren weniger konsistente Scores.
Validierung mit 20 Bewerbungen aus dem Talent-Pool ist der wichtigste Schritt - skip auf eigene Gefahr.
Re-Kalibrierung alle 30-50 Bewerbungen oder bei Personalwechsel im Hiring-Team.
KI-Score überschreibt nie HR-Einschätzung. Wenn der Score sagt 92 und HR sagt 'falsche Person', hat HR recht.
Schritt für Schritt
1

1. Anforderungsprofil auf drei Pflicht-Skills reduzieren

Schau auf die Stellenanzeige. Welche drei Skills kannst du nicht weglassen, ohne dass die Stelle eine andere wird? Genau die drei kommen in den Prompt. Alles andere ist Plus oder nicht relevant.

2

2. Prompt schreiben in der Drei-Sätze-Struktur

Beispiel: 'Achte auf 3+ Jahre Backend-Erfahrung mit Python oder Go, eine ausreichende DB-Erfahrung (Postgres oder MySQL) und EU-Arbeitserlaubnis. Plus-Punkte: Kubernetes-Erfahrung, Open-Source-Beiträge mit eigenem Code. Frontend-Erfahrung ist für diese Stelle nicht relevant.'

3

3. Validierung gegen 20 Talent-Pool-Bewerbungen

Wähle 20 Bewerbungen aus deinem Pool, idealerweise mit Mix aus 'damals top' und 'damals nicht passend'. Lass den Prompt scoren. Vergleiche die Top-5: trifft sich das mit deiner Erinnerung? Wenn ja, weiter. Wenn nein, in Schritt 2 zurück.

4

4. Live schalten und beobachten

Schalter in der Stellen-Bearbeitung umlegen. Die nächsten 30 Bewerbungen werden mit Score + Begründung versehen. Schau alle 5-10 Bewerbungen kurz drüber: stimmen die Begründungen mit dem CV überein? Falls die Begründung halluziniert ('Person hat 8 Jahre Erfahrung' bei einem 3-Jahre-CV), ist das ein Hinweis auf Prompt-Problem.

5

5. Re-Kalibrieren nach 50 Bewerbungen

Nach 50 Bewerbungen mit dem Prompt: schaue auf die Score-Verteilung. Sind 80% deiner Eingeladenen in den Top 20%? Wenn ja, weiter. Wenn 'top eingeladene' im mittleren Score-Bereich landen, justiere den Prompt - meistens fehlt eine Plus-Komponente, oder eine Pflicht-Komponente ist zu hart.

Was ein guter Screening-Prompt enthält

Drei Komponenten in genau dieser Reihenfolge. Eins - die Pflicht-Skills (3 Stück max). 'Achte auf Python + Backend-Erfahrung + EU-Arbeitserlaubnis'. Zwei - die starken Plus-Punkte (2 Stück max). 'Ein Plus sind Kubernetes-Erfahrung und Open-Source-Beiträge'. Drei - was nicht relevant ist. 'Frontend-Erfahrung ist nicht relevant für diese Stelle'.

Warum genau drei. Ein längerer Prompt wird vom LLM nicht gleichmäßig gewichtet - das siebte Kriterium hat statistisch die Hälfte der Wirkung des dritten. Wer 12 Anforderungen aufschreibt, bekommt einen Score, der primär die ersten drei reflektiert. Konzentrier dich auf die drei, die wirklich entscheidend sind.

Anti-Patterns, die wir oft sehen

Eins - 'Achte auf einen Top-Bewerbungs-Eindruck'. Bedeutungslos für die KI; sie weiß nicht, was 'Top-Bewerbungs-Eindruck' meint. Konkret bleiben: 'Achte auf strukturierte CV-Sprache und konkrete Project-Beschreibungen'.

Zwei - 'Bewerte kulturelle Passung'. Verboten unter dem AGG, riskant unter dem AI Act, technisch nicht zuverlässig. Stell die Frage als 'wie arbeitet die Person mit anderen?' im strukturierten Interview - nicht im KI-Screening.

Drei - 'Lehne Bewerbungen unter Score 40 ab'. Auto-Absage ohne menschliche Sichtung ist verboten (Art. 22 DSGVO). Das System darf maximal 'in eine Lane Auto-Sortieren', niemals 'Auto-Ablehnung schicken'.

Validieren, bevor du der KI vertraust

Bevor du den Prompt produktiv schaltest, lass die KI 20 historische Bewerbungen aus deinem Talent-Pool bewerten. Vergleiche die Scores mit deiner eigenen Einschätzung von damals: stimmt die Top-5-Auswahl überein? Wenn ja, läuft der Prompt. Wenn nicht, justiere den Prompt - meistens reicht eine Umformulierung der Pflicht-Skills.

Die 80%-Match-Faustregel: in unseren Pilot-Daten stimmt die Top-20%-Auswahl der KI in ~80% der Fälle mit der HR-Einschätzung überein. Wenn deine Validierung deutlich darunter liegt (etwa 50%), hat der Prompt ein Problem - meistens zu unspezifisch oder zu kreativ formuliert.

Häufige Fragen

Häufig gefragt

Diesen Artikel teilen

Probiere KI BMS

Kostenloser Tarif, keine Kreditkarte nötig. Hosting in Deutschland. Export und Löschung sind self-service.

Finn Glas

Geschrieben von

Finn Glas

Co-Founder + Engineering

Finn ist einer der Co-Founder. Er verantwortet Engineering, Infrastruktur und die meisten nächtlichen Fixes, die ausgerollt werden, bevor jemand etwas merkt.

finn.glas at aicuflow dot comLinkedInWebsite