KI BMS

Anfragelimits

Wie KI BMS eingehenden Traffic begrenzt.

KI BMS setzt zwei Ebenen Token-Bucket-Begrenzung ein: Pro-IP-Buckets schützen die Bereitstellung vor missbräuchlichen Clients; Pro-Token-Buckets (nur für PATs) schützen vor einem einzelnen Token, das von vielen IPs aus wiederverwendet wird. Bei Erschöpfung antworten Endpunkte mit 429 und einem Retry-After-Header in Sekunden.

Limits

Authentifizierte Lesezugriffe (pro IP)	600 / min
Authentifizierte Schreibzugriffe (pro IP)	180 / min
Pro Token (kombiniert, PATs)	1200 / min

Verhalten unter Last

Bei Erschöpfung antwortet jeder Endpunkt mit 429 Too Many Requests und einem Retry-After-Header in Sekunden. Der Frontend-Client respektiert diesen Header automatisch: nachfolgende Aufrufe für die genannte Dauer werden lokal mit einer synthetischen 429 kurzgeschlossen, sodass eine Warteschlange den Server-Bann nicht verstärkt.