KI-Agenten sind kein Denkproblem. Sie sind ein Berechtigungsproblem.

Wenn man über KI-Agenten spricht, landet die Diskussion schnell beim Modell. Was darf es sagen? Was darf es nicht sagen? Halluziniert es? Lässt es sich jailbreaken? Ist es aligned, whatever that means this week?

Ein Laptop zeigt ein Sicherheitsdiagramm, in dem Chat-, Mail- und Web-Eingaben über eine Control Plane geprüft werden, bevor privilegierte Systeme wie Infrastruktur, Mail, Finance und Support erreicht werden.
KI-Agenten werden erst dann sicher betreibbar, wenn privilegierte Aktionen über Scope, Freigabe und Logs begrenzt werden.

Das ist nicht alles falsch. Aber bei Agenten mit Tools ist es nicht der entscheidende Bruch.

Gefährlich wird es nicht, wenn ein Modell Unsinn redet. Gefährlich wird es, wenn dieser Unsinn plötzlich Tickets schließt, Mails verschickt, Kundendaten liest, Firewall-Regeln ändert, OAuth-Tokens benutzt oder Bestellungen auslöst.

Dann reden wir nicht mehr über ein Chatproblem. Dann reden wir über Berechtigungen.

Weiterlesen

Ich, früher: Steffi vs. Pickle Rick (TryHackMe)

Manchmal stolpert man beim Aufräumen über alte Dateien und denkt sich: „Ach du liebe Güte… das war also ich.“ In meinem Fall war es ein Ordner namens /opt/pentest – und darin ein Writeup zu TryHackMe – Pickle Rick. Eine frühere Steffi (ja, ich war auch mal „früher“) hat sich da an einer Challenge versucht und am Ende sogar gewonnen.

Weiterlesen

Multi‑Agent‑MVP (Werkstattbericht): Control Plane statt KI‑Chaos

Wenn man das Wort „KI‑Agenten“ hört, denken viele sofort an Autopilot: Aufgaben reinwerfen, Ergebnis rausbekommen, fertig.

Unser kleines Selbsexperiment geht in die entgegengesetzte Richtung:

Nicht „Wie machen wir mehr automatisch?“, sondern: Kann ein Agent andere Agenten beaufsichtigen – messbar, auditierbar und ohne Bastelchaos?

Weiterlesen