Armin Keshavarzi ( (PhD Candidate)

M.Sc. Armin Keshavarzi

Universitätsplatz 2, 39106 Magdeburg, G22E-101

Kurzbeschreibung des Promotionsvorhabens:

Promotion zum Thema "Erklärbarkeit, Kontrollierbarkeit und Lerneffizienz in agentenbasierten KI-Systemen" [Arbeitstitel]

Meine Doktorarbeit konzentriert sich auf die Weiterentwicklung der Grundlagen agentischer KI-Systeme, wobei der Schwerpunkt insbesondere auf Erklärbarkeit, Steuerbarkeit und Lerneffizienz liegt. Im Gegensatz zu klassischen Entscheidungsunterstützungssystemen, die Informationen oder Empfehlungen für menschliches Handeln bereitstellen, treffen agentische KI-Systeme autonome Entscheidungen und interagieren direkt mit ihrer Umgebung. Dieser Wandel von der Entscheidungsunterstützung hin zur Entscheidungsfindung bringt neue Anforderungen mit sich: Diese Systeme müssen nicht nur transparent sein, sondern auch in ihrem Verhalten vorhersehbar, auf menschliche oder organisatorische Ziele abgestimmt und unter Unsicherheit robust sein, da ihre Handlungen unmittelbare Konsequenzen in der realen Welt haben.
Agentische KI-Systeme bestehen aus autonomen Entscheidungsträgern – KI-Agenten –, deren Verhalten typischerweise durch Deep Reinforcement Learning (DRL) erlernt wird. Da diese Systeme zunehmend in komplexen, unsicheren Umgebungen eingesetzt werden, ist das Verständnis und die Beeinflussung ihrer internen Denkprozesse zu einer zentralen wissenschaftlichen Herausforderung geworden. Die Fähigkeit zu interpretieren, wie ein Agent interne Repräsentationen bildet, wie er Unsicherheit bewertet und wie er sich an dynamische Bedingungen anpasst, ist unerlässlich, um ein sicheres und zuverlässiges autonomes Verhalten zu gewährleisten.
Ein Kernziel dieser Forschung ist die Entwicklung von Methoden, die die Lerndynamik agentischer KI-Systeme transparenter machen und besser auf menschliche oder systemische Ziele abstimmen. Dazu gehört die Untersuchung, wie sich Rauschen, Stochastizität und Instabilität in der Umgebung durch den Lernprozess ausbreiten und wie diese Faktoren die Politikbildung beeinflussen. Durch die Integration von Erklärbarkeit mit kontrollorientierten Mechanismen zielt das Projekt darauf ab, Systeme zu schaffen, deren Verhalten überwacht, gesteuert oder eingeschränkt werden kann, ohne die Leistung zu beeinträchtigen.
Ein weiterer Schwerpunkt liegt auf der Bekämpfung der Ineffizienzen und des Rauschens, die dem DRL-Training innewohnen. Traditionelle DRL-Algorithmen leiden häufig unter hoher Varianz, instabilen Gradienten und langsamer Konvergenz, insbesondere in hochdimensionalen oder teilweise beobachtbaren Umgebungen. Die Forschung untersucht Strategien zur Minderung dieser Einschränkungen durch Rauschunterdrückungstechniken und architektonische Modifikationen, die die Sample-Effizienz verbessern. Das übergeordnete Ziel ist es, agentische KI-Systeme zu entwerfen, die deutlich schneller lernen und gleichzeitig Robustheit gegenüber Unsicherheit und dynamischen Veränderungen bewahren.
Insgesamt zielt dieses Doktoratsprojekt darauf ab, das wissenschaftliche Verständnis darüber zu vertiefen, wie agentische KI-Systeme lernen, argumentieren und sich verhalten – und Methoden zu entwickeln, die diese Systeme transparenter, vorhersehbarer, kontrollierbarer und effizienter machen. Die langfristige Vision ist es, zur Schaffung von KI-Systemen beizutragen, die nicht nur leistungsstark, sondern auch vertrauenswürdig sind und den menschlichen Entscheidungsbedürfnissen entsprechen.