SWAMBIT

Shared Workspace and Memory for Brain-Inspired Transformers

Ziel des Projekts ist die Entwicklung einer neuartigen, vom Gehirn inspirierten KI-Architektur, die mit deutlich weniger Rechenaufwand auskommt als heutige große Sprachmodelle wie ChatGPT. Dafür untersucht das Projektteam Gedächtnis, Bewusstsein und kognitive Effizienz des Gehirns. Die Forschenden an der BHT entwickeln und evaluieren darauf aufbauend eine Architektur, die aus 1. vielen kleinen, spezialisierten Modulen, 2. einem gemeinsamen globalen Arbeitsbereich und 3. einer Gedächtnisbank besteht.

Die spezialisierten Module – kleine Transformermodelle – arbeiten flexibel zusammen und lösen einzeln oder im Verbund verschiedene Aufgaben. Sie sind angelehnt an die kortikalen Makrosäulen im Gehirn, in denen funktionell gleichartige Neuronen organisiert sind. Wie die Makrosäulen können die Module individuell angesteuert werden – je nach Aufgabe. Das übernimmt ein gemeinsamer globalen Arbeitsbereich als zentrales Steuerungselement, analog zum Thalamus im Gehirn. Außerdem umfasst die KI-Architektur eine Gedächtnisbank, die das System mit gespeichertem Wissen anreichert. Sie ist angelehnt an den Hippocampus, die Schnittstelle zwischen Kurz- und Langzeitgedächtnis.

Mit seiner KI-Achitektur legt das Forschungsteam den Fokus also auf Spärlichkeit (die gezielte Aktivierung einzelner Module), auf Modularität und globale Steuerung. Außerdem untersucht es, welche Effekte die Spärlichkeit auf Energieverbrauch und Leistung hat.

Durch den modularen Aufbau wird die KI skalierbarer, transparenter und besser an neue Aufgaben anpassbar. Außerdem ist diese modulare Architektur deutlich energieeffizienter als monolithische Ansätze. Sie bietet nicht nur den größten Akteuren, sondern auch kleineren Unternehmen Geschäftsmöglichkeiten. Module aus verschiedenen Quellen können kombiniert und fachspezifische Spezialisten kostengünstig gelernt werden. Die vielseitigen Agenten lassen sich durch die Kombination verschiedener Modalitäten für eine Vielzahl von Aufgaben einsetzen.

Die Struktur der KI ermöglicht Skalierbarkeit, Effizienz und multimodale Verarbeitung und eignet sich daher für Anwendungen in Bereichen wie der medizinischen Entscheidungsunterstützung. Deshalb möchte das BHT-Team zum Abschluss des Projekts einen medizinischen Agenten implementieren, das System anhand medizinischer Bild- und Sprachaufgaben bewerten, die Genauigkeit und Robustheit der vom System ausgegebenen Lösungen messen und die praktische Nutzbarkeit beurteilen.

Laufzeit

12.2025 - 11.2028

Projektpartner

Humboldt Universität zu Berlin

Mittelgeber

Bundesministerium für Forschung, Technologie und Raumfahrt