Die Sprache ermöglicht es den Menschen, einander ihre Gedanken mitzuteilen, da das Gehirn jedes Menschen auf die gleiche Weise auf die Bedeutung von Wörtern reagiert. In unserer kürzlich veröffentlichten Studie haben meine Kollegen und ich einen Rahmen zur Modellierung der Gehirnaktivität von Sprechern entwickelt, die an persönlichen Gesprächen beteiligt sind.
Wir haben die elektrische Aktivität des Gehirns zweier Personen aufgezeichnet, die ohne Skript chatten. Frühere Untersuchungen haben gezeigt, dass die Gehirnaktivität zweier Personen gekoppelt oder ausgerichtet wird, wenn sie sich unterhalten, und dass der Grad der neuronalen Kopplung mit einem besseren Verständnis der Botschaft des Sprechers verbunden ist.
Ein neuronaler Code bezieht sich auf bestimmte Muster der Gehirnaktivität, die mit bestimmten Wörtern in ihrem Kontext verbunden sind. Wir haben herausgefunden, dass die Gehirne der Sprecher auf einen gemeinsamen neuronalen Code ausgerichtet sind. Wichtig ist, dass der neuronale Code des Gehirns dem künstlichen neuronalen Code großer Sprachmodelle (LLMs) ähnelt.
Die neuronalen Muster von Wörtern
Ein großes Sprachmodell ist ein maschinelles Lernprogramm, das Text generieren kann, indem es vorhersagt, welche Wörter am wahrscheinlichsten auf andere Wörter folgen. Großartige Sprachmodelle zeichnen sich durch das Erlernen der Sprachstruktur, die Generierung menschenähnlicher Texte und das Führen von Gesprächen aus. Sie können sogar den Turing-Test bestehen, sodass es für jemanden schwierig ist zu erkennen, ob er mit einer Maschine oder einem Menschen interagiert. Wie Menschen lernen LLMs das Sprechen, indem sie Texte lesen oder anhören, die von anderen Menschen verfasst wurden.
Indem wir dem LLM eine Abschrift des Gesprächs gaben, konnten wir seine „neuronalen Aktivierungen“ extrahieren, das heißt, wie er Wörter in Zahlen übersetzt, während er das Skript „liest“. Anschließend korrelierten wir die Gehirnaktivität des Sprechers mit LLM-Aktivierungen und mit der Gehirnaktivität des Zuhörers. Wir fanden heraus, dass LLM-Aktivierungen die gemeinsame Gehirnaktivität von Sprecher und Zuhörer vorhersagen können.
Um einander verstehen zu können, müssen sich die Menschen über grammatikalische Regeln und die Bedeutung von Wörtern im Kontext einigen. Wir wissen zum Beispiel, wie man die Vergangenheitsform eines Verbs verwendet, um über vergangene Handlungen zu sprechen, wie im Satz: „Er hat gestern das Museum besucht.“ » Darüber hinaus verstehen wir intuitiv, dass dasselbe Wort in verschiedenen Situationen unterschiedliche Bedeutungen haben kann. Beispielsweise kann sich das Wort kalt im Satz „Du bist kalt wie Eis“ je nach Kontext entweder auf die Körpertemperatur oder auf ein Persönlichkeitsmerkmal beziehen. Aufgrund der Komplexität und des Reichtums der natürlichen Sprache fehlte uns bis zum jüngsten Erfolg großer Sprachmodelle ein präzises mathematisches Modell, um sie zu beschreiben.
Unsere Studie hat gezeigt, dass große linguistische Modelle vorhersagen können, wie sprachliche Informationen im menschlichen Gehirn kodiert werden, und so ein neues Werkzeug zur Interpretation der menschlichen Gehirnaktivität bereitstellen. Die Ähnlichkeit zwischen dem Sprachcode des menschlichen Gehirns und dem des großen Sprachmodells hat es uns erstmals ermöglicht, zu verfolgen, wie Informationen im Gehirn des Sprechers in Wörter kodiert und dabei Wort für Wort an das Gehirn des Zuhörers übertragen werden persönliche Gespräche. Wir haben zum Beispiel herausgefunden, dass die mit der Bedeutung eines Wortes verbundene Gehirnaktivität im Gehirn des Sprechers entsteht, bevor er ein Wort artikuliert, und dass dieselbe Aktivität im Gehirn des Zuhörers schnell wieder auftritt, nachdem er das Wort gehört hat.
Leistungsstarkes neues Tool
Unsere Studie lieferte Einblicke in den neuronalen Code für die Sprachverarbeitung im menschlichen Gehirn und wie Menschen und Maschinen diesen Code zur Kommunikation nutzen können. Wir fanden heraus, dass große Sprachmodelle die gemeinsame Gehirnaktivität besser vorhersagen konnten als andere Merkmale der Sprache, wie etwa die Syntax oder die Reihenfolge, in der Wörter zu Sätzen zusammengefügt werden. Dies ist teilweise auf die Fähigkeit des LLM zurückzuführen, die kontextuelle Bedeutung von Wörtern zu integrieren und mehrere Ebenen der sprachlichen Hierarchie in ein einziges Modell zu integrieren: von Wörtern über Sätze bis hin zur konzeptionellen Bedeutung. Dies deutet auf wichtige Ähnlichkeiten zwischen dem Gehirn und künstlichen neuronalen Netzen hin.
Ein wichtiger Aspekt unserer Forschung ist die Verwendung täglicher Aufzeichnungen natürlicher Gespräche, um sicherzustellen, dass unsere Ergebnisse die Verarbeitung im Gehirn im wirklichen Leben widerspiegeln. Dies wird als ökologische Validität bezeichnet. Im Gegensatz zu Experimenten, bei denen den Teilnehmern gesagt wird, was sie sagen sollen, geben wir die Kontrolle über die Studie ab und lassen die Teilnehmer sich so natürlich wie möglich unterhalten. Dieser Kontrollverlust erschwert die Datenanalyse, da jedes Gespräch einzigartig ist und zwei interagierende Personen beteiligt sind, die spontan sprechen. Unsere Fähigkeit, neuronale Aktivität zu modellieren, wenn Menschen an alltäglichen Gesprächen teilnehmen, zeugt von der Leistungsfähigkeit großer Sprachmodelle.
Andere Abmessungen
Nachdem wir nun einen Rahmen zur Beurteilung des neuronalen Codes entwickelt haben, der bei alltäglichen Gesprächen zwischen Gehirnen ausgetauscht wird, interessieren wir uns für die Faktoren, die diese Kopplung fördern oder hemmen. Nimmt beispielsweise die sprachliche Kopplung zu, wenn ein Zuhörer die Absicht des Sprechers besser versteht? Oder vielleicht kann komplexe Sprache wie Fachjargon die neuronale Kopplung verringern.
Ein weiterer Faktor, der die Sprachkopplung beeinflussen kann, kann die Beziehung zwischen den Sprechern sein. Beispielsweise können Sie einem guten Freund möglicherweise viele Informationen in wenigen Worten übermitteln, einem Fremden jedoch nicht. Oder Sie sind neuronal eher mit politischen Verbündeten als mit Rivalen verbunden. In der Tat können Unterschiede in der Art und Weise, wie wir Wörter in verschiedenen Gruppen verwenden, es einfacher machen, uns mit Menschen innerhalb unserer sozialen Gruppen zusammenzuschließen und mit ihnen in Kontakt zu kommen, statt mit Außenstehenden.
Dieser Artikel wurde von The Conversation erneut veröffentlicht, einer unabhängigen, gemeinnützigen Nachrichtenorganisation, die Ihnen vertrauenswürdige Fakten und Analysen liefert, die Ihnen helfen, unsere komplexe Welt zu verstehen. Es wurde geschrieben von: Zaid Zada, Princeton Universität
Erfahren Sie mehr:
Zaid Zada arbeitet nicht für ein Unternehmen oder eine Organisation, die von diesem Artikel profitieren könnte, berät nicht, besitzt keine Anteile daran und erhält keine Mittel von diesen und hat keine Verbindungen außerhalb seiner Universitätsposition erklärt.