Künstliche Intelligenz gibt Aufschluss darüber, wie das Gehirn

In den letzten Jahren sind Sprachmodelle der künstlichen Intelligenz bei bestimmten Aufgaben sehr gut geworden. Vor allem zeichnen sie sich dadurch aus, dass sie das nächste Wort in einer Textfolge vorhersagen; Diese Technologie hilft Suchmaschinen und SMS-Apps, das nächste Wort, das Sie eingeben werden, vorherzusagen.

Die neueste Generation prädiktiver Sprachmodelle scheint auch etwas über die zugrunde liegende Bedeutung von Sprache zu lernen. Diese Modelle können nicht nur das nächste Wort vorhersagen, sondern auch Aufgaben ausführen, die ein gewisses Maß an echtem Verständnis zu erfordern scheinen, wie das Beantworten von Fragen, die Zusammenfassung von Dokumenten und das Vervollständigen von Geschichten.

Solche Modelle wurden entwickelt, um die Leistung für die spezifische Funktion der Textvorhersage zu optimieren, ohne zu versuchen, etwas darüber nachzuahmen, wie das menschliche Gehirn diese Aufgabe erfüllt oder Sprache versteht. Aber eine neue Studie von MIT-Neurowissenschaftlern legt nahe, dass die zugrunde liegende Funktion dieser Modelle der Funktion von Sprachverarbeitungszentren im menschlichen Gehirn ähnelt.

Computermodelle, die bei anderen Arten von Sprachaufgaben gut funktionieren, zeigen diese Ähnlichkeit mit dem menschlichen Gehirn nicht und liefern Beweise dafür, dass das menschliche Gehirn die Vorhersage des nächsten Wortes verwenden kann, um die Sprachverarbeitung voranzutreiben.

„Je besser das Modell das nächste Wort vorhersagen kann, desto besser passt es zum menschlichen Gehirn“, sagt Nancy Kanwisher, Walter A. Rosenblith Professorin für kognitive Neurowissenschaften, Mitglied des McGovern Institute for Brain Research and Center for Brains am MIT.

Minds and Machines (CBMM) und Autor der neuen Studie. „Es ist erstaunlich, dass die Modelle so gut passen, und es deutet sehr indirekt darauf hin, dass das menschliche Sprachsystem vielleicht vorhersagt, was als nächstes passieren wird.“

Joshua Tenenbaum, Professor für Computational Cognitive Science am MIT und Mitglied von CBMM und dem Artificial Intelligence Laboratory (CSAIL) des MIT; und Evelina Fedorenko, Frederick A. und Carole J.

Middleton Career Development Associate Professor of Neuroscience und Mitglied des McGovern Institute, sind die leitenden Autoren der Studie, die diese Woche in den Proceedings of the National Academy of Sciences erscheint. Martin Schrimpf, ein MIT-Doktorand, der im Bereich CBMM arbeitet, ist der erste Autor des Papiers.

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *