Auf dem Weg zur Spracherkennung für ungewöhnliche

Mit der Popularität virtueller Assistenten wie Siri ist die automatische Spracherkennungstechnologie immer häufiger geworden, aber viele dieser Systeme funktionieren nur mit der am weitesten verbreiteten der rund 7.000 Sprachen der Welt.

Da diese Systeme für weniger verbreitete Sprachen weitgehend nicht existieren, sind die Millionen von Menschen, die sie sprechen, von vielen Technologien abgeschnitten, die auf Sprache angewiesen sind, von Smart-Home-Geräten bis hin zu unterstützenden Technologien und Übersetzungsdiensten.

Jüngste Fortschritte haben maschinelle Lernmodelle ermöglicht, die die ungewöhnlichen Sprachen der Welt lernen können, denen die große Menge an transkribierter Sprache fehlt, die zum Trainieren von Algorithmen erforderlich ist. Diese Lösungen sind jedoch oft zu komplex und zu teuer, um breit angewendet zu werden.

Forscher am MIT und anderswo haben dieses Problem nun angegangen, indem sie eine einfache Technik entwickelt haben, die die Komplexität eines fortschrittlichen Sprachlernmodells reduziert und es ihm ermöglicht, effizienter zu laufen und eine höhere Leistung zu erzielen.

Ihre Technik besteht darin, unnötige Teile eines gängigen, aber komplexen Spracherkennungsmodells zu entfernen und dann kleinere Anpassungen vorzunehmen, damit es eine bestimmte Sprache erkennen kann. Da nach dem Verkleinern des größeren Modells nur noch kleine Anpassungen erforderlich sind, ist es viel weniger teuer und zeitaufwändig, diesem Modell eine ungewöhnliche Sprache beizubringen.

Diese Arbeit könnte dazu beitragen, gleiche Wettbewerbsbedingungen zu schaffen und automatische Spracherkennungssysteme in viele Gebiete der Welt zu bringen, in denen sie noch eingesetzt werden müssen. Die Systeme sind in einigen akademischen Umgebungen wichtig, wo sie blinden oder sehbehinderten Studenten helfen können und werden auch verwendet, um die Effizienz im Gesundheitswesen durch medizinische Transkription und im Rechtsbereich durch Gerichtsberichte zu verbessern. Die automatische Spracherkennung kann Benutzern auch helfen, neue Sprachen zu lernen und ihre Aussprachefähigkeiten zu verbessern. Mit dieser Technologie könnten sogar seltene Sprachen, die vom Verschwinden bedroht sind, transkribiert und dokumentiert werden.

„Dies ist ein wichtiges Problem, das es zu lösen gilt, da wir über eine erstaunliche Technologie für die Verarbeitung natürlicher Sprache und Spracherkennung verfügen, aber die Forschung in diese Richtung wird uns helfen, die Technologie auf viele weitere unerforschte Sprachen der Welt auszuweiten“, sagt Cheng-I Jeff Lai . , ein Doktorand am Computer Science and Artificial Intelligence Laboratory (CSAIL) des MIT und Erstautor des Artikels.

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *