Du musst Regestriert sein, um das angehängte Bild zusehen.
Sind KI-Systeme wirklich intelligent oder nur gut imitierende Technologien?Eine neue Studie von Apple-Forschern wirft Zweifel an der Fähigkeit von Sprachmodellen auf, logisches und mathematisches Denken zu bewältigen.
Durch einen simplen Trick können ChatGPT und ähnliche Modelle leicht in die Irre geführt werden.
Apple enthüllt Schwächen von KI: Mangel an Logik und Verstand
Iman Mirzadeh und sein Team von Apple haben die Leistung großer Sprachmodelle wie ChatGPT genauer untersucht.Mithilfe eines verbesserten Benchmarks namens GSM-Symbolic demonstrierten sie die Grenzen dieser KI-Systeme.
Die Forscher stellten den Modellen Hunderte von Fragen, die diese normalerweise problemlos lösen sollten.
Der entscheidende Trick, der alle KI-Systeme ins Wanken brachte, war das Hinzufügen irrelevanter Informationen oder das Ändern von Zahlenwerten in den Fragen.
Diese zusätzlichen, nicht relevanten Daten führten dazu, dass die Sprachmodelle falsche oder sogar unsinnige Antworten lieferten, obwohl sie zuvor richtig geantwortet hatten.
Besonders bemerkenswert war, dass das Hinzufügen eines einzigen scheinbar relevanten Satzteils zu einer Frage die Leistung aller getesteten Modelle um bis zu 65% verringerte, selbst wenn dieser Teil für die Lösung der Aufgabe nicht von Bedeutung war.
Die Studie zeigte zudem, dass die Leistung der KI-Systeme erheblich abnahm, wenn die Anzahl der Satzteile in einer Frage zunahm.
Dies lässt vermuten, dass KI-Systeme die gestellten Fragen nicht wirklich verstehen, sondern lediglich aufgrund erlernter Muster antworten.
Die Forscher veröffentlichten ihre Ergebnisse auf dem Preprint-Server arXiv unter dem Titel "GSM-Symbolic:
Understanding the Limitations of Mathematical Reasoning in Large Language Models".
Diese Erkenntnisse zeigen, dass LLMs nicht tatsächlich in der Lage sind, logisch und mathematisch zu denken.
Die Studie wirft wichtige Fragen zur Fähigkeit von KI-Systemen auf, nuancierte Informationen zu verarbeiten.
Die Forscher schlussfolgern, dass die scheinbar intelligenten Antworten größtenteils eine Täuschung sind.
LLMs können zwar korrekt erscheinende Antworten liefern, sind in Wirklichkeit jedoch fehlerhaft.
Die Erkenntnisse von Apple bieten wichtige Einblicke in die tatsächlichen Fähigkeiten und Grenzen von KI-Systemen im Bereich des mathematischen und logischen Denkens.
Sie betonen die Notwendigkeit, die Leistung von LLMs kritisch zu hinterfragen und an der Verbesserung ihrer echten Verständnis- und Denkfähigkeiten zu arbeiten.
Es scheint, dass die Zweifel an der wahren Intelligenz von KI-Systemen gerechtfertigt sind, und die Forschung muss weiterhin daran arbeiten, diese Technologien zu verbessern.