Der Datenkonzern Meta Platforms hat mit seinem Partner Microsoft eine neue, größere Version des generativen Sprachmodells LLaMA (Large Langue Model Meta Ai) veröffentlicht. Sie lautet auf den Namen – Überraschung! – LLaMA 2. Sprache meint hier auch Programmiersprachen: Start-ups und Unternehmen sollen mit dem Open-Source-Sprachmodell maßgeschneiderte Software programmieren lassen können.
Den eigenen Angaben zu Folge hat Meta im Vergleich zu LLaMA 1 40 Prozent mehr Daten für das Training eingesetzt und dabei doppelt so viel Kontext einbezogen. LLaMA 2 liegt in drei unterschiedlich großen Varianten vor: Mit sieben Milliarden, 13 Milliarden sowie 70 Milliarden Parametern. Meta gibt an, dass LLaMA 2 andere Open-Source-Sprachmodelle jeweils ähnlicher Größe bei mehreren Benchmarks übertroffen habe.
Die Financial Times hat vorige Woche berichtet, dass Meta in naher Zukunft eine kommerzielle LLaMA-Variante auf den Markt bringen wolle. Doch ist LLaMA 2 gebührenfrei nutzbar, auch für kommerzielle Anwendungen.
Die freie Verwendbarkeit werde nicht nur Vorteile für die Anwender bringen, sondern auch die Sicherheit verbessern und die Weiterentwicklung fördern, schreibt Meta. "Entwickler und Forscher können es testen und rasch Probleme erkennen und lösen, als Gemeinschaft. Durch Beobachtung, wie diese Werkzeuge von anderen genutzt werden, können unsere Teams daraus lernen, diese Werkzeuge verbessern und Schwachstellen fixen."
Für KI-Forscher an Universitäten in aller Welt legt Meta ein Partnerschaftsangebotauf. Es soll Zusammenarbeit und das Teilen von Erfahrungen fördern. Außerdem beginnt bald einen Wettbewerb, die Llama Impact Challenge. Teilnehmer sollen LLaMA 2 dazu nutzen, wichtige Herausforderungen zu überwinden, beispielsweise in den Bereichen Umwelt und Bildung.
Quelle: c‘t
Den eigenen Angaben zu Folge hat Meta im Vergleich zu LLaMA 1 40 Prozent mehr Daten für das Training eingesetzt und dabei doppelt so viel Kontext einbezogen. LLaMA 2 liegt in drei unterschiedlich großen Varianten vor: Mit sieben Milliarden, 13 Milliarden sowie 70 Milliarden Parametern. Meta gibt an, dass LLaMA 2 andere Open-Source-Sprachmodelle jeweils ähnlicher Größe bei mehreren Benchmarks übertroffen habe.
Die Financial Times hat vorige Woche berichtet, dass Meta in naher Zukunft eine kommerzielle LLaMA-Variante auf den Markt bringen wolle. Doch ist LLaMA 2 gebührenfrei nutzbar, auch für kommerzielle Anwendungen.
Die freie Verwendbarkeit werde nicht nur Vorteile für die Anwender bringen, sondern auch die Sicherheit verbessern und die Weiterentwicklung fördern, schreibt Meta. "Entwickler und Forscher können es testen und rasch Probleme erkennen und lösen, als Gemeinschaft. Durch Beobachtung, wie diese Werkzeuge von anderen genutzt werden, können unsere Teams daraus lernen, diese Werkzeuge verbessern und Schwachstellen fixen."
Wettbewerb und Angebot an Unis
Die Nachfrage nach Nutzung von LLaMA 1 habe die eigenen Erwartungen bei weitem übertroffen. Meta spricht von mehr als 100.000 Anfragen. In Microsofts Azure AI Model Catalogue ist LLaMA 2 ab sofort verfügbar, außerdem über AWS (Amazon Web Services), Hugging Face und andere Plattformen. Vor dem Einsatz sollten unbedingt die Acceptable Use Policy, der Responsible Use Guide und ein hauseigenes Forschungspaper gelesen werden. Letzteres gibt Einblick in bekannte Schwierigkeiten mit dem neuen Sprachmodell sowie gegenwärtige und geplante Abhilfe.Für KI-Forscher an Universitäten in aller Welt legt Meta ein Partnerschaftsangebotauf. Es soll Zusammenarbeit und das Teilen von Erfahrungen fördern. Außerdem beginnt bald einen Wettbewerb, die Llama Impact Challenge. Teilnehmer sollen LLaMA 2 dazu nutzen, wichtige Herausforderungen zu überwinden, beispielsweise in den Bereichen Umwelt und Bildung.
Quelle: c‘t