Digital Eliteboard - Das Digitale Technik Forum

Registriere dich noch heute kostenloses um Mitglied zu werden! Sobald du angemeldet bist, kannst du auf unserer Seite aktiv teilnehmen, indem du deine eigenen Themen und Beiträge erstellst und dich über deinen eigenen Posteingang mit anderen Mitgliedern unterhalten kannst! Zudem bekommst du Zutritt zu Bereiche, welche für Gäste verwehrt bleiben

Hardware & Software Wie kann ich Gesang von Musik trennen?

Mit
Du musst dich Anmelden oder Registrieren um diesen link zusehen!
lässt sich der Gesang aus einem Lied entfernen
. Mit der so entstandenen Instrumental-Version kann man zum Beispiel um Beispiel bei einer Veranstaltung verwenden. Alternativ kann man auch selbst aufgenommenen Gesang mit dem Song mischen und so eine eigene Version erstellen.

Du musst dich Anmelden oder Registrieren um diesen link zusehen!
Ist einer von denen, dem so etwas auch ganz einfach gelingt.

1702305547662.png

Die faszinierende Welt der KI: Kreative Anwendungen von Neuronalen Netzen

In der Ära der künstlichen Intelligenz (KI) sind wir Zeugen faszinierender Entwicklungen, insbesondere im Bereich der neuronalen Netze. Ein Phänomen, das immer mehr Aufmerksamkeit auf sich zieht, ist die Verwendung von KI in der Musik- und Videoproduktion. In diesem Artikel werden besonders Fähigkeiten der neuronale Netze vorgestellt, die in der kreativen Arbeit Anwendung finden.
Dabei tauchen wir in die Welt von Chat GPT, Stable Diffusion und anderen innovativen Tools ein

Die Welle der KI-Videos
Im Internet sind derzeit Unmengen von Videos zu sehen, die sich mit dem Thema KI befassen. Insbesondere die Diskussion um Chat GPT und Stable Diffusion hat in den letzten Monaten einen regelrechten Hype ausgelöst. Dabei werden auf verschiedenen Plattformen mithilfe künstlicher Intelligenz Musikstücke erstellt oder Objekte direkt in Videos ersetzt. Doch wie beeindruckend klingen und wirken diese Anwendungen wirklich?

Stable Diffusion: Hype oder Substanz?
Ein Beispiel für eine viel diskutierte KI ist Stable Diffusion. Auch wenn dieses Tool in letzter Zeit viel Aufmerksamkeit auf sich gezogen hat, sollte beachtet werden, dass seine Anwendung Zeit und Engagement erfordert. Ist der Hype um Stable Diffusion gerechtfertigt? Wir beleuchten die interessante, aber anspruchsvolle Natur einer Musik KI.

Musik in Schichten

Lassen Sie uns nun zu konkreten Anwendungen übergehen. Der Service "Fader" ermöglicht es, Musikstücke in verschiedene Schichten aufzuspalten. Dies ist besonders hilfreich, wenn man beispielsweise den Gesang aus einer Komposition entfernen möchte.
  1. Besuchen Sie die Website fader.com und melden Sie sich an.​
  2. Laden Sie Ihre Komposition hoch.​
  3. Wählen Sie die gewünschten Spuren aus und laden Sie das Ergebnis herunter.​
Ein praktisches Beispiel Könnte Ihnen die Möglichkeiten eröffnen, wie man den Gesang aus einer Musikkomposition entfernt und nur die instrumentale Version behält.

Fazit
Die Verwendung von neuronalen Netzen in der Musik- und Videoproduktion wird immer verbreiteter. Bei aller Begeisterung ist es jedoch wichtig zu prüfen, inwiefern Tools wie Stable Diffusion den eigenen Bedürfnissen und Fähigkeiten entsprechen. Die Entwicklung dieser Technologien eröffnet faszinierende Perspektiven in der kreativen Gestaltung und Bearbeitung von Inhalten.
Viel Spaß beim Experimentieren
Die mir zurzeit bekanntesten
Du musst dich Anmelden oder Registrieren um diesen link zusehen!
werden hier aufgeführt.
 
Zuletzt bearbeitet:
Hiermit muss man sich nirgendwo anmelden, weil man es auf seinem Rechner nutzen kann:
Du musst dich Anmelden oder Registrieren um diesen link zusehen!


Vorteil außerdem: Eigene GPU-Power (Cuda und AMD) nutzbar, sowie Ein- Ausgabe im Flac Format möglich (lossless). Außerdem massig vortrainierte Modelle mit denen man exzellente Ergebnisse erzielt.
 
Bei der Installation wird das Programm als Virus erkannt. Woran liegt das?
 
Zuletzt bearbeitet von einem Moderator:
Bei mir wurde es nicht als Virus erkannt!? Der Ultimate Vocal Remover GUI ist auch ein allgemein bekanntes Programm, also nix aus einer dubiosen Ecke. Hast Du es auch direkt aus meinem Link bezogen? Das Programm selbst lädt Updates und neue Modelle. Vielleicht identifiziert Dein Virenscanner dieses Verhalten als verdächtig? Ich nutze den Bitdefender, eines der besten Antivirenprogramme überhaupt. Nix. Habe gerade noch einen neuen Update Patch drübergebügelt.

Es ist bei mir aber schon länger installiert, d.h. ich habe nicht mit der aktuellen Version "angefangen". Vielleicht passiert beim aktuellen Installatonspaket (Version 5.6) irgend etwas, was der Virenscanner als Virus identifiziert? Keine Ahnung. Anderseits bist Du bis jetzt der Einzige, der das vermeldet.
 
Interessant wäre, wenn man den Gesang übersetzen und mit derselben Stimme dazu hinzufügen könnte. Womöglich hat es schon einer mal versucht?

Kann einer meine Beiträge zusammenführen, bitte. Leider gibt es hier keine Löschmöglichkeit für meinen Beitrag.
 
Zuletzt bearbeitet:
Falls jemand immer noch nicht vertraut ist mit der Art und Weise, wie die künstliche Intelligenz Stimmen übersetzt und wiedergibt, habe ich auch dazu etwas geschrieben.
 
Ich habe es genutzt, um AI Songs zu erstellen, bei denen ich die Stimme des Künstlers mit meiner Eigenen ersetze :D

Das habe ich in Kombination mit dem Programm Retrieval-based-Voice-Conversion-WebUI (
Du musst dich Anmelden oder Registrieren um diesen link zusehen!
) gemacht. Damit kann man ein eigenes KI Stimmodell trainieren und später dann Vocals aus Songs (oder woraus auch immer) laden und in die eigene Stimme "umwandeln". Funktioniert nicht perfekt, aber recht gut. Es gibt auch fertige Modelle von allen möglichen Bekanntheiten zum Herunterladen im Netz, aber ich wollte es halt mit meiner eigenen Stimme haben. Für das Training braucht man "saubere" Sprachdateien" bzw. "sauberen, eigenen Gesang" - am besten einen Mix davon. Je länger und qualitativ besser diese eigenen Quelldateien sind, desto weniger Durchläufe braucht das Modelltraining und desto besser ist auch das Ergebnis.

Mit dem Ultimate Vocal Remover habe ich also das Instrumental UND die Vocals extrahiert. Die Vocals wurden dann in der Retrieval-based-Voice-Conversion-WebUI mit meinem Stimmodell in Vocals mit meiner Stimme umgemodelt und das Ganze dann mit Adobe Audition wieder zusammengepappt. Fertig ist der AI Song :D

P.s.:
Vom Retrieval-based-Voice-Conversion-WebUI gibt es ebenfalls eine GPU unterstütze Variante für z.B. NVIDIA, was den Trainingsvorgang extrem beschleunigt. Bitte fragt mich aber nicht nach Tipps und Tricks zu dem Programm. Die Zeit in der ich mich damit beschäftigt habe ist schon etwas her und das Thema ist komplex, wenn man wirklich gute Ergebnisse erzielen will. Es gibt zig Anleitungen und Foren, die sich damit beschäftigen. Viel Erfolg!!! ;)
 
Das gibt's doch schon seit Jahren in diversen DJ Softwares wie Native Instruments Traktor oder Serato DJ. Die Audio Files kann man dort zum Beispiel in .stem files umwandeln die dann Acapella/Gesang, Drums und Samples/Instrumente voneinander getrennt haben.
 
Die Software "Ultimate Vocal Remover" ist besser als das meiste, was es sonst so gibt aber doch noch recht entfernt von perfekten Ergebnissen. Es gibt noch viel zu viele Klangveränderungen, bei denen man merkt, dass da etwas rausgerechnet wurde. Das dürfte auch von Song zu Song unterschiedlich sein.
 
Zurück
Oben