Split Model
Wähle das passende Audio-Separationsmodell für deine Anforderungen
In Youka kannst du die Funktion „Split model“ verwenden, um in einem Song die Vocals von den Instrumentals zu trennen. Dafür stehen dir mehrere Optionen zur Verfügung:
Demucs
Demucs (Deep Extractor for Music Sources) ist ein hochmodernes Deep-Learning-Modell zur Quellentrennung in Musik. Es arbeitet im Zeitbereich, bewahrt die zeitlichen Details des Audios und verwendet eine Convolutional Neural Network (CNN)-Architektur. Demucs ist für seine hochwertige Trennung von Vocals, Drums, Bass und anderen Instrumenten bekannt und damit eine erstklassige Wahl für Aufgaben wie Karaoke-Erstellung und Musikproduktion.
MDX-23C
Das MDX-23C-Modell ist für fortgeschrittene Music-Demixing-Aufgaben konzipiert und zielt speziell darauf ab, Musik in vier Stems zu trennen: Bass, Drums, Vocals und andere Instrumente. Dieses Modell basiert auf einer Mischung aus Demucs4- und MDX-Neural-Net-Architekturen und übernimmt bestimmte Weights aus dem Ultimate Vocal Remover-Projekt. MDX-23C bietet eine hochwertige Trennung und ist besonders effektiv, wenn es mit einem leistungsstarken GPU-Setup eingesetzt wird – eine starke Wahl für Nutzer, die eine präzise und professionell hochwertige Audio-Separation suchen.
ReFormer
ReFormer ist ein relativ neuer Akteur im Bereich Music Demixing und bekannt für seinen innovativen Ansatz zur Trennung von Stems in Musiktracks. Es kombiniert klassische Signalverarbeitungstechniken mit modernen Deep-Learning-Methoden, um eine saubere und präzise Trennung zu erzielen. Dieses Modell zielt darauf ab, Qualität und Verarbeitungsgeschwindigkeit auszubalancieren, wodurch es sich sowohl für professionelle als auch für Hobbyanwender eignet.
MDX-Net (with backing vocals)
MDX-Net ist ein Two-Stream-Neural-Network, das speziell für Music Demixing entwickelt wurde und sowohl einen Time-Frequency-Branch als auch einen Time-Domain-Branch umfasst. Diese Architektur ermöglicht es dem Modell, Stems zu trennen, indem es verschiedene Aspekte des Audios analysiert und die Ausgaben beider Streams kombiniert, um äußerst präzise Trennungen zu erzeugen. MDX-Net hat seine Leistungsfähigkeit bewiesen, indem es in internationalen Music-Demixing-Wettbewerben Spitzenplätze erreicht hat, und ist damit eine verlässliche Option für Nutzer, die eine hohe Präzision bei ihrer Audioverarbeitung benötigen.