Todos los Docs
Configuración

Modelo de separación

Elige el modelo de separación de audio adecuado para tus necesidades

En Youka, puedes usar la función "Split model" para separar las voces de los instrumentales en una canción. Tienes varias opciones:

Demucs

Demucs (Deep Extractor for Music Sources) es un modelo de aprendizaje profundo de última generación para la separación de fuentes musicales. Funciona en el dominio temporal, preservando los detalles temporales del audio, y utiliza una arquitectura de red neuronal convolucional (CNN). Demucs es conocido por su separación de alta calidad de voces, batería, bajo y otros instrumentos, lo que lo convierte en una opción principal para tareas como la creación de karaoke y la producción musical.

MDX-23C

El modelo MDX-23C está diseñado para tareas avanzadas de demixing musical, orientadas específicamente a separar la música en cuatro stems: bajo, batería, voces y otros instrumentos. Este modelo se basa en una combinación de las arquitecturas de red neuronal Demucs4 y MDX, e incorpora ciertos pesos del proyecto Ultimate Vocal Remover. MDX-23C ofrece una separación de alta calidad y es especialmente eficaz cuando se utiliza con una configuración de GPU potente, lo que lo convierte en una gran opción para usuarios que buscan una separación de audio precisa y de nivel profesional.

ReFormer

ReFormer es un participante relativamente nuevo en el campo del demixing musical, conocido por su enfoque innovador para separar stems en pistas musicales. Combina técnicas tradicionales de procesamiento de señales con métodos modernos de aprendizaje profundo para lograr una separación limpia y precisa. Este modelo busca equilibrar la calidad y la velocidad de procesamiento, lo que lo hace adecuado tanto para usuarios profesionales como aficionados.

MDX-Net (with backing vocals)

MDX-Net es una red neuronal de doble flujo desarrollada específicamente para el demixing musical, con una rama de tiempo-frecuencia y una rama de dominio temporal. Esta arquitectura permite que el modelo separe stems analizando distintos aspectos del audio, combinando las salidas de ambos flujos para generar separaciones de alta precisión. MDX-Net ha demostrado su eficacia al obtener los primeros puestos en competiciones internacionales de demixing musical, lo que lo convierte en una opción fiable para usuarios que necesitan alta precisión en su procesamiento de audio.