Все документы
Параметры

Split Model

Выберите подходящую модель разделения аудио под ваши задачи

В Youka вы можете использовать функцию "Split model", чтобы отделять вокал от инструментала в песне. У вас есть несколько вариантов:

Demucs

Demucs (Deep Extractor for Music Sources) — это современная модель глубокого обучения для разделения музыкальных источников. Она работает во временной области, сохраняя временные детали аудио, и использует архитектуру сверточной нейронной сети (CNN). Demucs известна высоким качеством разделения вокала, ударных, баса и других инструментов, что делает её отличным выбором для задач вроде создания караоке и музыкального продакшена.

MDX-23C

Модель MDX-23C предназначена для продвинутых задач демикширования музыки и нацелена на разделение трека на четыре стема: bass, drums, vocals и other instruments. Эта модель основана на сочетании архитектур Demucs4 и MDX neural net и включает некоторые веса из проекта Ultimate Vocal Remover. MDX-23C обеспечивает высокое качество разделения и особенно эффективна при использовании мощной GPU-конфигурации, что делает её сильным выбором для пользователей, которым нужно точное разделение аудио профессионального уровня.

ReFormer

ReFormer — относительно новый участник в области демикширования музыки, известный инновационным подходом к разделению стемов в музыкальных треках. Он сочетает традиционные методы обработки сигналов с современными методами глубокого обучения, чтобы добиться чистого и точного разделения. Эта модель стремится обеспечить баланс между качеством и скоростью обработки, поэтому подходит как профессионалам, так и любителям.

MDX-Net (with backing vocals)

MDX-Net — двухпоточная нейросетевая модель, разработанная специально для демикширования музыки, с ветвью time-frequency и ветвью time-domain. Такая архитектура позволяет разделять стемы, анализируя разные аспекты аудио и объединяя результаты обоих потоков для получения максимально точного разделения. MDX-Net доказала свою эффективность, занимая ведущие места в международных соревнованиях по демикшированию музыки, что делает её надежным вариантом для пользователей, которым нужна высокая точность при обработке аудио.