设置
分离模型
根据你的需求选择合适的音频分离模型
在 Youka 中,你可以使用 “Split model” 功能将歌曲中的人声与伴奏分离。你有以下几种选择:
Demucs
Demucs(Deep Extractor for Music Sources)是用于音乐源分离的先进深度学习模型。它在时域中运行,能够保留音频的时间细节,并采用卷积神经网络(CNN)架构。Demucs 以高质量分离人声、鼓、贝斯及其他乐器而闻名,是制作卡拉 OK 和音乐制作等任务的首选之一。
MDX-23C
MDX-23C 模型面向高级音乐拆分(demixing)任务,重点将音乐分离为四个音轨(stems):bass、drums、vocals 和其他乐器。该模型基于 Demucs4 与 MDX 神经网络架构的融合,并引入了 Ultimate Vocal Remover 项目中的部分权重。MDX-23C 提供高质量的分离效果,尤其在强力 GPU 环境下表现突出,适合需要精确、专业级音频分离的用户。
ReFormer
ReFormer 是音乐拆分领域较新的模型之一,以其在音乐轨道音轨分离上的创新方法而知名。它将传统信号处理技术与现代深度学习方法结合,以实现干净且准确的分离。该模型旨在在质量与处理速度之间取得平衡,适用于专业用户和业余爱好者。
MDX-Net (with backing vocals)
MDX-Net 是专为音乐拆分开发的双流神经网络,包含一个时频分支和一个时域分支。这种架构使模型能够通过分析音频的不同特征来分离音轨,并将两个分支的输出结合,从而生成高精度的分离结果。MDX-Net 已在国际音乐拆分挑战赛中获得领先名次,证明了其有效性,是需要高精度音频处理用户的可靠选择。