모든 문서
설정

분리 모델

필요에 맞는 오디오 분리 모델을 선택하세요

Youka에서는 "Split model" 기능을 사용해 곡에서 보컬과 반주를 분리할 수 있습니다. 다음과 같은 여러 옵션이 있습니다:

Demucs

Demucs(Deep Extractor for Music Sources)는 음악 소스 분리를 위한 최첨단 딥러닝 모델입니다. 시간 도메인에서 동작해 오디오의 시간적 디테일을 보존하며, 합성곱 신경망(CNN) 아키텍처를 사용합니다. Demucs는 보컬, 드럼, 베이스 및 기타 악기를 고품질로 분리하는 것으로 잘 알려져 있어, 노래방(가라오케) 제작이나 음악 프로덕션 같은 작업에 가장 많이 선택되는 모델 중 하나입니다.

MDX-23C

MDX-23C 모델은 고급 음악 디믹싱 작업을 위해 설계되었으며, 특히 음악을 네 개의 스템(bass, drums, vocals, other instruments)으로 분리하는 데 초점을 맞춥니다. 이 모델은 Demucs4와 MDX 신경망 아키텍처를 혼합한 기반 위에 만들어졌고, Ultimate Vocal Remover 프로젝트의 일부 가중치를 포함합니다. MDX-23C는 고품질 분리를 제공하며, 특히 강력한 GPU 환경에서 사용할 때 효과적이어서 정밀하고 전문가급 오디오 분리를 원하는 사용자에게 유력한 선택지입니다.

ReFormer

ReFormer는 음악 디믹싱 분야의 비교적 새로운 모델로, 음악 트랙의 스템을 분리하는 혁신적인 접근으로 알려져 있습니다. 전통적인 신호 처리 기법과 현대 딥러닝 방법을 결합해 깨끗하고 정확한 분리를 달성합니다. 이 모델은 품질과 처리 속도의 균형을 목표로 하며, 전문가와 취미 사용자 모두에게 적합합니다.

MDX-Net (with backing vocals)

MDX-Net은 음악 디믹싱을 위해 특별히 개발된 투 스트림 신경망으로, 시간-주파수 브랜치와 시간 도메인 브랜치를 모두 갖추고 있습니다. 이 아키텍처는 오디오의 서로 다른 측면을 분석해 스템을 분리할 수 있게 하며, 두 스트림의 출력을 결합해 매우 정확한 분리 결과를 생성합니다. MDX-Net은 국제 음악 디믹싱 챌린지에서 상위권을 차지하며 효과를 입증해 왔고, 오디오 처리에서 높은 정밀도가 필요한 사용자에게 신뢰할 수 있는 옵션입니다.