Youka에서는 ‘모델 분할’ 기능을 사용하여 노래의 보컬과 악기를 분리할 수 있습니다. 두 가지 옵션이 있습니다:
- Demucs Demucs(음원을 위한 딥 추출기)는 음원 분리를 위한 최첨단 딥 러닝 모델입니다. 이 모델은 시간 영역에서 작동하여 오디오의 시간적 세부 사항을 보존하고 컨볼루션 신경망(CNN) 아키텍처를 사용합니다. Demucs는 보컬, 드럼, 베이스 및 기타 악기를 고품질로 분리하는 것으로 유명하여 노래방 제작 및 음악 제작과 같은 작업에 최고의 선택이 될 수 있습니다. 여러 버전을 통해 발전해 왔으며, 각 버전은 이전 버전보다 개선되었으며 신호 대 왜곡률(SDR) 벤치마크(GitHub)(QuadraphonicQuad)에서 강력한 성능을 인정받고 있습니다.
- MDX-23C MDX-23C 모델은 고급 음악 디믹싱 작업을 위해 설계되었으며, 특히 음악을 베이스, 드럼, 보컬 및 기타 악기의 네 가지 스템으로 분리하는 것을 목표로 합니다. 이 모델은 Demucs4와 MDX 신경망 아키텍처의 혼합을 기반으로 하며 Ultimate Vocal Remover 프로젝트의 특정 가중치를 통합합니다. MDX-23C는 고품질 분리를 제공하며 강력한 GPU 설정과 함께 사용할 때 특히 효과적이므로 정밀하고 전문가 수준의 오디오 분리를 원하는 사용자에게 강력한 선택입니다(GitHub)(QuadraphonicQuad).
- 리포머 리포머는 음악 트랙의 스템을 분리하는 혁신적인 접근 방식으로 잘 알려진 음악 디믹싱 분야의 비교적 새로운 업체입니다. ReFormer에 대한 자세한 정보는 널리 알려지지 않았지만, 기존의 신호 처리 기술과 최신 딥 러닝 방법을 결합하여 깨끗하고 정확한 분리를 달성하는 것으로 유명합니다. 이 모델은 품질과 처리 속도의 균형을 맞추는 것을 목표로 하므로 전문가와 취미 사용자 모두에게 적합합니다.
- MDX-Net (백 보컬 포함) MDX-Net은 음악 디믹싱을 위해 특별히 개발된 2스트림 신경망으로, 시간-주파수 분기와 시간-도메인 분기를 모두 갖추고 있습니다. 이 아키텍처를 통해 모델은 오디오의 다양한 측면을 분석하여 스템을 분리하고 두 스트림의 출력을 결합하여 매우 정확한 분리를 생성할 수 있습니다. MDX-Net은 국제 음악 디믹싱 챌린지에서 상위권을 차지하며 그 효과를 입증한 바 있으며, 오디오 처리에서 높은 정밀도를 필요로 하는 사용자에게 신뢰할 수 있는 옵션이 되고있습니다(GitHub).