Todos os Docs
Configurações

Modelo de Sincronização

Escolha o melhor modelo de sincronização de letras

O Youka oferece diferentes métodos para combinar a letra com a música nas suas faixas de karaokê, conhecidos como modelos de sincronização. Existem dois tipos principais: transcrição e alinhamento.

Tipos de Modelo

  • Modelos de transcrição escutam a música e tentam escrever a letra como uma pessoa faria, usando tecnologia semelhante ao reconhecimento de voz. No entanto, as palavras que eles transcrevem podem não ser totalmente precisas.

  • Modelos de alinhamento exigem que você forneça a letra. Em seguida, eles tentam combinar essa letra com a música. Se a letra fornecida não corresponder exatamente à música (por exemplo, se estiver faltando um refrão), a marcação de tempo pode ficar um pouco incorreta em algumas partes.

Modelos Disponíveis

AudioShakeAI (Transcription)

Esta é a melhor opção e funciona primeiro transcrevendo a letra e depois sincronizando-a com a música. Ela só está disponível se você for um usuário Pay-Per-Use ou estiver usando um teste, e pode levar até 10 minutos para concluir.

AudioShakeAI (Alignment)

Esta é a opção seguinte e sincroniza a letra que você fornecer com a música. Se houver erros na letra, a marcação de tempo pode não ficar perfeita. Também pode levar até 5 minutos.

Wav2Vec2 (Alignment)

Esta é a terceira opção e funciona como o AudioShakeAI, mas oferece suporte a quase todos os idiomas. É mais rápido, normalmente concluindo em até 30 segundos.

Whisper (Transcription)

Esta é a quarta opção e também escuta a música para transcrever a letra antes de sincronizá-la. A letra pode não ficar totalmente exata, mas a sincronização deve ser boa, levando até 2 minutos para concluir.