Modelo de sincronización
Elige el mejor modelo de sincronización de letras
Youka ofrece diferentes métodos para ajustar las letras a la música en tus pistas de karaoke, conocidos como modelos de sincronización. Hay dos tipos principales: transcripción y alineación.
Tipos de modelos
-
Los modelos de transcripción escuchan la canción e intentan escribir la letra como lo haría una persona, usando tecnología similar al reconocimiento de voz. Sin embargo, es posible que las palabras que transcriben no sean completamente precisas.
-
Los modelos de alineación requieren que proporciones la letra. Luego intentan hacer coincidir esa letra con la canción. Si la letra que proporcionas no coincide exactamente con la canción (por ejemplo, si falta un estribillo), el tiempo puede quedar un poco desajustado en algunas partes.
Modelos disponibles
AudioShakeAI (Transcription)
Esta es la opción principal y funciona escribiendo primero la letra y luego ajustándola a la música. Solo está disponible si eres un usuario de Pay-Per-Use o si estás usando una prueba, y puede tardar hasta 10 minutos en completarse.
AudioShakeAI (Alignment)
Esta es la siguiente opción y ajusta a la música la letra que proporcionas. Si hay errores en la letra, es posible que la sincronización no sea perfecta. También tarda hasta 5 minutos.
Wav2Vec2 (Alignment)
Esta es la tercera opción y funciona como AudioShakeAI, pero es compatible con casi todos los idiomas. Es más rápido y normalmente termina en hasta 30 segundos.
Whisper (Transcription)
Esta es la cuarta opción y también escucha la música para transcribir la letra antes de sincronizarla. Puede que la letra no sea totalmente exacta, pero la sincronización debería ser decente y puede tardar hasta 2 minutos en completarse.