所有文档
设置

同步模型

选择最佳的歌词同步模型

Youka 提供多种将歌词与卡拉 OK 音轨中的音乐进行匹配的方法,称为同步模型(sync models)。主要有两种类型:转录和对齐。

模型类型

  • 转录模型会聆听歌曲,并像人一样尝试把歌词写下来,使用的技术类似语音识别。不过,它们写下来的文字可能并不完全准确。

  • 对齐模型需要你提供歌词。然后它们会尝试将这些歌词与歌曲进行匹配。如果你提供的歌词与歌曲内容不完全一致(例如少了某段副歌),部分片段的时间点可能会有些偏差。

可用模型

AudioShakeAI(转录)

这是首选方案:先将歌词转录出来,然后再与音乐进行匹配。仅在你是按次付费(Pay-Per-Use)用户或使用试用时可用,并且可能需要最多 10 分钟完成。

AudioShakeAI(对齐)

这是第二选择,会将你提供的歌词与音乐进行匹配。如果歌词中有错误,同步的时间点可能不够精确。完成时间最多 5 分钟。

Wav2Vec2(对齐)

这是第三选择,工作方式类似 AudioShakeAI,但几乎支持所有语言。速度更快,通常最多 30 秒完成。

Whisper(转录)

这是第四选择,也会先聆听音乐并转录歌词,然后再进行同步。歌词可能不够精准,但时间点通常还不错,最多 2 分钟完成。