设置
同步模型
选择最佳的歌词同步模型
Youka 提供多种将歌词与卡拉 OK 音轨中的音乐进行匹配的方法,称为同步模型(sync models)。主要有两种类型:转录和对齐。
模型类型
-
转录模型会聆听歌曲,并像人一样尝试把歌词写下来,使用的技术类似语音识别。不过,它们写下来的文字可能并不完全准确。
-
对齐模型需要你提供歌词。然后它们会尝试将这些歌词与歌曲进行匹配。如果你提供的歌词与歌曲内容不完全一致(例如少了某段副歌),部分片段的时间点可能会有些偏差。
可用模型
AudioShakeAI(转录)
这是首选方案:先将歌词转录出来,然后再与音乐进行匹配。仅在你是按次付费(Pay-Per-Use)用户或使用试用时可用,并且可能需要最多 10 分钟完成。
AudioShakeAI(对齐)
这是第二选择,会将你提供的歌词与音乐进行匹配。如果歌词中有错误,同步的时间点可能不够精确。完成时间最多 5 分钟。
Wav2Vec2(对齐)
这是第三选择,工作方式类似 AudioShakeAI,但几乎支持所有语言。速度更快,通常最多 30 秒完成。
Whisper(转录)
这是第四选择,也会先聆听音乐并转录歌词,然后再进行同步。歌词可能不够精准,但时间点通常还不错,最多 2 分钟完成。