音频生成
开始
从GUI开始
参考 生成3D模型 的开始部分。
###从CLI开始 音频生成分为两种工具,请根据需求选择:
| 需求 | 工具 | 说明 |
|---|---|---|
| 背景音乐(BGM)/ 环境音 / 循环音乐 | generate_audio_clip | 30–120 秒,WAV 格式 |
| 音效(SFX)/ 一次性短音 | generate_sound_effect | 1–22 秒,多种格式 |
异步流程(两者相同):
- 调用
generate_audio_clip/generate_sound_effect→ 返回task_id+ 占位音频路径 - 在场景中创建 AudioSource 并绑定占位音频 → 占位音频立即可预览
- 结束当前回合,等待
<bg_task_done>通知自动到达 - 收到通知后,占位音频被真实音频自动替换
常用模型
BGM / 环境音:火山 Music
- 适用场景: 背景音乐、循环配乐、环境氛围音
- 输出: WAV 文件,自动导入为 AudioClip
- 时长: 30–120 秒
- 关键参数:
prompt:音乐风格/氛围描述duration:时长(秒)enable_input_rewrite:是否让 AI 改进提示词play_on_awake:是否自动播放
SFX / 音效:SFX AI
- 适用场景: 枪声、脚步声、爆炸、UI 点击、物品拾取等一次性短音
- 输出: 音频文件,自动导入为 AudioClip
- 时长: 1–22 秒
- 关键参数:
prompt:音效描述(⚠️ 必须用英文)duration:时长(秒)prompt_influence:提示词影响力(0–1)output_format:mp3_44100_128/pcm_44100/opus_48000_128loop:是否可循环
优化
BGM 提示词优化
- 描述音乐风格和情绪:
"epic orchestral battle theme with heavy drums and brass">"battle music" - 指定乐器:
"piano and strings, melancholic"/"electronic synth with deep bass" - 启用
enable_input_rewrite:让 AI 自动优化你的提示词,效果通常更好
SFX 提示词优化
- ⚠️ 必须用英文:中文提示词无法正确生成
- 描述声音细节:
"sharp wooden door knock, three rapid knocks">"door knock" - 包含材质和动作:
"heavy metal sword slash through air, whoosh sound" - 调整
prompt_influence:0.3–0.5:AI 有更多创作自由,可能更自然0.7–1.0:更严格跟随提示词,适合精确需求
输出格式选择
- mp3_44100_128:体积小,BGM/SFX 通用
- pcm_44100:无损 WAV,音质最佳,体积大
- opus_48000_128:高压缩率,适合网络/移动端