跳到主要内容

音频生成

开始

从GUI开始

参考 生成3D模型 的开始部分。

###从CLI开始 音频生成分为两种工具,请根据需求选择:

需求工具说明
背景音乐(BGM)/ 环境音 / 循环音乐generate_audio_clip30–120 秒,WAV 格式
音效(SFX)/ 一次性短音generate_sound_effect1–22 秒,多种格式

异步流程(两者相同):

  1. 调用 generate_audio_clip / generate_sound_effect → 返回 task_id + 占位音频路径
  2. 在场景中创建 AudioSource 并绑定占位音频 → 占位音频立即可预览
  3. 结束当前回合,等待 <bg_task_done> 通知自动到达
  4. 收到通知后,占位音频被真实音频自动替换

常用模型

BGM / 环境音:火山 Music

  • 适用场景: 背景音乐、循环配乐、环境氛围音
  • 输出: WAV 文件,自动导入为 AudioClip
  • 时长: 30–120 秒
  • 关键参数:
    • prompt:音乐风格/氛围描述
    • duration:时长(秒)
    • enable_input_rewrite:是否让 AI 改进提示词
    • play_on_awake:是否自动播放

SFX / 音效:SFX AI

  • 适用场景: 枪声、脚步声、爆炸、UI 点击、物品拾取等一次性短音
  • 输出: 音频文件,自动导入为 AudioClip
  • 时长: 1–22 秒
  • 关键参数:
    • prompt:音效描述(⚠️ 必须用英文
    • duration:时长(秒)
    • prompt_influence:提示词影响力(0–1)
    • output_formatmp3_44100_128 / pcm_44100 / opus_48000_128
    • loop:是否可循环

优化

BGM 提示词优化

  • 描述音乐风格和情绪"epic orchestral battle theme with heavy drums and brass" > "battle music"
  • 指定乐器"piano and strings, melancholic" / "electronic synth with deep bass"
  • 启用 enable_input_rewrite:让 AI 自动优化你的提示词,效果通常更好

SFX 提示词优化

  • ⚠️ 必须用英文:中文提示词无法正确生成
  • 描述声音细节"sharp wooden door knock, three rapid knocks" > "door knock"
  • 包含材质和动作"heavy metal sword slash through air, whoosh sound"
  • 调整 prompt_influence
    • 0.3–0.5:AI 有更多创作自由,可能更自然
    • 0.7–1.0:更严格跟随提示词,适合精确需求

输出格式选择

  • mp3_44100_128:体积小,BGM/SFX 通用
  • pcm_44100:无损 WAV,音质最佳,体积大
  • opus_48000_128:高压缩率,适合网络/移动端

并行生成

  • 最大 5 个并发任务

注意事项

  • ⚠️ SFX 提示词必须用英文,中文提示词会生成错误结果;如用户用中文描述,需先翻译为英文
  • ⚠️ BGM ≠ SFX:循环配乐用 generate_audio_clip,一次性短音用 generate_sound_effect,不要混用
  • ⚠️ 生成耗时 60–180 秒,工具调用立即返回,禁止轮询
  • ⚠️ AudioSource 配置:BGM 通常 loop: true + play_on_awake: true;SFX 通常 loop: false + play_on_awake: false
  • ⚠️ 输出路径:默认 Assets/TJGenerators/History/
  • ⚠️ Domain Reload:生成期间不要在磁盘写入 .cs 文件