跳到主要内容

音频生成

开始

从GUI开始

参考生成3D模型的开始部分。

###从CLI开始音频生成分为两种工具，请根据需求选择：

需求	工具	说明
背景音乐（BGM）/ 环境音 / 循环音乐	`generate_audio_clip`	30–120 秒，WAV 格式
音效（SFX）/ 一次性短音	`generate_sound_effect`	1–22 秒，多种格式

异步流程（两者相同）：

调用 generate_audio_clip / generate_sound_effect → 返回 task_id + 占位音频路径
在场景中创建 AudioSource 并绑定占位音频 → 占位音频立即可预览
结束当前回合，等待 <bg_task_done> 通知自动到达
收到通知后，占位音频被真实音频自动替换

常用模型

BGM / 环境音：火山 Music

适用场景： 背景音乐、循环配乐、环境氛围音
输出： WAV 文件，自动导入为 AudioClip
时长： 30–120 秒
关键参数：
- prompt：音乐风格/氛围描述
- duration：时长（秒）
- enable_input_rewrite：是否让 AI 改进提示词
- play_on_awake：是否自动播放

SFX / 音效：SFX AI

适用场景： 枪声、脚步声、爆炸、UI 点击、物品拾取等一次性短音
输出： 音频文件，自动导入为 AudioClip
时长： 1–22 秒
关键参数：
- prompt：音效描述（⚠️ 必须用英文）
- duration：时长（秒）
- prompt_influence：提示词影响力（0–1）
- output_format：mp3_44100_128 / pcm_44100 / opus_48000_128
- loop：是否可循环

优化

BGM 提示词优化

描述音乐风格和情绪："epic orchestral battle theme with heavy drums and brass" > "battle music"
指定乐器："piano and strings, melancholic" / "electronic synth with deep bass"
启用 enable_input_rewrite：让 AI 自动优化你的提示词，效果通常更好

SFX 提示词优化

⚠️ 必须用英文：中文提示词无法正确生成
描述声音细节："sharp wooden door knock, three rapid knocks" > "door knock"
包含材质和动作："heavy metal sword slash through air, whoosh sound"
调整 prompt_influence：
- 0.3–0.5：AI 有更多创作自由，可能更自然
- 0.7–1.0：更严格跟随提示词，适合精确需求

输出格式选择

mp3_44100_128：体积小，BGM/SFX 通用
pcm_44100：无损 WAV，音质最佳，体积大
opus_48000_128：高压缩率，适合网络/移动端

并行生成

最大 5 个并发任务

注意事项

⚠️ SFX 提示词必须用英文，中文提示词会生成错误结果；如用户用中文描述，需先翻译为英文
⚠️ BGM ≠ SFX：循环配乐用 generate_audio_clip，一次性短音用 generate_sound_effect，不要混用
⚠️ 生成耗时 60–180 秒，工具调用立即返回，禁止轮询
⚠️ AudioSource 配置：BGM 通常 loop: true + play_on_awake: true；SFX 通常 loop: false + play_on_awake: false
⚠️ 输出路径：默认 Assets/TJGenerators/History/
⚠️ Domain Reload：生成期间不要在磁盘写入 .cs 文件

开始
- 从GUI开始
常用模型
- BGM / 环境音：火山 Music
- SFX / 音效：SFX AI
优化
注意事项