输入
| 参数 | 描述 | 数据类型 | 是否必填 | 范围 |
|---|---|---|---|---|
clip | 用于对输入文本进行分词和编码的 CLIP 模型。 | CLIP | 是 | 不适用 |
tags | 音频的描述性标签,例如流派、情绪或乐器。支持多行输入和动态提示。 | STRING | 是 | 不适用 |
lyrics | 音频轨道的歌词。支持多行输入和动态提示。 | STRING | 是 | 不适用 |
seed | 用于可重复生成的随机种子值。具有 control_after_generate 控件。默认值:0。 | INT | 否 | 0 到 18446744073709551615 |
bpm | 生成音频的每分钟节拍数 (BPM)。默认值:120。 | INT | 否 | 10 到 300 |
duration | 音频的期望时长(秒)。默认值:120.0。 | FLOAT | 否 | 0.0 到 2000.0 |
timesignature | 音乐拍号。 | COMBO | 否 | "2""3""4""6" |
language | 输入文本的语言。默认值:“en”。 | COMBO | 否 | "ar""az""bg""bn""ca""cs""da""de""el""en""es""fa""fi""fr""he""hi""hr""ht""hu""id""is""it""ja""ko""la""lt""ms""ne""nl""no""pa""pl""pt""ro""ru""sa""sk""sr""sv""sw""ta""te""th""tl""tr""uk""ur""vi""yue""zh""unknown" |
keyscale | 音乐调性和音阶(大调或小调)。 | COMBO | 否 | "C major""C minor""C# major""C# minor""Db major""Db minor""D major""D minor""D# major""D# minor""Eb major""Eb minor""E major""E minor""F major""F minor""F# major""F# minor""Gb major""Gb minor""G major""G minor""G# major""G# minor""Ab major""Ab minor""A major""A minor""A# major""A# minor""Bb major""Bb minor""B major""B minor" |
generate_audio_codes | 启用生成音频编码的 LLM。此过程可能较慢,但会提高生成音频的质量。如果您为模型提供音频参考,请关闭此选项。默认值:True。 | BOOLEAN | 否 | 不适用 |
cfg_scale | 无分类器引导比例。值越高,输出越严格遵循提示。默认值:2.0。 | FLOAT | 否 | 0.0 到 100.0 |
temperature | 采样温度。值越低,输出越具有确定性。默认值:0.85。 | FLOAT | 否 | 0.0 到 2.0 |
top_p | 核采样概率 (top-p)。默认值:0.9。 | FLOAT | 否 | 0.0 到 2000.0 |
top_k | 要考虑的最高概率 token 数量 (top-k)。默认值:0。 | INT | 否 | 0 到 100 |
min_p | token 采样的最小概率阈值 (min-p)。默认值:0.000。 | FLOAT | 否 | 0.0 到 1.0 |
输出
| 输出名称 | 描述 | 数据类型 |
|---|---|---|
CONDITIONING | conditioning 数据,包含为 AceStepAudio 1.5 模型编码的文本和音频参数。 | CONDITIONING |
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
Source fingerprint (SHA-256):
df70a55024812d8c77a3b618cbff6d3148a3f3f5fc4d17dd3c4282ce7f3cbc2c