添加人声生成音乐

curl --request POST \
  --url https://api.kie.ai/api/v1/generate/add-vocals \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "prompt": "A calm and relaxing piano track.",
  "title": "Relaxing Piano",
  "negativeTags": "重金属, 强节奏鼓点",
  "style": "Jazz",
  "uploadUrl": "https://example.com/music.mp3",
  "callBackUrl": "https://example.com/callback",
  "model": "V4_5PLUS",
  "vocalGender": "m",
  "styleWeight": 0.61,
  "weirdnessConstraint": 0.72,
  "audioWeight": 0.65
}
'

{
  "code": 200,
  "msg": "success",
  "data": {
    "taskId": "5c79****be8e"
  }
}

POST

api

generate

add-vocals

添加人声生成音乐

curl --request POST \
  --url https://api.kie.ai/api/v1/generate/add-vocals \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "prompt": "A calm and relaxing piano track.",
  "title": "Relaxing Piano",
  "negativeTags": "重金属, 强节奏鼓点",
  "style": "Jazz",
  "uploadUrl": "https://example.com/music.mp3",
  "callBackUrl": "https://example.com/callback",
  "model": "V4_5PLUS",
  "vocalGender": "m",
  "styleWeight": 0.61,
  "weirdnessConstraint": 0.72,
  "audioWeight": 0.65
}
'

{
  "code": 200,
  "msg": "success",
  "data": {
    "taskId": "5c79****be8e"
  }
}

核心功能

通过uploadUrl接受现有器乐音轨，支持基于提示词的风格输入。
支持控制参数包括：
- prompt、style、model、tags、negativeTags（定义歌词内容和人声风格）
- vocalGender、styleWeight、weirdnessConstraint、audioWeight、callBackUrl。
返回taskId，支持与器乐端点相同的14天保留期和三阶段回调模型。

典型使用场景

音乐平台或工具，支持topline创作和歌词创意的快速原型制作。
协作作曲或共创工作流程，在器乐草稿上迭代测试歌词或人声风格。

参数详情

uploadUrl 指定要处理的音频文件URL
prompt 定义歌词内容和演唱方式
style 和 negativeTags 用于控制音乐和人声风格
model 用于指定生成的AI模型版本
negativeTags 用于排除不需要的元素
支持多种可选参数来精细调节生成效果

开发者注意事项

生成的文件将保留14天
回调过程分三个阶段：text（文本生成）、first（第一首完成）、complete（全部完成）

授权

Authorization

string

header

必填

所有接口都需要通过 Bearer Token 方式进行认证。

获取 API Key:

访问 API Key 管理页面获取您的 API Key

使用方式: 在请求头中添加： Authorization: Bearer YOUR_API_KEY

注意事项：

请妥善保管您的 API Key，不要泄露给他人
如果怀疑 API Key 泄露，请立即在管理页面重置

请求体

application/json

prompt

string

必填

生成音频的提示词。通常是描述音频内容的文本，用于指导人声演唱的内容和风格。

示例:

"A calm and relaxing piano track."

title

string

必填

音乐的标题。将显示在播放器界面和文件名中。

示例:

"Relaxing Piano"

negativeTags

string

必填

排除的音乐风格。用于避免在生成的音乐中包含特定的风格或元素。

示例:

"重金属, 强节奏鼓点"

style

string

必填

音乐的风格。如爵士、电子、古典等音乐类型。

示例:

"Jazz"

uploadUrl

string<uri>

必填

上传的音频文件URL。指定要为其添加人声的源音频文件位置。

示例:

"https://example.com/music.mp3"

callBackUrl

string<uri>

必填

用于接收人声生成任务完成更新的URL地址。所有人声生成请求都需要此参数。

系统将在人声生成完成时向此URL发送POST请求，包含任务状态和结果
回调过程有三个阶段：text（文本生成）、first（第一首完成）、complete（全部完成）
您的回调端点应能接受包含音乐生成结果的JSON载荷的POST请求
或者，您也可以使用获取音乐详情接口来轮询任务状态
为确保回调安全性，请参阅 Webhook 校验指南了解签名验证实现方法

示例:

"https://example.com/callback"

model

enum<string>

默认值:V4_5PLUS

用于生成的AI模型版本。

可用选项：
- V5：更卓越的音乐表现力，生成速度更快。
- V4_5PLUS：V4.5+ 音色更丰富，新的创作方式。

可用选项:

V4_5PLUS,

V5

示例:

"V4_5PLUS"

vocalGender

enum<string>

人声性别偏好。可选。'm' 表示男声，'f' 表示女声。根据实践，此参数只能加强概率，但不能保证一定遵循男女声的指令。

可用选项:

m,

f

示例:

"m"

styleWeight

number

对指定风格的遵循强度。可选。范围 0–1，保留两位小数。

必填范围: 0 <= x <= 1必须是以下数值的倍数 0.01

示例:

0.61

weirdnessConstraint

number

控制实验性/创意偏离程度。可选。范围 0–1，保留两位小数。

必填范围: 0 <= x <= 1必须是以下数值的倍数 0.01

示例:

0.72

audioWeight

number

音频要素相对权重。可选。范围 0–1，保留两位小数。

必填范围: 0 <= x <= 1必须是以下数值的倍数 0.01

示例:

0.65

响应

请求成功

code

enum<integer>

响应状态码

200: 成功 - 请求已成功处理
401: 未授权 - 身份验证凭据缺失或无效
402: 积分不足 - 账户没有足够的积分执行此操作
404: 未找到 - 请求的资源或端点不存在
409: 冲突 - WAV记录已存在
422: 验证错误 - 请求参数未通过验证检查
429: 超出限制 - 已超过对此资源的请求限制
451: 未授权 - 获取图像失败。请验证您或您的服务提供商设置的任何访问限制。
455: 服务不可用 - 系统当前正在进行维护
500: 服务器错误 - 处理请求时发生意外错误

可用选项:

200,

401,

402,

404,

409,

422,

429,

451,

455,

500

msg

string

当 code != 200 时的错误信息

示例:

"success"

data

object

显示子属性

添加伴奏回调添加人声回调

Lyrics Generation

WAV Conversion

Vocal Removal

Music Video Generation

添加人声生成音乐

核心功能

典型使用场景

参数详情

开发者注意事项

授权

请求体

响应

Lyrics Generation

WAV Conversion

Vocal Removal

Music Video Generation

​核心功能

​典型使用场景

​参数详情

​开发者注意事项

授权

请求体

响应

核心功能

典型使用场景

参数详情

开发者注意事项