Gemini 3.1 Pro 是 Google DeepMind 的旗舰多模态模型,具备强大的推理能力,可流畅理解文本、图像、视频与音频,并支持大规模长上下文处理。
stream: true 时,API 将以服务器发送事件(SSE)的形式返回响应,Content-Type 为 text/event-stream。这允许渐进式响应交付,消息增量会在生成时逐步发送。每个事件包含部分消息内容,使您能够在应用程序中实时显示响应。
流式响应格式:
text/event-streamdata: 开头,后跟 JSONfinish_reason 指示完成tools 参数启用 Google 搜索增强,实现实时信息检索:
所有 API 都需要通过 Bearer Token 进行身份验证。
获取 API Key:
使用方法: 添加到请求头: Authorization: Bearer YOUR_API_KEY
注意:
消息对象数组。每个消息都有一个角色和内容。
统一媒体文件格式:
在 content 数组中,无论是图像、视频、音频还是其他文档类型,所有媒体文件都使用相同的格式结构:
type 字段始终为 "image_url"image_url 字段名称保持不变url 值,它指向相应的媒体文件地址例如:图像、视频、音频、PDF 和其他文档都使用相同的 { type: 'image_url', image_url: { url: '...' } } 结构。
1如果设置为 true,将作为服务器发送事件发送部分消息增量。默认为 true。
可选,模型可调用的工具数组。启用 Google 搜索增强时使用:[{"type": "function", "function": {"name": "googleSearch"}}] - 通过 Google 搜索实现实时信息检索。当需要最新资讯、新闻或时事信息时,请在请求中包含此工具。
是否包含思考过程。如果设置为 true,思考将会被包含在响应结果中,否则将不会出现在响应结果中。默认为 true。
推理的力度。低力度响应更快,高力度响应更慢但解决更复杂的问题。默认为 "high"。
low, high