Gemini 2.5 Flash Lite - OpenAI SDK - 完整参数文档
- 使用 OpenAI SDK 格式调用 Gemini-2.5-flash-lite 模型
- 同步处理模式,实时返回对话内容
- 纯文本对话:单轮或多轮上下文对话,可参考示例代码中simple_text、multi_turn示例
- 系统提示词:自定义 AI 的角色和行为,可参考示例代码中system_prompt示例
- 多模态输入:支持文本 + 图像混合输入,可参考示例代码中vision、multi_image示例
授权
##所有接口均需要使用Bearer Token进行认证## **获取 API Key:** 访问 [API Key 管理页面](https://starmagic.ai/app/api-keys) 获取您的 API Key **使用时在请求头中添加:** ``` Authorization: Bearer YOUR_API_KEY ```
Authorization: Bearer YOUR_API_KEY请求体
application/json对话模型名称
"gemini-2.5-flash-lite"对话消息列表,支持多轮对话和多模态输入
[
{
"role": "user",
"content": null,
"tool_call_id": "string"
}
]是否以流式方式返回响应 - `true`: 流式返回,逐块实时返回内容 - `false`: 等待完整响应后一次性返回
false生成回复的最大 completion token 数量,对应 Gemini 的 maxOutputTokens。
2000生成回复的最大 token 数量,兼容旧版 OpenAI 参数。
2000采样温度,控制输出的随机性 **说明**: - 较低值(如 0.2): 更确定、更聚焦的输出 - 较高值(如 1.5): 更随机、更有创意的输出
0.7核采样(Nucleus Sampling)参数 **说明**: - 控制从累积概率前多少的token中采样 - 例如 0.9 表示从累积概率达到90%的token中选择 - 默认值: 1.0(考虑所有token) **建议**: 不要同时调整 temperature 和 top_p
0.9重复 token 惩罚系数,范围 -2 到 2,对应 Gemini 的 frequencyPenalty。
0已出现 token 惩罚系数,范围 -2 到 2,对应 Gemini 的 presencePenalty。
0停止序列,支持字符串或字符串数组,对应 Gemini 的 stopSequences。
生成候选数量
1限制思考工作量。Gemini 2.5 Flash 和 Flash Lite 支持 none 以关闭思考,low/medium/high 对应不同的思考预算。
"medium"用于尽可能复现输出的随机种子,对应 Gemini 的 seed。
12345是否返回 token 的 logprob 信息,对应 Gemini 的 responseLogprobs。
true每个 token 返回的 top logprob 数量,对应 Gemini 的 logprobs。
5响应格式设置,支持 JSON mode 与 JSON Schema,对应 Gemini 的 responseMimeType、responseSchema 和 responseJsonSchema。
流式响应的选项。当 stream 为 true 时,可设置此字段
{
"include_usage": true
}工具定义列表,用于 Function Calling
[
{
"type": "function",
"function": {
"name": "string",
"description": "string",
"parameters": {}
}
}
]控制工具调用行为
Gemini 扩展参数
{
"google": {
"cached_content": "string",
"thinking_config": {}
}
}响应
application/json响应体
对话完成的唯一标识符
"chatcmpl-20251010015944503180122WJNB8Eid"实际使用的模型名称
"gemini-2.5-flash-lite"响应类型
"chat.completion"创建时间戳
1760032810对话生成的选择列表
[
{
"index": 0,
"message": {
"role": "assistant",
"content": "你好!很高兴能向你介绍自己。\n\n我是一个大型语言模型(Large Language Model),由 Google 训练和开发。\n\n简单来说,你可以把我理解为一个经过海量文本数据训练、能够理解和生成人类语言的\"智能大脑\"。我的核心能力是处理和生成文本,具体来说,我能做以下这些事情:\n\n**1. 信息查询与知识解答**\n我可以像一部\"会说话的百科全书\",为你解答各种问题,无论是科学知识、历史事件,还是生活常识。\n\n**2. 创意写作与文本生成**\n我可以根据你的要求,创作各种类型的文本,比如:\n* **写作**:诗歌、故事、剧本、邮件、演讲稿、广告文案等。\n* **规划**:为你制定旅行计划、学习大纲、活动方案等。\n* **头脑风暴**:和你一起碰撞想法,激发新的创意。\n\n**3. 翻译与语言处理**\n我精通多种语言,可以为你提供快速、流畅的翻译服务。同时,我也可以帮你润色、校对、总结或改写文本,让你的表达更清晰、更专业。\n\n**4. 编程与代码辅助**\n我可以编写代码片段、解释代码逻辑、调试错误,或者将代码从一种编程语言\"翻译\"成另一种,是程序员的好帮手。\n\n**5. 逻辑分析与推理**\n我可以帮助你分析复杂的问题,梳理逻辑链条,并根据你提供的信息进行推理和总结。\n\n---\n\n**总而言之**,我的目标是成为一个强大而有用的工具,通过自然语言交流的方式,帮助你更高效地获取信息、完成任务和激发创意。\n\n**需要记住的是:** 我是一个人工智能,我的知识来源于我所学习的数据,并且可能不是最新的。有时我也可能会犯错,所以对于非常重要的信息,建议你进行再次核实。",
"tool_calls": [
null
]
},
"logprobs": {
"content": [
{
"token": null,
"logprob": null,
"bytes": null,
"top_logprobs": null
}
]
},
"finish_reason": "stop"
}
]Token 使用统计信息
{
"prompt_tokens": 13,
"completion_tokens": 1891,
"total_tokens": 1904,
"prompt_tokens_details": {
"cached_tokens": 0,
"text_tokens": 13,
"audio_tokens": 0,
"image_tokens": 0
},
"completion_tokens_details": {
"text_tokens": 0,
"audio_tokens": 0,
"reasoning_tokens": 1480
},
"input_tokens": 0,
"output_tokens": 0,
"input_tokens_details": null
}
