文本系列GeminiGemini.2.5.Flash.LiteOpenai.Sdk

Gemini 2.5 Flash Lite - OpenAI SDK - 完整参数文档

使用 OpenAI SDK 格式调用 Gemini-2.5-flash-lite 模型

同步处理模式，实时返回对话内容
纯文本对话：单轮或多轮上下文对话，可参考示例代码中simple_text、multi_turn示例
系统提示词：自定义 AI 的角色和行为，可参考示例代码中system_prompt示例
多模态输入：支持文本 + 图像混合输入，可参考示例代码中vision、multi_image示例

<Note> **BaseURL 说明**：默认 BaseURL 为 `https://api.starmagic.ai`，对文本模型支持更好，支持长连接；`https://api.starmagic.ai` 是多模态主力地址，对文本模型作为备用地址使用。 </Note>

授权

Authorizationstringheader必填

##所有接口均需要使用Bearer Token进行认证## **获取 API Key：** 访问 [API Key 管理页面](https://starmagic.ai/app/api-keys) 获取您的 API Key **使用时在请求头中添加：** ``` Authorization: Bearer YOUR_API_KEY ```

Authorization: Bearer YOUR_API_KEY

请求体

application/json

modelenum<gemini-2.5-flash-lite>必填

对话模型名称

"gemini-2.5-flash-lite"

messagesobject[]必填

对话消息列表，支持多轮对话和多模态输入

[
  {
    "role": "user",
    "content": null,
    "tool_call_id": "string"
  }
]

streamboolean

是否以流式方式返回响应 - `true`: 流式返回，逐块实时返回内容 - `false`: 等待完整响应后一次性返回

false

max_completion_tokensinteger

生成回复的最大 completion token 数量，对应 Gemini 的 maxOutputTokens。

max_tokensinteger

生成回复的最大 token 数量，兼容旧版 OpenAI 参数。

temperaturenumber

采样温度，控制输出的随机性 **说明**: - 较低值(如 0.2): 更确定、更聚焦的输出 - 较高值(如 1.5): 更随机、更有创意的输出

0.7

top_pnumber

核采样(Nucleus Sampling)参数 **说明**: - 控制从累积概率前多少的token中采样 - 例如 0.9 表示从累积概率达到90%的token中选择 - 默认值: 1.0（考虑所有token） **建议**: 不要同时调整 temperature 和 top_p

0.9

frequency_penaltynumber

重复 token 惩罚系数，范围 -2 到 2，对应 Gemini 的 frequencyPenalty。

presence_penaltynumber

已出现 token 惩罚系数，范围 -2 到 2，对应 Gemini 的 presencePenalty。

stopobject

停止序列，支持字符串或字符串数组，对应 Gemini 的 stopSequences。

ninteger

生成候选数量

reasoning_effortenum<none | low | medium | high>

限制思考工作量。Gemini 2.5 Flash 和 Flash Lite 支持 none 以关闭思考，low/medium/high 对应不同的思考预算。

"medium"

seedinteger

用于尽可能复现输出的随机种子，对应 Gemini 的 seed。

logprobsboolean

是否返回 token 的 logprob 信息，对应 Gemini 的 responseLogprobs。

true

top_logprobsinteger

每个 token 返回的 top logprob 数量，对应 Gemini 的 logprobs。

response_formatobject

响应格式设置，支持 JSON mode 与 JSON Schema，对应 Gemini 的 responseMimeType、responseSchema 和 responseJsonSchema。

stream_optionsobject

流式响应的选项。当 stream 为 true 时，可设置此字段

{
  "include_usage": true
}

toolsobject[]

工具定义列表，用于 Function Calling

[
  {
    "type": "function",
    "function": {
      "name": "string",
      "description": "string",
      "parameters": {}
    }
  }
]

tool_choiceobject

控制工具调用行为

extra_bodyobject

Gemini 扩展参数

{
  "google": {
    "cached_content": "string",
    "thinking_config": {}
  }
}

响应

application/json

成功

响应体

idstring

对话完成的唯一标识符

"chatcmpl-20251010015944503180122WJNB8Eid"

modelstring

实际使用的模型名称

"gemini-2.5-flash-lite"

objectenum<chat.completion>

响应类型

"chat.completion"

createdinteger

创建时间戳

1760032810

choicesobject[]

对话生成的选择列表

[
  {
    "index": 0,
    "message": {
      "role": "assistant",
      "content": "你好！很高兴能向你介绍自己。\n\n我是一个大型语言模型（Large Language Model），由 Google 训练和开发。\n\n简单来说，你可以把我理解为一个经过海量文本数据训练、能够理解和生成人类语言的\"智能大脑\"。我的核心能力是处理和生成文本，具体来说，我能做以下这些事情：\n\n**1. 信息查询与知识解答**\n我可以像一部\"会说话的百科全书\"，为你解答各种问题，无论是科学知识、历史事件，还是生活常识。\n\n**2. 创意写作与文本生成**\n我可以根据你的要求，创作各种类型的文本，比如：\n*   **写作**：诗歌、故事、剧本、邮件、演讲稿、广告文案等。\n*   **规划**：为你制定旅行计划、学习大纲、活动方案等。\n*   **头脑风暴**：和你一起碰撞想法，激发新的创意。\n\n**3. 翻译与语言处理**\n我精通多种语言，可以为你提供快速、流畅的翻译服务。同时，我也可以帮你润色、校对、总结或改写文本，让你的表达更清晰、更专业。\n\n**4. 编程与代码辅助**\n我可以编写代码片段、解释代码逻辑、调试错误，或者将代码从一种编程语言\"翻译\"成另一种，是程序员的好帮手。\n\n**5. 逻辑分析与推理**\n我可以帮助你分析复杂的问题，梳理逻辑链条，并根据你提供的信息进行推理和总结。\n\n---\n\n**总而言之**，我的目标是成为一个强大而有用的工具，通过自然语言交流的方式，帮助你更高效地获取信息、完成任务和激发创意。\n\n**需要记住的是：** 我是一个人工智能，我的知识来源于我所学习的数据，并且可能不是最新的。有时我也可能会犯错，所以对于非常重要的信息，建议你进行再次核实。",
      "tool_calls": [
        null
      ]
    },
    "logprobs": {
      "content": [
        {
          "token": null,
          "logprob": null,
          "bytes": null,
          "top_logprobs": null
        }
      ]
    },
    "finish_reason": "stop"
  }
]

usageobject

Token 使用统计信息

{
  "prompt_tokens": 13,
  "completion_tokens": 1891,
  "total_tokens": 1904,
  "prompt_tokens_details": {
    "cached_tokens": 0,
    "text_tokens": 13,
    "audio_tokens": 0,
    "image_tokens": 0
  },
  "completion_tokens_details": {
    "text_tokens": 0,
    "audio_tokens": 0,
    "reasoning_tokens": 1480
  },
  "input_tokens": 0,
  "output_tokens": 0,
  "input_tokens_details": null
}

POST/v1/chat/completions

curl --request POST \
  --url https://api.starmagic.ai/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
  "model": "gemini-2.5-flash-lite",
  "messages": [
    {
      "role": "user",
      "content": "请介绍一下你自己"
    }
  ]
}'

响应: 成功

{
  "id": "chatcmpl-20251010015944503180122WJNB8Eid",
  "model": "gemini-2.5-flash-lite",
  "object": "chat.completion",
  "created": 1760032810,
  "choices": [
    {
      "index": 0,
      "message": {
        "role": null,
        "content": null,
        "tool_calls": null
      },
      "logprobs": {
        "content": [
          null
        ]
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 13,
    "completion_tokens": 1891,
    "total_tokens": 1904,
    "prompt_tokens_details": {
      "cached_tokens": 0,
      "text_tokens": 13,
      "audio_tokens": 0,
      "image_tokens": 0
    },
    "completion_tokens_details": {
      "text_tokens": 0,
      "audio_tokens": 0,
      "reasoning_tokens": 1480
    },
    "input_tokens": 0,
    "output_tokens": 0,
    "input_tokens_details": null
  }
}

Gemini 2.5 Flash Lite - OpenAI SDK - 完整参数文档

使用 OpenAI SDK 格式调用 Gemini-2.5-flash-lite 模型

同步处理模式，实时返回对话内容

纯文本对话：单轮或多轮上下文对话，可参考示例代码中simple_text、multi_turn示例

系统提示词：自定义 AI 的角色和行为，可参考示例代码中system_prompt示例

多模态输入：支持文本 + 图像混合输入，可参考示例代码中vision、multi_image示例

[ { "index": 0, "message": { "role": "assistant", "content": "你好！很高兴能向你介绍自己。\n\n我是一个大型语言模型（Large Language Model），由 Google 训练和开发。\n\n简单来说，你可以把我理解为一个经过海量文本数据训练、能够理解和生成人类语言的\"智能大脑\"。我的核心能力是处理和生成文本，具体来说，我能做以下这些事情：\n\n**1. 信息查询与知识解答**\n我可以像一部\"会说话的百科全书\"，为你解答各种问题，无论是科学知识、历史事件，还是生活常识。\n\n**2. 创意写作与文本生成**\n我可以根据你的要求，创作各种类型的文本，比如：\n* **写作**：诗歌、故事、剧本、邮件、演讲稿、广告文案等。\n* **规划**：为你制定旅行计划、学习大纲、活动方案等。\n* **头脑风暴**：和你一起碰撞想法，激发新的创意。\n\n**3. 翻译与语言处理**\n我精通多种语言，可以为你提供快速、流畅的翻译服务。同时，我也可以帮你润色、校对、总结或改写文本，让你的表达更清晰、更专业。\n\n**4. 编程与代码辅助**\n我可以编写代码片段、解释代码逻辑、调试错误，或者将代码从一种编程语言\"翻译\"成另一种，是程序员的好帮手。\n\n**5. 逻辑分析与推理**\n我可以帮助你分析复杂的问题，梳理逻辑链条，并根据你提供的信息进行推理和总结。\n\n---\n\n**总而言之**，我的目标是成为一个强大而有用的工具，通过自然语言交流的方式，帮助你更高效地获取信息、完成任务和激发创意。\n\n**需要记住的是：** 我是一个人工智能，我的知识来源于我所学习的数据，并且可能不是最新的。有时我也可能会犯错，所以对于非常重要的信息，建议你进行再次核实。", "tool_calls": [ null ] }, "logprobs": { "content": [ { "token": null, "logprob": null, "bytes": null, "top_logprobs": null } ] }, "finish_reason": "stop" } ]

{ "prompt_tokens": 13, "completion_tokens": 1891, "total_tokens": 1904, "prompt_tokens_details": { "cached_tokens": 0, "text_tokens": 13, "audio_tokens": 0, "image_tokens": 0 }, "completion_tokens_details": { "text_tokens": 0, "audio_tokens": 0, "reasoning_tokens": 1480 }, "input_tokens": 0, "output_tokens": 0, "input_tokens_details": null }

curl --request POST \ --url https://api.starmagic.ai/v1/chat/completions \ --header 'Authorization: Bearer <token>' \ --header 'Content-Type: application/json' \ --data '{ "model": "gemini-2.5-flash-lite", "messages": [ { "role": "user", "content": "请介绍一下你自己" } ] }'

{ "id": "chatcmpl-20251010015944503180122WJNB8Eid", "model": "gemini-2.5-flash-lite", "object": "chat.completion", "created": 1760032810, "choices": [ { "index": 0, "message": { "role": null, "content": null, "tool_calls": null }, "logprobs": { "content": [ null ] }, "finish_reason": "stop" } ], "usage": { "prompt_tokens": 13, "completion_tokens": 1891, "total_tokens": 1904, "prompt_tokens_details": { "cached_tokens": 0, "text_tokens": 13, "audio_tokens": 0, "image_tokens": 0 }, "completion_tokens_details": { "text_tokens": 0, "audio_tokens": 0, "reasoning_tokens": 1480 }, "input_tokens": 0, "output_tokens": 0, "input_tokens_details": null } }