DeepSeek - Referencia completa de la API
- Llama a los modelos DeepSeek usando el formato OpenAI SDK
- Modo de procesamiento síncrono, respuesta en tiempo real
- Compatible con los modelos
deepseek-chat(conversación general) ydeepseek-reasoner(razonamiento profundo) - Chat de texto: Conversación contextual de uno o varios turnos
- Prompts del sistema: Personaliza el rol y comportamiento de la IA
- Streaming: Soporte de salida en streaming SSE
- Llamada de herramientas: Soporte de Function Calling
Autorización
##Todas las APIs requieren autenticación Bearer Token## **Obtener API Key:** Visita la [Página de gestión de API Key](https://starmagic.ai/app/api-keys) para obtener tu API Key **Agregar al encabezado de la solicitud:** ``` Authorization: Bearer YOUR_API_KEY ```
Authorization: Bearer YOUR_API_KEYCuerpo de solicitud
application/jsonNombre del modelo de chat - `deepseek-chat`: Modelo de conversación general - `deepseek-reasoner`: Modelo de razonamiento profundo, destaca en matemáticas, programación y razonamiento lógico complejo **Nota**: `deepseek-reasoner` no soporta los parámetros `temperature`, `top_p`, `tools`, `tool_choice`, `response_format`. Pasarlos será rechazado por el upstream
"deepseek-chat"Lista de mensajes de conversación, soporta conversación de múltiples turnos Diferentes roles tienen diferentes estructuras de campos, selecciona el rol correspondiente para ver
[
null
]Control del modo de pensamiento (Beta) **Detalles**: - Controla la función de pensamiento profundo del modelo `deepseek-reasoner` - Cuando está habilitado, el modelo realizará un razonamiento profundo antes de responder
{
"type": "enabled"
}Penalización de frecuencia, número entre -2.0 y 2.0 **Nota**: - Los valores positivos penalizan los nuevos tokens según su frecuencia en el texto, disminuyendo la probabilidad de repetir las mismas frases textualmente
0Número máximo de tokens a generar **Detalles**: - El modelo dejará de generar cuando se alcance este límite - Si no se establece, el modelo decide la longitud de generación
4096Parámetro de penalización de presencia para fomentar nuevos temas **Detalles**: - Los valores positivos penalizan tokens según si han aparecido en el texto - Valores más altos fomentan discutir nuevos temas - Predeterminado: 0 (sin penalización)
0Especificar formato de respuesta **Detalles**: - Establezca `{"type": "json_object"}` para habilitar el modo JSON - En modo JSON, el modelo generará contenido JSON válido
{
"type": "text"
}Secuencias de parada. El modelo dejará de generar al encontrar estas cadenas **Detalles**: - Puede ser una cadena única o un arreglo de cadenas - Máximo 16 secuencias de parada
Si transmitir la respuesta en streaming - `true`: Streaming vía SSE (Server-Sent Events), devolviendo contenido en fragmentos en tiempo real - `false`: Esperar la respuesta completa antes de devolver
falseOpciones de respuesta en streaming Solo es efectivo cuando `stream=true`
{
"include_usage": true
}Temperatura de muestreo, controla la aleatoriedad de la salida **Detalles**: - Valores más bajos (ej. 0.2): Salida más determinista y enfocada - Valores más altos (ej. 1.5): Salida más aleatoria y creativa - Valor predeterminado: 1
1Parámetro de muestreo Nucleus **Detalles**: - Controla el muestreo de tokens cuya probabilidad acumulativa alcanza el umbral - Por ejemplo, 0.9 significa muestrear de tokens que alcanzan el 90% de probabilidad acumulativa - Predeterminado: 1.0 (considerar todos los tokens) **Consejo**: Evite ajustar tanto temperature como top_p simultáneamente
1Lista de definiciones de herramientas para Function Calling **Detalles**: - Máximo 128 definiciones de herramientas - Cada herramienta requiere un nombre, descripción y esquema de parámetros
[
{
"type": "function",
"function": {
"name": "string",
"description": "string",
"parameters": {},
"strict": false
}
}
]Controla el comportamiento de llamada de herramientas **Opciones**: - `none`: No llamar a ninguna herramienta - `auto`: El modelo decide si llamar a herramientas - `required`: Forzar al modelo a llamar una o más herramientas **Por defecto**: `none` cuando no se proporcionan herramientas, `auto` cuando se proporcionan herramientas
Si devolver las probabilidades logarítmicas de los tokens **Detalles**: - Cuando se establece en `true`, la respuesta incluirá información de probabilidad logarítmica para cada token
falseDevolver las probabilidades logarítmicas de los N tokens más probables **Detalles**: - Requiere que `logprobs` esté establecido en `true` - Rango: `[0, 20]`
0Respuesta
application/jsonCuerpo de respuesta
Identificador único para la completación de chat
"930c60df-bf64-41c9-a88e-3ec75f81e00e"Nombre del modelo real utilizado
"deepseek-chat"Tipo de respuesta
"chat.completion"Marca de tiempo de creación
1770617860Lista de opciones de completado de chat
[
{
"index": 0,
"message": {
"role": "assistant",
"content": "Hello! I'm DeepSeek, a powerful AI assistant. I excel at general conversation, code generation, mathematical reasoning and many other tasks.",
"reasoning_content": "Let me analyze this problem...",
"tool_calls": [
{
"id": null,
"type": null,
"function": null
}
]
},
"finish_reason": "stop"
}
]Estadísticas de uso de tokens
{
"prompt_tokens": 16,
"completion_tokens": 10,
"total_tokens": 26,
"prompt_cache_hit_tokens": 0,
"prompt_cache_miss_tokens": 16
}Identificador de huella digital del sistema
"fp_eaab8d114b_prod0820_fp8_kvcache"
