MiniMax-M3 - API compatible con Anthropic
- Utiliza el protocolo Anthropic Messages para llamar al modelo MiniMax-M3
- La estructura de solicitud / respuesta se alinea con la API de Anthropic
- Conversación multimodal:
contentadmite bloques de contenido de texto e imagen - Indicaciones de sistema: se pasan mediante el campo de nivel superior
system - Modo de pensamiento: se controla mediante el objeto
thinking; el contenido de pensamiento se devuelve a través del bloquecontent[type=thinking] - Salida en streaming: flujo de eventos SSE
- Llamada a herramientas: compatible con el flujo
tool_use/tool_resultde Anthropic
Autorización
##Todas las API requieren autenticación con Bearer Token## **Obtener la API Key:** Visita la [Página de gestión de API Keys](https://starmagic.ai/app/api-keys) para obtener tu API Key **Añadir al encabezado de la solicitud:** ``` Authorization: Bearer YOUR_API_KEY ``` **Nota**: EvoLink utiliza de forma uniforme la autenticación con Bearer Token para `/v1/messages`.
Authorization: Bearer YOUR_API_KEYCuerpo de solicitud
application/jsonModelo a llamar
"MiniMax-M3"Límite superior de la longitud del contenido generado (en tokens) **Notas**: - MiniMax-M3 recomendado **131,072** (128K), máximo **524,288** (512K) - Los tokens generados por el pensamiento también cuentan para este límite - El contenido que supere el límite se truncará; si la generación se interrumpe por `length`, intenta aumentar este valor
1024Lista de mensajes de la conversación, alternando turnos de user / assistant **Notas**: - Debe contener al menos 1 mensaje - El último mensaje normalmente es `role=user`
[
{
"role": "user",
"content": null
}
]Indicación de sistema, usada para definir el rol y el comportamiento de la IA **Notas**: - Admite una cadena o un arreglo de cadenas - Se pasa mediante el campo `system` de nivel superior
Temperatura de muestreo **Notas**: - Rango: `[0, 2]` - Predeterminado 1; los valores más altos producen una salida más divergente, los más bajos producen una salida más determinista
1Umbral de muestreo por núcleo **Notas**: - Rango: `[0, 1]`, MiniMax-M3 predeterminado 0.95 - Se recomienda no ajustar temperature y top_p simultáneamente
0.95Si se debe devolver mediante streaming SSE - `true`: respuesta en streaming Server-Sent Events - `false`: espera la respuesta completa antes de devolverla (predeterminado)
falseControla el pensamiento profundo. Cuando el pensamiento está habilitado, los bloques de pensamiento deben devolverse sin modificaciones en las conversaciones de múltiples turnos **Notas**: - **Valor predeterminado `adaptive`**: el modelo decide de forma adaptativa si realiza un pensamiento profundo según la dificultad del problema - Cuando está habilitado, el arreglo `content` de la respuesta incluirá un bloque de razonamiento `type="thinking"` (facturado como tokens de salida)
{
"type": "adaptive"
}Lista de definiciones de herramientas **Notas**: - Sigue la especificación de definición de herramientas de Anthropic - `input_schema` usa un objeto JSON Schema
[
{
"name": "string",
"description": "string",
"input_schema": {},
"cache_control": {
"type": "ephemeral"
}
}
]Estrategia de selección de herramientas. Solo se admiten auto y none
{
"type": "auto"
}Metadatos de la solicitud
{
"user_id": "string"
}Respuesta
application/jsonCuerpo de respuesta
ID único del mensaje
"string"Tipo de objeto de respuesta
"message""assistant"Modelo realmente utilizado
"MiniMax-M3"Lista de bloques de contenido de la respuesta **Tipos de bloque posibles**: - `thinking`: proceso de razonamiento (solo cuando el pensamiento está activo) - `text`: texto de la respuesta final - `tool_use`: llamada a herramienta iniciada por el modelo
[
{
"type": "text",
"text": "string",
"thinking": "string",
"signature": "string",
"id": "string",
"name": "string",
"input": {}
}
]Razón de parada - `end_turn`: finalización natural - `max_tokens`: se alcanzó el límite de max_tokens - `tool_use`: el modelo activó una llamada a herramienta
"end_turn"Estadísticas de uso de tokens (especificación de Anthropic)
{
"input_tokens": 7,
"output_tokens": 77,
"cache_creation_input_tokens": 0,
"cache_read_input_tokens": 0
}
