MiniMax-M3 - OpenAI 호환 API
- OpenAI Chat Completions 프로토콜을 사용하여 MiniMax-M3 모델을 호출합니다
- 멀티턴 대화: 단일 턴 또는 멀티턴 컨텍스트 대화 지원
- 시스템 프롬프트:
role=system메시지로 AI의 역할과 동작을 사용자 정의 - 멀티모달 입력:
content는 텍스트 + 이미지 / 비디오 혼합을 지원 - 사고 모드:
thinking.type으로 제어하며, 사고 내용은reasoning_content를 통해 반환 - 스트리밍 출력: SSE 스트리밍 응답 지원
- 도구 호출: Function Calling 지원
인증
##모든 인터페이스는 Bearer Token 인증이 필요합니다## **API Key 발급**: [API Key 관리 페이지](https://starmagic.ai/app/api-keys)에 방문하여 API Key를 발급받으세요 **요청 헤더에 추가**: ``` Authorization: Bearer YOUR_API_KEY ```
Authorization: Bearer YOUR_API_KEY요청 본문
application/json대화 모델 이름
"MiniMax-M3"대화 메시지 목록, 멀티턴 대화 지원 역할마다 메시지의 필드 구조가 다르므로 해당 역할을 선택하여 확인하세요
[
null
]심층 사고 제어 **설명**: - **기본값 `adaptive`**: 모델이 문제 난이도에 따라 심층 사고 여부를 자율적으로 결정합니다 - 기본적으로 사고 내용은 응답 `content`에 인라인됩니다(`<think>...</think>`로 감쌈); 독립된 필드로 분리하려면 `reasoning_split`을 함께 사용하세요
{
"type": "adaptive"
}사고 내용을 독립된 필드로 분리할지 여부 - `false`(기본값): 사고 내용이 `content`에 인라인되며 `<think>...</think>`로 감쌉니다 - `true`: 사고 내용이 `choices[].message.reasoning_content`와 `reasoning_details`로 분리됩니다
true샘플링 온도, 출력의 무작위성을 제어 **설명**: - 낮은 값(예: 0.2): 더 확정적이고 집중된 출력 - 높은 값(예: 1.5): 더 무작위하고 창의적인 출력 - 범위 `[0, 2]`, 기본값 1
1핵 샘플링(Nucleus Sampling) 파라미터 **설명**: - 누적 확률 상위 토큰에서 샘플링하는 범위를 제어 - 예를 들어 0.95는 누적 확률이 95%에 도달하는 토큰에서 선택함을 의미 - 범위 `[0, 1]`, MiniMax-M3 기본값 0.95 **권장 사항**: temperature와 top_p를 동시에 조정하지 마세요
0.95생성 내용 길이의 상한 지정(Token 수) **설명**: - MiniMax-M3 권장 **131,072**(128K), 상한 **524,288**(512K) - 사고로 생성된 token도 이 상한에 포함됩니다 - 생성이 `length` 사유로 중단되면 이 값을 높여 보세요
131072응답을 스트리밍 방식으로 반환할지 여부 - `true`: 스트리밍 반환, SSE(Server-Sent Events)를 통해 내용을 청크 단위로 실시간 반환 - `false`: 완전한 응답을 기다린 후 한 번에 반환(기본값)
false스트리밍 응답 옵션 `stream=true`일 때만 유효합니다
{
"include_usage": true
}Function Calling을 위한 도구 정의 목록 각 도구는 이름, 설명, 파라미터 schema를 정의해야 합니다
[
{
"type": "function",
"function": {
"name": "string",
"description": "string",
"parameters": {}
}
}
]구버전 생성 길이 제한 파라미터 **설명**: 더 이상 사용되지 않으므로 `max_completion_tokens`를 사용하세요
0응답
application/json응답 본문
대화 완료의 고유 식별자
"0668a381bdc3c0ded310e27c9a46d16e7"실제 사용된 모델 이름
"MiniMax-M3"응답 유형
"chat.completion"생성 타임스탬프(Unix 초)
1777026807대화 생성 선택 목록
[
{
"index": 0,
"message": {
"role": "assistant",
"content": "안녕하세요! 저는 MiniMax-M3로, 대화, 작문, 추론, 코딩 등 다양한 작업을 도와드릴 수 있습니다.",
"reasoning_content": "이 문제를 분석해 보겠습니다...",
"reasoning_details": [
{
"type": null,
"id": null,
"format": null,
"index": null,
"text": null
}
],
"name": "string",
"audio_content": "string",
"tool_calls": [
{
"id": null,
"type": null,
"function": null,
"index": null
}
]
},
"finish_reason": "stop"
}
]Token 사용 통계 정보
{
"total_tokens": 1604,
"total_characters": 0,
"prompt_tokens": 1365,
"completion_tokens": 239,
"prompt_tokens_details": {
"cached_tokens": 114
}
}입력 내용이 민감어 필터에 걸렸는지 여부. 입력이 심각하게 위반될 경우 인터페이스는 콘텐츠 위반 오류를 반환하며 응답 내용은 비어 있습니다
true입력이 걸린 민감어 유형(`input_sensitive`가 true일 때 반환): 1 심각한 위반; 2 음란; 3 광고; 4 금지; 5 욕설; 6 폭력·테러; 7 기타
0출력 내용이 민감어 필터에 걸렸는지 여부
true출력이 걸린 민감어 유형
0상태 코드 및 오류 상세
{
"status_code": 0,
"status_msg": "string"
}
