テキストDeepSeekDeepseek.V4

DeepSeek V4 - OpenAI 互換インターフェース

OpenAI Chat Completions プロトコルを使用して DeepSeek V4 モデルを呼び出し

deepseek-v4-flash（高速汎用）と deepseek-v4-pro（深度推論）の 2 つのモデルをサポート
テキスト会話：シングルまたはマルチターンのコンテキスト対話、1M の超長コンテキストをサポート
システムプロンプト：AI の役割と動作をカスタマイズ
思考モード：thinking.type で深度推論を制御；deepseek-v4-pro の思考内容は reasoning_content で返されます
ストリーミング出力：SSE ストリーミング返却をサポート
ツール呼び出し：Function Calling をサポート（最大 128 ツール）
JSON モード：response_format で有効化
コンテキストキャッシュ：同一プレフィックスのリクエストは自動的にキャッシュにヒットし、入力コストを大幅に削減

<Note> **BaseURL**：デフォルトの BaseURL は `https://api.starmagic.ai` で、テキストモデルへの対応が優れており、長時間接続をサポートします。`https://api.starmagic.ai` はマルチモーダルの主力エンドポイントで、テキストモデルに対しては代替アドレスとして使用されます。 </Note>

認証

Authorizationstringheader必須

##すべてのインターフェースは Bearer Token による認証が必要です## **API Key の取得**： [API Key 管理ページ](https://starmagic.ai/app/api-keys) にアクセスして API Key を取得してください **使用時はリクエストヘッダに追加**： ``` Authorization: Bearer YOUR_API_KEY ```

Authorization: Bearer YOUR_API_KEY

リクエストボディ

application/json

modelenum<deepseek-v4-flash | deepseek-v4-pro>必須

会話モデル名 - `deepseek-v4-flash`：高速汎用モデル、1M コンテキスト - `deepseek-v4-pro`：深度推論モデル、数学、プログラミング、複雑なロジックが得意 **ヒント**：両モデルは **`thinking` がデフォルトで有効** であり、レスポンスには `reasoning_content` が含まれます。`thinking.type="disabled"` で無効化すると出力 token コストを削減できます。両モデルのパラメータは完全に同一です。

"deepseek-v4-flash"

messagesobject[]必須

会話メッセージリスト、マルチターン会話をサポート役割ごとにメッセージのフィールド構造が異なるため、該当する役割を選択して確認してください

[
  null
]

thinkingobject

思考モード制御（V4 新機能） **説明**： - 深度思考（Chain of Thought）機能を制御するために使用 - **両モデルともデフォルトで有効**（`type=enabled`） - 有効時、推論過程は `choices[].message.reasoning_content` で返され、出力 token として課金されます ⚠️ **マルチターン会話 / ツール呼び出しの注意**：本ターンのレスポンスに `reasoning_content` が含まれている場合、**次のリクエストの `messages` 履歴の該当 assistant メッセージでこのフィールドをそのまま返送する必要があります**。さもないと API は 400 `The reasoning_content in the thinking mode must be passed back to the API` を返します。処理したくない場合は、セッション全体で明示的に `thinking.type="disabled"` を指定できます。

{
  "type": "enabled",
  "reasoning_effort": "medium"
}

temperaturenumber

サンプリング温度、出力のランダム性を制御 **説明**： - 低い値（例：0.2）：より確定的で集中した出力 - 高い値（例：1.5）：よりランダムで創造的な出力 - デフォルト値：1

top_pnumber

核サンプリング（Nucleus Sampling）パラメータ **説明**： - 累積確率の上位何％の token からサンプリングするかを制御 - 例：0.9 は累積確率が 90% に達する token から選択 - デフォルト値：1.0（すべての token を考慮） **推奨**：temperature と top_p を同時に調整しないでください

max_tokensinteger

生成するコンテンツの最大 token 数を制限 **説明**： - V4 シリーズは最大 **384,000 tokens** まで可能 - thinking 有効時、reasoning_tokens も max_tokens の上限に含まれます - 未設定の場合、モデル自身が生成長さを決定

frequency_penaltynumber

頻度ペナルティパラメータ、繰り返し内容を減らすため **説明**： - 正の値は、生成済みテキストで出現した token の頻度に基づいてペナルティを与えます - 値が大きいほど、既出の内容を繰り返しにくくなります - デフォルト値：0（ペナルティなし）

presence_penaltynumber

存在ペナルティパラメータ、新しいトピックの生成を促進するため **説明**： - 正の値は、token がテキストに既出かどうかに基づいてペナルティを与えます - 値が大きいほど、新しいトピックを議論する傾向が強くなります - デフォルト値：0（ペナルティなし）

response_formatobject

レスポンスフォーマットを指定 **説明**： - `{"type": "json_object"}` に設定すると JSON モードを有効化 - JSON モード下、モデルは有効な JSON 形式のコンテンツを出力します - 最適な効果を得るため、system または user メッセージで JSON 出力を明示的に要求することを推奨

{
  "type": "text"
}

stopobject

停止シーケンス、モデルがこれらの文字列に遭遇すると生成を停止 **説明**： - 単一文字列または文字列配列を指定可能 - 最大 16 個の停止シーケンスをサポート

streamboolean

ストリーミング方式でレスポンスを返すかどうか - `true`：ストリーミング返却、SSE（Server-Sent Events）を通じてチャンクごとにリアルタイムでコンテンツを返す - `false`：完全なレスポンスを待ってから一度に返す（デフォルト）

false

stream_optionsobject

ストリーミングレスポンスオプション `stream=true` の場合のみ有効

{
  "include_usage": true
}

toolsobject[]

ツール定義リスト、Function Calling に使用 **説明**： - 最大 128 個のツール定義をサポート - 各ツールには名前、説明、パラメータ schema を定義する必要があります

[
  {
    "type": "function",
    "function": {
      "name": "string",
      "description": "string",
      "parameters": {},
      "strict": false
    }
  }
]

tool_choiceobject

ツール呼び出し動作を制御 **選択可能な値**： - `none`：いかなるツールも呼び出さない - `auto`：モデルが自動的にツール呼び出しを決定（tools 提供時のデフォルト） - `required`：モデルに 1 つ以上のツールを強制的に呼び出させる - オブジェクト形式 `{"type":"function","function":{"name":"xxx"}}`：特定のツール呼び出しを指定 **デフォルト値**：tools を提供しない場合は `none`、提供する場合は `auto`

logprobsboolean

token の対数確率を返すかどうか **説明**： - `true` に設定すると、レスポンスに各 token の対数確率情報が含まれます

false

top_logprobsinteger

確率の最も高い上位 N 個の token の対数確率を返す **説明**： - `logprobs` を `true` に設定する必要があります - 値の範囲：`[0, 20]`

logit_biasobject

Token バイアスマッピング **説明**： - キーは tokenizer 中の token ID、値は -100 から 100 の間のバイアス値 - -100 はその token を完全に禁止、100 は強制生成 - 典型的な値の範囲 -1 から 1 でも観測可能な影響を及ぼします

{}

ninteger

各入力メッセージに対して生成するチャット補完オプションの数 **説明**： - デフォルト 1；N に設定すると N 個の候補が返されます（N × output_tokens で課金）

seedinteger

ランダムシード（Beta） **説明**： - 指定するとモデルは確定的サンプリングを試みます - 同じ seed + 同じ他のパラメータ → 同じ出力（100% の保証ではない）

userstring

エンドユーザーを表す一意の識別子 **説明**： - プラットフォームの悪用監視と検出に役立ちます - ハッシュ化されたユーザー ID の使用を推奨

"string"

レスポンス

application/json

成功

レスポンスボディ

idstring

会話補完の一意識別子

"53c548dc-ec02-4a2f-bbb6-eca4184630b8"

modelstring

実際に使用されたモデル名

"deepseek-v4-flash"

objectenum<chat.completion>

レスポンスタイプ

"chat.completion"

createdinteger

作成タイムスタンプ（Unix 秒）

1777021417

choicesobject[]

会話生成の選択肢リスト

[
  {
    "index": 0,
    "message": {
      "role": "assistant",
      "content": "こんにちは！私は DeepSeek V4 です。一般会話、コード生成、数学的推論など多くのタスクが得意です。",
      "reasoning_content": "この問題を分析してみましょう...",
      "tool_calls": [
        {
          "id": null,
          "type": null,
          "function": null
        }
      ]
    },
    "logprobs": null,
    "finish_reason": "stop"
  }
]

usageobject

Token 使用統計情報（キャッシュと推論の分項を含む）

{
  "prompt_tokens": 694,
  "completion_tokens": 20,
  "total_tokens": 714,
  "prompt_cache_hit_tokens": 640,
  "prompt_cache_miss_tokens": 54,
  "prompt_tokens_details": {
    "cached_tokens": 640
  },
  "completion_tokens_details": {
    "reasoning_tokens": 10
  }
}

system_fingerprintstring

システム指紋識別子

"fp_evolink_v4_20260402"

POST/v1/chat/completions

curl --request POST \
  --url https://api.starmagic.ai/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
  "model": "deepseek-v4-flash",
  "messages": [
    {
      "role": "user",
      "content": "自己紹介をお願いします"
    }
  ]
}'

レスポンス: 成功

{
  "id": "837f529d-00f9-4731-b2e1-4a54fc31790a",
  "object": "chat.completion",
  "created": 1777026806,
  "model": "deepseek-v4-flash",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "こんにちは！私は DeepSeek アシスタントです。いつでもご質問にお答えし、お手伝いします。"
      },
      "logprobs": null,
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 7,
    "completion_tokens": 31,
    "total_tokens": 38,
    "prompt_tokens_details": {
      "cached_tokens": 0
    },
    "prompt_cache_hit_tokens": 0,
    "prompt_cache_miss_tokens": 7
  },
  "system_fingerprint": "fp_evolink_v4_20260402"
}

DeepSeek V4 - OpenAI 互換インターフェース

OpenAI Chat Completions プロトコルを使用して DeepSeek V4 モデルを呼び出し

deepseek-v4-flash（高速汎用）と deepseek-v4-pro（深度推論）の 2 つのモデルをサポート

テキスト会話：シングルまたはマルチターンのコンテキスト対話、1M の超長コンテキストをサポート

システムプロンプト：AI の役割と動作をカスタマイズ

思考モード：thinking.type で深度推論を制御；deepseek-v4-pro の思考内容は reasoning_content で返されます

ストリーミング出力：SSE ストリーミング返却をサポート

ツール呼び出し：Function Calling をサポート（最大 128 ツール）

JSON モード：response_format で有効化

コンテキストキャッシュ：同一プレフィックスのリクエストは自動的にキャッシュにヒットし、入力コストを大幅に削減

[ { "index": 0, "message": { "role": "assistant", "content": "こんにちは！私は DeepSeek V4 です。一般会話、コード生成、数学的推論など多くのタスクが得意です。", "reasoning_content": "この問題を分析してみましょう...", "tool_calls": [ { "id": null, "type": null, "function": null } ] }, "logprobs": null, "finish_reason": "stop" } ]

{ "prompt_tokens": 694, "completion_tokens": 20, "total_tokens": 714, "prompt_cache_hit_tokens": 640, "prompt_cache_miss_tokens": 54, "prompt_tokens_details": { "cached_tokens": 640 }, "completion_tokens_details": { "reasoning_tokens": 10 } }

curl --request POST \ --url https://api.starmagic.ai/v1/chat/completions \ --header 'Authorization: Bearer <token>' \ --header 'Content-Type: application/json' \ --data '{ "model": "deepseek-v4-flash", "messages": [ { "role": "user", "content": "自己紹介をお願いします" } ] }'

{ "id": "837f529d-00f9-4731-b2e1-4a54fc31790a", "object": "chat.completion", "created": 1777026806, "model": "deepseek-v4-flash", "choices": [ { "index": 0, "message": { "role": "assistant", "content": "こんにちは！私は DeepSeek アシスタントです。いつでもご質問にお答えし、お手伝いします。" }, "logprobs": null, "finish_reason": "stop" } ], "usage": { "prompt_tokens": 7, "completion_tokens": 31, "total_tokens": 38, "prompt_tokens_details": { "cached_tokens": 0 }, "prompt_cache_hit_tokens": 0, "prompt_cache_miss_tokens": 7 }, "system_fingerprint": "fp_evolink_v4_20260402" }