LLM API Test

大模型 API 在线调试工具 — 实时预览 JSON,一键发送请求

连接配置
API 服务的基础地址,切换平台页签会自动填充对应平台的端点
用于鉴权的密钥,从平台控制台获取,仅通过 Worker 代理转发不会在前端泄露
基本参数
指定要调用的模型名称,如 gpt-5.4、gpt-5.1、o3-mini 等,切换平台页签会自动填充默认模型
构造 Responses API 的 input。可选择纯文本,或添加多条 message,每条 message 可添加 text/image/file content
高级:手写 Input 覆盖
系统级指令(类似 system prompt),插入到模型上下文的最前面,优先级高于用户消息中的指令
采样参数
控制随机性,范围 0~2,值越高输出越有创造性。OpenAI Responses API 默认为 1
核采样参数,范围 0~1。模型只考虑概率质量累计达到 top_p 的 token。建议与 temperature 二选一调整
生成内容的最大 token 数上限,包含可见输出和 reasoning tokens
停止词,遇到这些词会停止生成。多个词用英文逗号分隔
返回每个位置最有可能的 token 及其 log 概率,范围 0~20,0 表示不返回
推理参数(Reasoning)— 仅对 o-series / gpt-5 等推理模型生效
约束推理力度。可选值:none / minimal / low / medium / high / xhigh。gpt-5.1 默认为 none,其他推理模型默认为 medium
推理过程摘要的详细程度。auto — 自动决定 / concise — 简洁摘要 / detailed — 详细摘要
输出控制(Output Control)
输出格式。text — 纯文本 / json_object — 旧版 JSON 模式(不推荐) / json_schema — 结构化输出(推荐)
控制文本输出详略程度。low 更简洁,high 更详细
Text Format 为 json_schema 时使用,名称最多 64 字符
启用 strict 结构化输出,要求模型严格遵循 schema
strict=true
点击添加字段来构造 object schema;右侧请求体会实时预览
可选,说明结构化输出格式的用途
高级:手写 JSON Schema 覆盖
上下文截断策略。disabled — 超出上下文窗口则报 400 错误 / auto — 自动丢弃较早的对话内容以适应窗口
处理优先级。auto — 使用项目设置 / default — 标准 / flex — 弹性处理 / priority — 优先处理
是否启用流式输出(Server-Sent Events)。开启后响应将以 SSE 事件流的形式逐步返回
开启 SSE 流式响应
仅 stream=true 时生效。false 可减少 SSE 带宽开销
上下文与复用(Conversation / Prompt / Context)
将响应加入指定 conversation。不能和 previous_response_id 同时使用
复用平台中的 prompt 模板
可选 prompt 模板版本
后台运行响应,适合长任务
background=true
为 prompt 模板添加变量,支持字符串和常见 input_* 对象
高级:手写 Prompt Variables 覆盖
当前主要用于 compaction:达到阈值时压缩上下文
添加 { type: "compaction" }
高级:手写 Context Management 覆盖
工具调用(Tools / Tool Choice / Include)
控制模型是否以及如何使用工具
勾选需要额外返回的数据
添加多个工具项,每个工具项会生成 tools 数组中的一个对象
快捷工具勾选
高级:手写 Tools / Tool Choice / Include 覆盖
Tool Choice 选择自定义 JSON 时使用
非空时覆盖上方工具构造器
非空时覆盖上方勾选项
高级选项(Advanced)
上一轮响应的 ID,用于多轮对话。填入后可以在之前对话的基础上继续交流
用于优化缓存命中率,相同 key 的相似请求将享受更快的响应速度
用于检测滥用行为的用户标识,建议使用用户名的哈希值,最大 64 字符
工具调用的最大总次数(跨所有内置工具),超过此次数的工具调用将被忽略
缓存保留策略。in_memory — 内存级缓存 / 24h — 保留最长 24 小时
旧字段,正在被 safety_identifier 和 prompt_cache_key 替代,仅用于兼容学习
最多 16 个键值对,key 最大 64 字符,value 最大 512 字符
高级:手写 Metadata 覆盖
高级兜底:合并到最终请求体,可覆盖上方同名字段,用于文档新增参数或实验字段
是否存储响应到 OpenAI 服务器以便后续检索
允许模型并行执行多个工具调用
请求体预览
JSON

        
响应结果