cursor2api

lywsvip/cursor2api

Fork 0

mirror of https://github.com/7836246/cursor2api.git synced 2026-07-01 01:04:23 +08:00

Commit Graph

Author	SHA1	Message	Date
huangzhenting	f317dc04b0	fix: 修复 thinking 截断时内容泄漏到正文的问题问题：当模型 thinking 内容超出单次输出上限时，<thinking> 标签未闭合，导致 thinking 内容被当作正文泄漏给客户端；续写请求中 assistantContext 含未闭合标签，模型不知道思考阶段已结束，继续输出 thinking 而非正文。修复： 1. splitLeadingThinkingBlocks：未闭合时返回已积累的部分 thinkingContent 而非空字符串，供调用方正确提取 2. handler.ts / openai-handler.ts：流结束 flush 新增 !complete 分支，提取截断的 thinkingContent，不将 thinking 内容 flush 为正文 3. 新增 closeUnclosedThinking：续写前补全缺失的 </thinking> 标签，应用于所有 4 处续写 assistantContext 构建，让模型正确从正文续写 4. shouldAutoContinueTruncatedToolResponse：json action 块未闭合时跳过 200-char 检查，修复 thinking 剥离后正文过短导致续写不触发的问题测试：新增 unit-thinking-truncation.mjs（11个单元测试）、 e2e-thinking-truncation.mjs（3个实际 API 请求测试），全部通过	2026-03-22 14:10:58 +08:00

Author

SHA1

Message

Date

huangzhenting

f317dc04b0

fix: 修复 thinking 截断时内容泄漏到正文的问题

问题：当模型 thinking 内容超出单次输出上限时，<thinking> 标签未闭合，
导致 thinking 内容被当作正文泄漏给客户端；续写请求中 assistantContext
含未闭合标签，模型不知道思考阶段已结束，继续输出 thinking 而非正文。

修复：
1. splitLeadingThinkingBlocks：未闭合时返回已积累的部分 thinkingContent
   而非空字符串，供调用方正确提取
2. handler.ts / openai-handler.ts：流结束 flush 新增 !complete 分支，
   提取截断的 thinkingContent，不将 thinking 内容 flush 为正文
3. 新增 closeUnclosedThinking：续写前补全缺失的 </thinking> 标签，
   应用于所有 4 处续写 assistantContext 构建，让模型正确从正文续写
4. shouldAutoContinueTruncatedToolResponse：json action 块未闭合时
   跳过 200-char 检查，修复 thinking 剥离后正文过短导致续写不触发的问题

测试：新增 unit-thinking-truncation.mjs（11个单元测试）、
e2e-thinking-truncation.mjs（3个实际 API 请求测试），全部通过

2026-03-22 14:10:58 +08:00

1 Commits