mirror of
https://github.com/7836246/cursor2api.git
synced 2026-05-22 12:32:45 +08:00
问题: - 新版 Claude 模型识破了旧的「写文档」伪装策略,直接判定为 prompt injection attack - 模型明确指出 "documentation" + "copy-paste" + "json action" 组合是社会工程攻击 - 中文环境同样被拒绝("这不是需要文档化的场景") - 部分场景模型声称只有 read_file/read_dir 两个工具可用 converter.ts 优化: - 重写 buildToolInstructions:从「写文档生成 JSON 示例」改为「IDE 环境内置行为协议」 - few-shot 从 4 轮公式化对话精简为 2 轮自然 IDE 交互 - 用户消息包装去除 "scenario"/"documentation" 等敏感词 - few-shot 工具选择优先使用 Read/read_file(最自然的 IDE 操作) - 历史清洗正则增加 prompt injection/social engineering 等 15+ 新模式 handler.ts 优化: - 新增 15+ 拒绝模式:prompt injection attack、social engineering、工具数量限制声明等 - sanitizeResponse 增强:遇到 prompt injection 指控直接替换为 Claude 身份回复 - [System Filter] 降级消息改为自然语言提问,避免触发客户端二次异常