Files
prompt-optimizer/mkdocs/docs/zh/advanced/context.md

105 lines
3.0 KiB
Markdown

# 多消息工作区
路由:`/#/pro/multi`
这个工作区不是“单条提示词模式的增强版”,而是一个**围绕整段会话来优化其中某一条消息**的工作区。
## 第一次使用,先这样判断
如果满足下面两条,通常就该用这个页面:
1. 你的输入已经不是单条提示词,而是整段会话
2. 右侧需要带整段上下文、共享变量或工具一起测试
## 什么时候用它
适合:
- 同时存在 `system / user / assistant` 多条消息
- 你要在完整对话上下文里优化其中一条 `system``user` 消息
- 会话里还需要共享变量或工具定义
不适合:
- 只想优化一条独立提示词
那种情况通常用基础模式或变量模式更简单。
## 如果你只想快速开始,看这 5 步
1. 先把整段会话搭出来
2. 选中要优化的那条 `system``user` 消息
3. 左侧先做一次优化或分析
4. 右侧配置共享变量和可选工具
5. 右侧跑测试,再做评估
## 左侧到底在改什么
左侧改的是 **整段会话里被你选中的那条目标消息**
当前页面可以这样理解:
- 会话管理器:维护整段消息列表
- 选中某一条 `system``user` 消息作为当前优化目标
- 左侧下方:这条消息自己的工作区和版本链
## 右侧到底在测什么
右侧测的是 **整段会话的真实执行结果**
只是当前列会把你选中的那条目标消息切换成:
- `工作区`
- `原始`
- `v1 / vN`
同时,右侧还会把这些内容一起带入测试:
- 整段会话
- 共享变量
- 可选工具上下文
## 左侧分析和右侧评估怎么区分
- 左侧 `分析`:分析被选中的目标消息在上下文中的写法
- 右侧 `结果评估`:评估某一列整段会话执行后的结果
- 右侧 `对比评估`:比较多列真实输出之间的差异
需要特别注意:
- 左侧分析不会把右侧某一次测试结果当作前提
- 右侧评估看的是真实执行证据,而不是版本标签本身
## 变量和工具在这里怎么生效
多消息模式里,变量和工具都属于右侧测试证据的一部分。
你可以把它理解成:
- 左侧决定“目标消息怎么写”
- 右侧决定“这条消息放回整段会话后,真实跑出来会怎样”
## 推荐工作流
1. 先把整段会话搭出来
2. 选中要优化的那条 `system``user` 消息
3. 左侧先做一次优化或分析
4. 右侧配置共享变量和可选工具
5. 在右侧比较 `工作区 / 原始 / vN`
6. 先做单列 `结果评估`
7. 如果已经跑了两列或更多,再做 `对比评估`
8. 把真正有价值的建议应用回左侧工作区
## 最容易混淆的地方
不是。右侧是在执行整段会话,只是被选中的那条目标消息会按列切换版本。
不是。变量值属于右侧测试输入,左侧分析的重点仍然是目标消息本身。
## 相关页面
- [变量工作区](variables.md)
- [测试与评估](../user/testing-evaluation.md)
- [工具调用](tools.md)
- [快速开始](../user/quick-start.md)