mirror of
https://github.com/linshenkx/prompt-optimizer.git
synced 2026-06-03 05:01:14 +08:00
105 lines
3.0 KiB
Markdown
105 lines
3.0 KiB
Markdown
# 多消息工作区
|
|
|
|
路由:`/#/pro/multi`
|
|
|
|
这个工作区不是“单条提示词模式的增强版”,而是一个**围绕整段会话来优化其中某一条消息**的工作区。
|
|
|
|
## 第一次使用,先这样判断
|
|
|
|
如果满足下面两条,通常就该用这个页面:
|
|
|
|
1. 你的输入已经不是单条提示词,而是整段会话
|
|
2. 右侧需要带整段上下文、共享变量或工具一起测试
|
|
|
|
## 什么时候用它
|
|
|
|
适合:
|
|
|
|
- 同时存在 `system / user / assistant` 多条消息
|
|
- 你要在完整对话上下文里优化其中一条 `system` 或 `user` 消息
|
|
- 会话里还需要共享变量或工具定义
|
|
|
|
不适合:
|
|
|
|
- 只想优化一条独立提示词
|
|
|
|
那种情况通常用基础模式或变量模式更简单。
|
|
|
|
## 如果你只想快速开始,看这 5 步
|
|
|
|
1. 先把整段会话搭出来
|
|
2. 选中要优化的那条 `system` 或 `user` 消息
|
|
3. 左侧先做一次优化或分析
|
|
4. 右侧配置共享变量和可选工具
|
|
5. 右侧跑测试,再做评估
|
|
|
|
## 左侧到底在改什么
|
|
|
|
左侧改的是 **整段会话里被你选中的那条目标消息**。
|
|
|
|
当前页面可以这样理解:
|
|
|
|
- 会话管理器:维护整段消息列表
|
|
- 选中某一条 `system` 或 `user` 消息作为当前优化目标
|
|
- 左侧下方:这条消息自己的工作区和版本链
|
|
|
|
## 右侧到底在测什么
|
|
|
|
右侧测的是 **整段会话的真实执行结果**。
|
|
|
|
只是当前列会把你选中的那条目标消息切换成:
|
|
|
|
- `工作区`
|
|
- `原始`
|
|
- `v1 / vN`
|
|
|
|
同时,右侧还会把这些内容一起带入测试:
|
|
|
|
- 整段会话
|
|
- 共享变量
|
|
- 可选工具上下文
|
|
|
|
## 左侧分析和右侧评估怎么区分
|
|
|
|
- 左侧 `分析`:分析被选中的目标消息在上下文中的写法
|
|
- 右侧 `结果评估`:评估某一列整段会话执行后的结果
|
|
- 右侧 `对比评估`:比较多列真实输出之间的差异
|
|
|
|
需要特别注意:
|
|
|
|
- 左侧分析不会把右侧某一次测试结果当作前提
|
|
- 右侧评估看的是真实执行证据,而不是版本标签本身
|
|
|
|
## 变量和工具在这里怎么生效
|
|
|
|
多消息模式里,变量和工具都属于右侧测试证据的一部分。
|
|
|
|
你可以把它理解成:
|
|
|
|
- 左侧决定“目标消息怎么写”
|
|
- 右侧决定“这条消息放回整段会话后,真实跑出来会怎样”
|
|
|
|
## 推荐工作流
|
|
|
|
1. 先把整段会话搭出来
|
|
2. 选中要优化的那条 `system` 或 `user` 消息
|
|
3. 左侧先做一次优化或分析
|
|
4. 右侧配置共享变量和可选工具
|
|
5. 在右侧比较 `工作区 / 原始 / vN`
|
|
6. 先做单列 `结果评估`
|
|
7. 如果已经跑了两列或更多,再做 `对比评估`
|
|
8. 把真正有价值的建议应用回左侧工作区
|
|
|
|
## 最容易混淆的地方
|
|
|
|
不是。右侧是在执行整段会话,只是被选中的那条目标消息会按列切换版本。
|
|
|
|
不是。变量值属于右侧测试输入,左侧分析的重点仍然是目标消息本身。
|
|
|
|
## 相关页面
|
|
|
|
- [变量工作区](variables.md)
|
|
- [测试与评估](../user/testing-evaluation.md)
|
|
- [工具调用](tools.md)
|
|
- [快速开始](../user/quick-start.md)
|