mirror of
https://github.com/linshenkx/prompt-optimizer.git
synced 2026-05-08 06:28:50 +08:00
108 lines
2.9 KiB
Markdown
108 lines
2.9 KiB
Markdown
# 用户提示词工作区
|
|
|
|
路由:`/#/basic/user`
|
|
|
|
这个工作区适合优化“一次具体任务怎么说”。
|
|
|
|
如果你主要在写角色、规则、边界,通常更适合去 [系统提示词工作区](system-optimization.md)。
|
|
|
|
## 第一次使用,先这样判断
|
|
|
|
如果满足下面两条,通常就该用这个页面:
|
|
|
|
1. 你在改的是一条直接发给模型的任务提示词
|
|
2. 右侧通常不需要额外测试文本
|
|
|
|
## 什么时候用它
|
|
|
|
适合:
|
|
|
|
- 写作、改写、总结、翻译
|
|
- 生成结构化内容
|
|
- 调整任务目标、约束和输出格式
|
|
- 打磨一条直接发给模型的任务提示词
|
|
|
|
## 如果你只想快速开始,看这 4 步
|
|
|
|
1. 左侧填一条用户提示词
|
|
2. 左侧先做一次优化
|
|
3. 右侧直接运行测试
|
|
4. 再做结果评估或对比评估
|
|
|
|
## 左侧到底在改什么
|
|
|
|
左侧改的是 **user prompt 本身**。
|
|
|
|
当前页面可以这样理解:
|
|
|
|
- 左侧上方:原始用户提示词
|
|
- 左侧下方:当前工作区和版本链
|
|
|
|
左侧的 `分析 / 优化 / 迭代`,目标都是把这条 user prompt 写得更清楚、更稳定。
|
|
|
|
## 右侧到底在测什么
|
|
|
|
右侧测的是:
|
|
|
|
- 某个提示词版本本身
|
|
- 直接执行后的真实输出
|
|
|
|
所以在这个工作区里,右侧通常**不需要额外测试文本**。
|
|
|
|
这不是少了功能,而是当前设计本来就是这样:被测试的就是那条用户提示词本身。
|
|
|
|
## 这个页面里“分析”和“评估”的边界
|
|
|
|
- 左侧 `分析`:只分析提示词本身
|
|
- 右侧 `结果评估`:评估某一列输出是否完成任务
|
|
- 右侧 `对比评估`:比较多列输出的差异模式
|
|
|
|
## 推荐工作流
|
|
|
|
1. 左侧输入原始用户提示词
|
|
2. 左侧先做一次优化,得到工作区版本
|
|
3. 如需先看提示词本身是否清楚,再点左侧 `分析`
|
|
4. 右侧选择 `原始 / 工作区 / vN`
|
|
5. 运行测试
|
|
6. 先做单列 `结果评估`
|
|
7. 如果已经跑了两列或更多,再做 `对比评估`
|
|
8. 把真正有价值的建议应用回左侧工作区
|
|
|
|
## 最容易混淆的地方
|
|
|
|
因为在 `basic/user` 里,被测试的就是用户提示词本身。
|
|
|
|
不是。当前评估建议统一尝试作用到左侧当前工作区,而不是绑定到某个历史版本分支。
|
|
|
|
## 一个最小例子
|
|
|
|
原始提示词:
|
|
|
|
```text
|
|
写一首诗
|
|
```
|
|
|
|
优化后可能变成:
|
|
|
|
```text
|
|
请写一首关于秋日思念的七言律诗。
|
|
要求:
|
|
1. 共八句,每句七字。
|
|
2. 语言含蓄,不要直接喊口号式抒情。
|
|
3. 通过景物意象表达思念。
|
|
4. 只输出诗作,不要额外解释。
|
|
```
|
|
|
|
这时右侧就可以直接比较:
|
|
|
|
- 原始版本是否太泛
|
|
- 工作区版本是否更稳定地满足要求
|
|
- 不同模型是否对同一提示词理解一致
|
|
|
|
## 相关页面
|
|
|
|
- [系统提示词工作区](system-optimization.md)
|
|
- [测试与评估](../user/testing-evaluation.md)
|
|
- [模板管理](templates.md)
|
|
- [用户提示词示例与最佳实践](../examples/user-prompt-examples.md)
|