mirror of
https://github.com/linshenkx/prompt-optimizer.git
synced 2026-05-08 06:28:50 +08:00
104 lines
3.0 KiB
Markdown
104 lines
3.0 KiB
Markdown
# 系统提示词工作区
|
||
|
||
路由:`/#/basic/system`
|
||
|
||
这个工作区适合处理“角色设定、行为边界、输出规范”这类长期约束。
|
||
|
||
如果你优化的重点是“一次具体任务怎么说”,通常更适合去 [用户提示词工作区](user-optimization.md)。
|
||
|
||
## 第一次使用,先这样判断
|
||
|
||
如果满足下面两条,通常就该用这个页面:
|
||
|
||
1. 你在写的是长期角色、规则、边界
|
||
2. 右侧需要配一段测试文本才能运行
|
||
|
||
## 什么时候用它
|
||
|
||
适合:
|
||
|
||
- 给模型一个稳定角色
|
||
- 规定统一输出结构
|
||
- 约束不能做什么
|
||
- 测试模型在不同问题下能不能始终守规则
|
||
|
||
## 如果你只想快速开始,看这 4 步
|
||
|
||
1. 左侧填一条 system prompt
|
||
2. 左侧先做一次优化
|
||
3. 右侧填测试文本
|
||
4. 右侧跑测试,再做结果评估
|
||
|
||
## 左侧到底在改什么
|
||
|
||
左侧改的是 **system prompt 本身**。
|
||
|
||
当前页面可以这样理解:
|
||
|
||
- 左侧上方:原始系统提示词
|
||
- 左侧下方:当前工作区和版本链
|
||
|
||
左侧的 `分析 / 优化 / 迭代`,目标都是把这条 system prompt 写得更清楚、更稳定、更容易执行。
|
||
|
||
## 右侧到底在测什么
|
||
|
||
右侧测的是:
|
||
|
||
- 某个 system prompt 版本
|
||
- 加上一段固定测试文本
|
||
- 最后看真实输出
|
||
|
||
所以在这个工作区里,右侧测试文本是必须的,因为 system prompt 通常不会单独执行。
|
||
|
||
## 这个页面里“分析”和“评估”的边界
|
||
|
||
- 左侧 `分析`:只分析 system prompt 本身,不读取右侧测试文本
|
||
- 右侧 `结果评估`:评估某一列真实输出是否达到目标
|
||
- 右侧 `对比评估`:比较多列真实输出之间的差异
|
||
|
||
如果你主要在分辨这几种动作,建议配合 [测试与评估](../user/testing-evaluation.md) 一起看。
|
||
|
||
## 推荐工作流
|
||
|
||
1. 左侧输入原始 system prompt
|
||
2. 左侧先做一次优化,得到工作区版本
|
||
3. 如需先看提示词本身是否清楚,再点左侧 `分析`
|
||
4. 右侧填写一段固定测试文本
|
||
5. 在右侧比较 `原始 / 工作区 / vN`
|
||
6. 先做单列 `结果评估`
|
||
7. 如果已经跑了两列或更多,再做 `对比评估`
|
||
8. 把真正有价值的建议应用回左侧工作区
|
||
|
||
## 最容易混淆的地方
|
||
|
||
因为左侧分析的目标是“这条 system prompt 写得怎么样”,不是“某一次执行结果怎么样”。
|
||
|
||
因为 system prompt 需要和一段用户输入一起执行,才能看出角色、规则和边界到底有没有生效。
|
||
|
||
## 一个最小例子
|
||
|
||
system prompt:
|
||
|
||
```text
|
||
你是一个客服助手。
|
||
```
|
||
|
||
右侧测试文本:
|
||
|
||
```text
|
||
我的订单三天了还没发货,现在可以退款吗?
|
||
```
|
||
|
||
这样你就能比较:
|
||
|
||
- 原始版本是否太泛
|
||
- 工作区版本是否更守规则
|
||
- 不同模型是否更容易误解这条 system prompt
|
||
|
||
## 相关页面
|
||
|
||
- [用户提示词工作区](user-optimization.md)
|
||
- [测试与评估](../user/testing-evaluation.md)
|
||
- [模板管理](templates.md)
|
||
- [系统提示词示例与最佳实践](../examples/system-prompt-examples.md)
|