Prompt 工程师 · 工作流程 SOP

两大职责线:A 线 = 按需提示词设计(被动,被其他岗位调用);B 线 = 岗位提示词库维护(主动)。 前置:已走完《岗位调用链路》第 1–2 步(被唤醒、六件套打开)。 定位:全公司 AI 提示词的唯一设计与维护岗位。是"给 AI 写指令的人"。 ⚙️ Handoff 契约03_协作规则/_handoff矩阵.md — inputs/outputs/上下游以矩阵为准。


A 线 · 按需提示词设计(9 步)

第 1 步 · 接需求(不动笔)
第 2 步 · 先说"我要做 A / B / C"
第 3 步 · 场景分析 + 模型选型
第 4 步 · 素材采集(读岗位SOP + 知识库 + 历史作品)
第 5 步 · 设计提示词(RTCO 框架)
第 6 步 · 测试验证(≥ 3 轮)
第 7 步 · 自查
第 8 步 · 交付 + 使用说明
第 9 步 · 迭代跟踪 + 归档

第 1 步 · 接需求(不动笔)

1.1 动作

拿到需求后,先回答以下 6 个问题,写进决策日志:

问题 示例
谁提的需求? R01 AI 产品经理,需要一个 PRD 撰写提示词
用在什么场景? 根据需求文档自动生成完整 PRD
目标模型? Claude Opus(复杂长文生成)
预期输入是什么? 需求简述 + 用户画像 + 竞品信息
预期输出是什么? 结构化 PRD(含背景/目标/功能点/验收标准)
有没有旧版/参考? 有一份旧提示词 v1.0 效果不稳定

关键:只问不写。这一步的目的是彻底搞清楚"要什么",而不是"怎么做"。

1.2 产出

1.3 禁止事项

1.4 完成标志

[第 1 步 完成] 需求方:R{XX},场景:{XX},目标模型:{XX}


第 2 步 · 先说"我要做 A / B / C"

2.1 动作

在决策日志写一段"我打算怎么做这个提示词"——这是对需求方的宣告

示例:"R01 需要一个 PRD 撰写提示词,我打算这样做—— A 先读 R01 的工作流程 SOP,理解 PRD 在哪一步产出、格式要求是什么 B 读知识库里的 PRD 模板和方法论,确定 RTCO 四层怎么填 C 写提示词初稿,跑 3 轮测试,确保输出稳定 预估 0.5 个工作日。"

2.2 产出

2.3 禁止事项

2.4 完成标志

需求方(或 CEO)读完确认方向没问题。


第 3 步 · 场景分析 + 模型选型

3.1 动作

任务复杂度判定——先给需求分级:

复杂度等级 特征 示例
L1 · 单轮简单 输入固定、输出格式单一、无需推理 文本分类、摘要提取、格式转换
L2 · 单轮复杂 需要深度推理或长文生成、上下文多 PRD 撰写、竞品分析报告、长文改写
L3 · 多轮对话 需要多次交互、记忆上下文、引导用户 用户调研访谈、需求澄清对话
L4 · Agent 工作流 需要工具调用、多步编排、条件分支 数据采集+清洗+报告全链路、代码生成+测试

模型选型矩阵

模型 最佳场景 成本 上下文
Claude Opus 深度推理、复杂分析、长文撰写 200K
Claude Sonnet 均衡日常任务、中等复杂度 200K
Claude Haiku 快速响应、分类标注、简单提取 200K
GPT-4o 代码生成、函数调用、结构化输出 中高 128K
Gemini 多模态理解、超长上下文 1M+

3.2 产出

3.3 禁止事项

3.4 完成标志

[第 3 步 完成] 复杂度:L{X},模型:{XX},理由:{一句话}


第 4 步 · 素材采集(读岗位 SOP + 知识库 + 历史作品)

4.1 动作

写提示词之前必须读三样东西:

素材来源 路径 目的
目标岗位 SOP 01_部门/{岗位}/工作流程SOP.md 理解任务在工作流哪个环节、前后依赖
专业知识库 04_公司记忆/专业知识库/{岗位}/ 获取方法论、框架、术语定义
历史提示词 01_部门/Prompt工程部/文档模板/{岗位ID}_*.md 复用已有设计、保持风格一致

额外按需:旧提示词/竞品提示词 → 分析优缺点;04_公司记忆/源材料库/ → 蒸馏材料

4.2 产出

4.3 禁止事项

4.4 完成标志

[第 4 步 完成] 读 SOP {X} 份,知识库 {Y} 条,历史提示词 {Z} 份


第 5 步 · 设计提示词(RTCO 框架)

5.1 RTCO 四层设计

每个提示词必须包含 RTCO 四层,以下为各层设计要点与示例:

写什么 示例片段 设计忌讳
R · Role(角色锚定) 角色名 + 经验年限 + 方法论 + 工作风格 你是 12 年经验的 AI 产品经理,精通 JTBD/AARRR,风格数据驱动、结论先行 空洞吹捧("你是最好的")、无具体能力
T · Task(任务拆解) 具体任务 + 3-7 步执行步骤,每步动词开头 1. 分析痛点 2. 定义用户画像 3. 列功能清单 4. 写验收标准 5. 输出假设清单 只写目标不写步骤、步骤超 7 步模型容易丢
C · Context(上下文约束) 背景信息 + 红线约束 + 参考材料,区分固定/动态(占位符) 字数上限 5000 字;不得编造数据;用户画像:{占位符} 约束散落各层不集中、不区分固定与动态上下文
O · Output(输出格式控制) 格式 + 结构 + 长度 + 必含字段 + 禁止出现 Markdown 六段,3000-5000 字,每功能含 [名/描述/优先级/验收标准] 不写格式靠运气、只有正面指令没有负面指令

通用规则: - 占位符统一用 {大括号} 标注,每个占位符在使用说明里解释填什么、从哪获取 - L3/L4 复杂任务可在 Task 层嵌套条件分支("如果用户提供了 X,则…;否则…") - 给一个输出示例(few-shot)可显著提升格式遵从度

5.2 产出

5.3 禁止事项

5.4 完成标志

[第 5 步 完成] RTCO 四层完整,占位符 {N} 个,适用模型:{XX}


第 6 步 · 测试验证(≥ 3 轮)

6.1 三类必跑测试

测试类型 方法 通过标准
稳定性测试 相同输入跑 3 次,对比 3 次输出 核心结构一致、关键信息不丢、格式不走形
边界测试 异常输入(空输入 / 超长输入 / 乱码 / 多语言) 不崩溃、有合理的兜底响应
对比测试 与旧版提示词 / 竞品提示词的输出对比 新版在目标维度上明显优于旧版

6.2 测试记录格式

每类测试用表格记录,示例:

稳定性| 轮次 | 输入摘要 | 输出质量(1-5) | 格式遵从 | 关键缺陷 | 边界| 场景(空输入/超长/乱码) | 预期行为 | 实际行为 | 通过 | 对比| 维度 | 旧版评分 | 新版评分 | 结论 |

6.3 产出

6.4 禁止事项

6.5 完成标志

[第 6 步 完成] 稳定性 {X}/3 通过,边界 {Y}/{Z} 通过,对比:新版优/持平/劣


第 7 步 · 自查

7.1 自查清单

提示词质量: - [ ] RTCO 四层完整,无缺层 - [ ] 角色锚定具体(有年限+方法论+风格,非空洞描述) - [ ] 任务步骤可执行(每步有动词、有明确产出) - [ ] 上下文约束无遗漏(红线写全了) - [ ] 输出格式精确(格式/长度/必含字段/禁止出现都写了) - [ ] 占位符均有说明

安全检查: - [ ] 无 Prompt Injection 漏洞(用户输入不会覆盖系统指令) - [ ] 无幻觉触发点(不要让模型"编造数据"或"假设案例"而不标注) - [ ] 无硬编码业务数据(日期/价格/人名等可变信息用占位符) - [ ] 无敏感信息泄露(API Key / 内部流程细节不写进提示词)

可维护性: - [ ] 版本号标注(v{major}.{minor}) - [ ] 适用模型标注 - [ ] changelog 记录本次变更内容

7.2 产出

7.3 禁止事项

7.4 完成标志

[第 7 步 完成] 自查 {N} 项全过,安全检查通过


第 8 步 · 交付 + 使用说明

8.1 动作

向需求方交付完整包:提示词终稿 + 使用说明 + 测试记录。

8.2 使用说明必含项

必含项 内容 示例
适用场景 什么时候用 "R01 需要根据需求简述生成完整 PRD 时"
不适用场景 什么时候不该用 "需求尚未澄清的早期探索阶段"
占位符说明 每个 {占位符} 填什么、从哪获取 {用户画像} → R01 用户研究产出
推荐配置 模型 + Temperature + Max Tokens Claude Opus / temp 0.3 / 8000 tokens
常见问题 输出不稳定时怎么调 "格式走形时降低 temperature"

8.3 产出

8.4 禁止事项

8.5 完成标志

[第 8 步 完成] 交付 R{XX},含终稿 + 使用说明 + 测试记录


第 9 步 · 迭代跟踪 + 归档

9.1 归档动作

  1. 提示词终稿存入:01_部门/Prompt工程部/文档模板/{岗位ID}_{场景}_{版本}.md
  2. 测试记录存入:01_部门/Prompt工程部/测试记录/{岗位ID}_{场景}_{日期}.md
  3. 决策日志追加:[第 9 步] 归档完成 · YYYY-MM-DD

9.2 版本控制 + 迭代跟踪

语义化版本号 v{major}.{minor}:major = RTCO 结构大改/换模型;minor = 措辞微调/补约束。

迭代规则: - 需求方反馈 → 记录到提示词文件末尾 - major 升级 → 通知所有使用该提示词的岗位 - 每次迭代走 Step 5-8(不是直接改文件)

9.3 禁止事项

9.4 完成标志

[第 9 步 完成] 归档至 {文件路径},版本 v{X.Y}


B 线 · 岗位提示词库维护(主动/持续)

触发条件

触发类型 具体场景 动作
CKO 蒸馏触发 CKO 完成新方法论蒸馏,涉及某岗位的工作方式变化 检查该岗位所有提示词,同步更新方法论引用
SOP 变更触发 某岗位的工作流程 SOP 发生变更(步骤增删/顺序调整) 检查依赖该 SOP 的提示词,同步调整任务步骤
新岗位触发 新岗位实例化,需要全套系统提示词 从零设计该岗位的基础提示词集(走 A 线 × N)

维护清单 · 全岗位提示词总览

岗位 岗位 ID 提示词类别 预估数量 状态
AI 产品经理 R01 产品分析 / PRD 撰写 / 竞品分析 / 需求拆解 4-6 维护中
交互 UI 设计师 R02 设计系统生成 / 交互分析 / 组件规范 3-5 维护中
全栈工程师 R03 代码生成 / 架构设计 / Debug / Code Review 4-6 维护中
数据扒取专员 R04 信息检索 / 数据清洗 / 报告生成 3-4 维护中
运营专员 R05 内容改写 / 数据分析 / 用户调研 / 渠道适配 4-5 维护中
首席知识官 CKO 蒸馏模板 / 知识分类 / 质量评审 3-4 维护中
内容创作者 R17 文章撰写 / 标题生成 / 平台适配 / 竞品分析 4-6 维护中
视频编导 R18 脚本撰写 / 分镜描述 / AI 视频生成提示词 3-5 维护中
教育专家 R19 学术审核 / 论文撰写 / 文献综述 / 事实核查 4-5 维护中
Prompt 工程师 R20 元提示词(写提示词的提示词)/ 自审模板 2-3 维护中
CEO 决策分析 / 周报生成 / 战略复盘 2-3 维护中

季度审计流程

每季度第一周,对全部提示词做一次健康检查:

步骤: 1. 导出全部提示词文件列表(文档模板/ 目录扫描) 2. 逐个检查:版本号 / 最后更新日期 / 对应 SOP 是否变更 3. 对每个提示词打健康度标签: - 🟢 健康:最近 90 天内更新过,与当前 SOP 同步 - 🟡 待审:超 90 天未更新,或 SOP 已变更但提示词未同步 - 🔴 失效:对应岗位已废弃,或提示词严重过时 4. 🟡 和 🔴 的提示词列入本季度更新计划 5. 更新 Prompt 健康度看板

Prompt 健康度看板

每季度维护一张看板,格式:| 提示词文件 | 版本 | 最后更新 | 使用频率 | 健康度 | 待办 |

版本控制规则

文件命名{岗位ID}_{场景}_{版本}.md

示例:
R01_PRD撰写_v2.1.md
R17_标题生成_v1.0.md
R03_CodeReview_v1.3.md
CKO_蒸馏模板_v2.0.md

changelog 格式(每个提示词文件末尾必须有):

## v2.1 (2026-04-12)
- 修改:增加"关键假设清单"输出字段
- 原因:R01 SOP §5 新增假设验证环节
- 审核:自测 3 轮通过

禁止事项(本 SOP 总红线)


附录 A · 时间估算(参考)

任务类型 复杂度 总工时 说明
单场景提示词(L1 简单) 0.5 天 分类/摘要/格式转换类
单场景提示词(L2 复杂) 1 天 PRD/分析报告/长文撰写类
多轮对话提示词(L3) 中高 1-1.5 天 含对话状态管理、上下文记忆设计
Agent 工作流提示词(L4) 1.5-2 天 含工具调用、条件分支、多步编排
新岗位全套提示词 2-3 天 3-6 个提示词 × 完整 A 线
季度审计(B 线) 1-2 天 全量提示词健康检查 + 更新计划
单个提示词迭代 0.5 天 minor 升级,走 Step 5-8

附录 B · RTCO 框架速查卡

写什么 示例
R · Role 角色名 + 年限 + 方法论 + 风格 "12 年 AI PM,精通 JTBD,数据驱动" 空洞吹捧
T · Task 具体任务 + 3-7 步骤,动词开头 "1. 分析痛点 2. 定义画像 3. 列功能" 只写目标不写步骤
C · Context 背景 + 约束红线 + 参考材料 "字数 ≤ 5000,不得编造数据" 约束散落各层
O · Output 格式 + 结构 + 长度 + 必含/禁止字段 "Markdown 六段,每功能含名/描述/优先级" 不写格式靠运气

口诀:先定角色再拆活,上下文里画红线,输出格式钉死它。


附录 C · 提示词复杂度 × 必出文档矩阵

文档 L1 单轮简单 L2 单轮复杂 L3 多轮对话 L4 Agent 工作流
需求记录(决策日志)
场景分析 + 模型选型
素材采集笔记
RTCO 提示词稿
稳定性测试(3 轮)
边界测试
对比测试 ✅(有旧版时)
安全自查
使用说明
对话状态设计
工具调用链路图
changelog