🧪 Skills
结构化任务规划与分步执行 V2(异步子代理架构)
结构化任务规划与分步执行 V2(异步子代理架构)。支持将每个步骤通过 session_spawn 创建子代理异步执行,主会话保持非阻塞。功能包括:步骤分解、
v1.0.7
Description
name: stp description: "结构化任务规划与分步执行 V2(异步子代理架构)。支持将每个步骤通过 session_spawn 创建子代理异步执行,主会话保持非阻塞。功能包括:步骤分解、子代理执行、子代理检验(LLM判断)、状态跟踪、Heartbeat 监控、任务中断。触发词:/stp、任务规划、步骤执行。" description_en: "Structured Task Planning V2 with async subagent execution. Each step runs as an isolated subagent via session_spawn, keeping the main session non-blocking. Features: step decomposition, subagent execution, subagent verification (LLM), status tracking, heartbeat monitoring, task interruption. Triggers: /stp, 任务规划, 步骤执行."
路径变量说明(本文档通用):
<STP_ROOT>=~/.openclaw/workspace/skills/stp<STP_SCRIPTS>=<STP_ROOT>/scripts<STP_TASK_LIST>=~/.openclaw/workspace/task-list<STP_TASKS>=~/.openclaw/workspace/tasks
STP V2(异步子代理架构)
背景
重大更新:V2 采用子代理异步架构,每个步骤通过 session_spawn 创建独立的子代理执行,主会话保持非阻塞,彻底解决了 V1 长任务阻塞主会话的问题。
- V1:在主会话运行,长任务会阻塞整个会话
- V2:每个步骤通过
session_spawn创建子代理执行,主会话非阻塞
核心概念
主会话 (非阻塞)
│
├── session_spawn (步骤执行) → 执行子代理
│ │
│ └──→ announce 完成/失败
│
├── session_spawn (步骤检验) → 检验子代理 (LLM)
│ │
│ └──→ 返回通过/不通过
│
└── heartbeat (定时检查) → 监控子代理状态
一、计划书格式
1.1 标准格式(含检验标准)
# 任务名称
## 任务描述
用户原始需求的简要描述
## 技术方案
- 使用的工具/库/API
- 关键技术约束
## 全局设置
- 步骤超时时间: [无超时 / N 分钟]
- 任务完成后删除目录: [是 / 否](默认否,保留任务记录)
## 核心执行步骤
- [ ] 步骤 1:具体描述
- **执行 Prompt**: 给执行子代理的具体指令
- **检验标准**: 给检验子代理(LLM)的验证条件,用于判断步骤是否成功完成
- [ ] 步骤 2:具体描述
- **执行 Prompt**: xxx
- **检验标准**: xxx
...
## 预期产出
- 输出文件/结果说明
1.2 用户确认流程
📋 任务计划书已生成
任务名称:xxx
文件位置:~/.openclaw/workspace/tasks/task-xxx/task_steps.md
步骤数:3
全局设置:
- 步骤超时时间:无超时
- 任务完成后删除目录:否(默认保留)
核心执行步骤:
- [ ] 步骤 1:编写股票查询脚本
- 执行 Prompt:编写 Python 脚本,使用 AkShare 查询股票数据
- 检验标准:脚本存在于 temp/scripts/stock_query.py,可执行无报错
- [ ] 步骤 2:查询贵州茅台收盘价
- 执行 Prompt:运行脚本查询 600519.SH
- 检验标准:输出包含"600519.SH"和收盘价数值
...
========================================
确认执行:
输入 "ok" 或 "确认" → 开始执行
输入 "取消" → 放弃此任务
输入 "修改" → 调整计划
输入 "超时 30" → 设置每个步骤超时 30 分钟
输入 "删除" 或 "清理" → 任务完成后删除目录
========================================
二、任务目录结构
~/.openclaw/workspace/tasks/
└── task-{ID}/
├── stp-plan-{ID}.md # 计划书
├── task_steps.md # 步骤文档(含状态、子代理ID、超时计数)
└── temp/
├── scripts/
└── downloads/
task_steps.md 格式(含子代理追踪)
## 任务基础信息
- 任务名称:xxx
- 任务ID:task-1
- 创建时间:2026-02-28 22:00:00
- 步骤超时时间:无超时
## 核心执行步骤
### 步骤 1:编写股票查询脚本
- **状态**: 执行中
- **执行子代理**: subagent:abc (runId: xyz)
- **检验子代理**: 待创建
- **超时计数**: 执行(0/2) | 检验(0/2)
- **执行 Prompt**: 编写 Python 脚本...
- **检验标准**: 脚本存在于 temp/scripts/stock_query.py
### 步骤 2:查询贵州茅台
- **状态**: 待执行
...
三、执行流程
3.1 状态机
待执行 → 执行中 → 待检验 → 检验中 → (通过) → 待执行(下一步)
↓ (不通过)
等待用户决策(调整/重试/终止)
⚠️ 注意:执行中 → 待检验 → 检验中 是必经步骤,禁止跳过!
3.2 主会话编排逻辑
启动任务
⚠️ 重要:必须先展示计划书并确认,才能执行!
完整流程:
- 用户给任务 → AI 生成计划书内容(内存中)
- 创建任务目录:在
~/.openclaw/workspace/tasks/下创建新的task-{ID}目录(ID 自增) - 保存计划书:将计划书保存到
task-{ID}/stp-plan-{ID}.md - 展示计划书给用户(包含文件位置)
- 等待用户确认(输入 "ok" / "确认" 等)
- 用户确认后:
- 调用
stp_orchestrator.py start <plan_file>初始化任务 - 读取 task_steps.md 获取步骤 1 的执行 Prompt
- 使用 sessions_spawn 启动执行子代理:
sessions_spawn( task="<步骤 1 的执行 Prompt>", label="task-{ID}-step-1-exec", cleanup="keep" ) - 更新 task_steps.md 中步骤 1 的状态为"执行中",记录 exec_subagent
- 回复用户时必须说明如何中断任务,例如:"如需终止请输入:中断 task-{ID}"
- 调用
- 用户取消 → 保留 task-{ID} 目录和计划书(不删除)
禁止跳过确认步骤!
⚠️ 重要:每个任务必须独立思考!
- 生成计划书时,禁止读取或参考已有的任务计划书(如 tasks/ 目录下的 .md 文件)
- 即使任务内容相似,也必须从用户需求出发重新思考
- 不要复用旧计划的思路,每个任务都是全新的
执行步骤
- 主会话更新步骤状态为"执行中"
- 创建执行子代理:
sessions_spawn( task="<步骤的执行 Prompt>", label="task-{ID}-step-{N}-exec", cleanup="keep" ) - 记录子代理信息到 task_steps.md:
- 步骤状态改为"执行中"
- 记录执行子代理 ID (subagent:xxx)
- 记录 runId
- 记录执行时间
- 返回非阻塞响应
检验步骤
⚠️ 重要:执行子代理完成后,必须先检验才能执行下一步!禁止跳过检验步骤!禁止让主会话 LLM 直接判断检验结果!
- 收到执行子代理的 announce
- 立即启动检验子代理,不允许 LLM 自行判断
- 创建检验子代理(LLM):
sessions_spawn( task="请根据以下检验标准判断步骤是否成功完成。 检验标准:{步骤的检验标准} 执行结果:{执行子代理的输出} 请返回:通过 / 不通过,并说明原因", label="task-{ID}-step-{N}-verify", cleanup="keep" ) - 记录检验子代理信息到 task_steps.md:
- 步骤状态改为"检验中"
- 记录检验子代理 ID
- 记录 runId
- 检验子代理返回结果
- 检验通过 → 更新状态为"已完成",执行下一步
- 检验不通过 → 询问用户:调整方案 / 重试 / 终止
失败处理
- 执行失败 → 询问用户:调整方案 / 重试 / 终止
- 检验不通过 → 询问用户:调整方案 / 重试 / 终止
四、Heartbeat 监控
4.1 工作流程
- 启动任务时:
start命令自动创建 cron job(stp-heartbeat-{task_id}) - Cron 触发:每 10 分钟触发 isolated session,执行
heartbeat <task_id> - 检查状态:对每个已知子代理调用
sessions_history_sync获取实际状态 - 基于实际状态判断:
tool_count == 0:pending(等待开始)is_running == true(正在等待工具返回或最近 5 分钟有活动):running(执行中)is_running == false且超过 5 分钟无活动:completed(已完成)- 超过 30 分钟仍在工作中:stuck(卡住)
4.2 sessions_history_sync 返回状态
| 字段 | 说明 |
|---|---|
| tool_count | 工具调用次数 |
| tool_call_count | toolCall 数量 |
| tool_result_count | toolResult 数量 |
| is_waiting | 等待工具返回中(toolCall > toolResult) |
| is_running | 正在执行(is_waiting 或最近 5 分钟有活动) |
| is_recent | 最近 5 分钟有活动 |
4.2 状态判断规则
| 状态 | 条件 | 处理 |
|---|---|---|
| pending | tool_count == 0 | 等待 |
| running | 最近 5 分钟有活动 | 正常 |
| completed | 超过 5 分钟无活动 | 通知用户,更新状态 |
| stuck | 超过 30 分钟无活动 | 增加超时计数,>= 2 则告知用户 |
4.3 通知用户
- 如果
completed_subagents有内容:通知用户子任务完成,需要继续检验 - 如果
stuck_count > 0且超时计数 >= 2:提示用户决定是否重试或终止
4.4 挂起处理示例
⚠️ 步骤 2 可能已挂死
执行子代理已等待 30+ 分钟无响应
Tool: exec (git clone ...)
请选择:
- 继续等待 → 再次等待 10 分钟
- 重试 → 终止当前子代理,重新执行
- 终止 → 结束整个任务
五、任务中断
5.1 触发方式
用户输入:中断 {任务名称} 或 中断 task-{ID}
5.2 中断流程
- 解析中断命令,获取任务 ID(如
task-23→23) - 运行命令:
python3 <STP_SCRIPTS>/stp_orchestrator.py interrupt <task_id> - 解析 JSON 输出,获取
subagent_ids_for_kill列表 - 在主会话中直接调用 subagents 工具杀掉每个子代理:
(注意:target 需要完整的 session key,如subagents(action="kill", target="agent:main:subagent:xxx")agent:main:subagent:xxx) - 杀掉子代理后,检查并杀掉残留进程:
- 对每个被杀的子代理,调用
sessions_history获取其执行历史 - 从历史中解析 exec 命令的返回结果,提取
details.pid(进程 PID) - 用
kill <PID>杀掉进程 - 如果解析不到 PID,再用关键词匹配作为后备方案
- 对每个被杀的子代理,调用
- 自动删除对应的 cron job
- 通知用户任务已中断(包括杀掉的残留进程 PID)
六、脚本说明
6.1 stp_orchestrator.py(核心编排)
# 启动任务(自动创建 cron job 用于 heartbeat)
python3 <STP_SCRIPTS>/stp_orchestrator.py start <plan_file>
# 查看任务状态
python3 <STP_SCRIPTS>/stp_orchestrator.py status <task_id>
# 检查 heartbeat(需要传入 task_id)
python3 <STP_SCRIPTS>/stp_orchestrator.py heartbeat <task_id>
# 中断任务(自动删除对应的 cron job)
python3 <STP_SCRIPTS>/stp_orchestrator.py interrupt <task_id>
Cron Job 自动管理
- 启动任务时:
start命令自动创建 cron job(stp-heartbeat-{task_id}),每 10 分钟检查一次 - Heartbeat 检查:cron job 触发 isolated session,执行
heartbeat <task_id> - 任务中断时:
interrupt命令自动删除对应的 cron job - 任务完成时:heartbeat 检测到以下情况会自动清理 cron:
- 没有活跃子代理
- 所有子代理不在工作中(completed/idle)
- 所有子代理会话不存在
- 检验通过后,cron 会收到清理信号并删除自己
无需配置 HEARTBEAT.md,完全自动化。
七、使用示例
7.1 自然语言模式
# 用户:帮我查三支股票价格
# AI 自动生成计划书,用户确认后:
python3 <STP_SCRIPTS>/stp_orchestrator.py start ~/.openclaw/workspace/tasks/task-xxx/stp-plan-xxx.md
7.3 主会话交互
用户: 帮我查三支股票价格
[AI 根据用户需求动态生成计划书]
📋 任务计划书已生成
文件:~/.openclaw/workspace/tasks/task-xxx/stp-plan-xxx.md
步骤数:3
...
用户: ok
✅ 任务已启动 (task-1)
你可以继续做其他事,我会定期汇报进度
⚠️ **如需终止任务**,请输入:中断 task-{ID}
---
### 7.4 主会话中断任务示例
用户: 中断 task-23
[主会话执行:]
- 运行: python3 <STP_SCRIPTS>/stp_orchestrator.py interrupt 23
- 解析输出获取 subagent_ids_for_kill: ["agent:main:subagent:xxx", ...]
- 对每个 ID 调用 subagents 工具杀掉子代理
- 对每个被杀的子代理:
- 调用 sessions_history 获取执行历史
- 解析 exec 返回结果中的 details.pid
- 用 kill
杀掉进程 - 如果没有 PID,用关键词匹配作为后备
- 通知用户任务已中断
---
## 八、注意事项
1. **严格串行**:必须等上一步检验通过才能执行下一步
2. **子代理通信**:通过 announce 链通信,不使用 sessions_send
3. **状态持久化**:所有状态保存在 task_steps.md
4. **Heartbeat**:默认 10 分钟检查一次
5. **超时判定**:单个 tool 执行 30 分钟算超时,给 2 次机会(总共 60 分钟)
---
## 意见反馈
欢迎提交 Issue 或 Pull Request!
🔗 GitHub:https://github.com/scotthuang/openclawSkills/tree/main/stp
---
## Changelog
### 2026-03-02
#### 修复
- Cron Job 添加 `--channel webchat` 参数,避免执行时报错
- task_step 输出清理信息:任务完成或中断时,在 `task_steps.md` 中记录清理信息(时间、终止的子代理、删除的 cron、终止的进程)
### 2026-03-01
#### 新增
- 每个 STP 任务创建独立目录 `task-{ID}/`,用户取消后也保留
- 计划书保存在 `stp-plan-{ID}.md`
- 中断任务时自动杀掉子代理的残留进程(通过解析 sessions_history 获取 PID)
- 强制使用检验子代理验证结果,禁止主会话 LLM 直接判断
#### 优化
- 目录结构简化,移除 `result.txt` 和 `task_execution.log`
- 修正脚本命令说明,移除不存在的 `execute`、`verify`、`retry` 命令
- 添加"每个任务必须独立思考"的规则,禁止参考已有计划书
- 修正章节编号(7.3 交互、7.4 中断示例)
#### 修复
- 修复中断任务时只杀子代理、不杀残留进程的 bug
- 修复执行步骤后跳过检验子代理、直接启动下一步的 bug
Reviews (0)
Sign in to write a review.
No reviews yet. Be the first to review!
Comments (0)
No comments yet. Be the first to share your thoughts!