如何评估 agent workflow:轨迹、成本和恢复
把 trajectory evaluation、goal-level cost、semantic recovery 和 confidence calibration 放进同一套 agent 评估框架。
6 篇公开内容使用了「agent-governance」这个标签。
把 trajectory evaluation、goal-level cost、semantic recovery 和 confidence calibration 放进同一套 agent 评估框架。
说明 AI agent 从能执行任务到可放进组织流程之间需要的治理层:权限、证据、工具、轨迹、成本和人工门禁。
解释 long-running agent session 的 residual drift:系统没有显式矛盾也可能偏离早先承诺,因此需要 commitment tracking。
梳理 evidence-carrying action 与 source authority:当用户文本、结构化数据和工具输出冲突时,AI workflow 应如何判定证据优先级。
解释为什么 agent 不能只依赖计划阶段许可,关键动作必须在运行时重新检查权限,并通过 autonomy gate 决定执行、询问或停止。
说明 MCP、插件、工具描述和依赖包为什么都是 agent 控制面的一部分,以及如何把 tool registry 纳入供应链治理。