Skip to content

性能指标契约

Agent UI 性能是用户体验契约的一部分。客户端和 runtime 应记录足够 metrics 来解释体感慢,同时不暴露敏感 payloads。

提交和首响应

Metric含义
composer.submit_ms用户动作时间戳。
listener.bound_msStream listener 或 event binding 就绪。
submit.accepted_msRuntime 接受 turn。
queue.wait_ms在队列等待的时间。
runtime.start_msRuntime 开始执行。
provider.request_start_msProvider 或 model request 开始。
first_event_ms首个 runtime event 到达客户端。
first_runtime_status_ms首个用户可见状态。
first_text_delta_ms首个回答 text delta。
first_text_paint_ms首个文本对用户可见。

这些 metrics 用于区分 client delay、runtime queueing、provider delay、bridge delay 和 render delay。

Stream rendering

Metric含义
text_delta.queue_depth未渲染 text chunks 数量。
text_delta.oldest_unrendered_age_ms最老未渲染 chunk 年龄。
stream.render_modeSmooth、catch-up、paused 或 fallback。
stream.mode_transition_count模式切换次数。
stream.rapid_reentry_count频繁进入 catch-up 的指标。
stream.flush_interval_msRender flush cadence。
stream.buffer_charsBuffered text size。

客户端可用这些指标决定何时从 smooth streaming 切换到 catch-up rendering。

History 和 restore

Metric含义
session.click_to_shell_ms打开 session 到 shell paint。
session.snapshot_apply_msCached snapshot apply 时间。
session.detail_request_msWindow detail request 时长。
session.messages_hydrate_msRecent messages hydration 时长。
message_list.first_stable_paint_ms首个可读 conversation paint。
timeline.idle_hydrate_msDeferred timeline 完成时间。
history.page_load_msOlder history page 时长。

Resource pressure

Metric含义
tabs.active_count完整活跃 sessions。
tabs.hydrated_detail_count持有 detailed state 的 sessions。
message_lists.mounted_countMounted message lists。
timeline.items_mounted_countRendered timeline items。
artifact.preview_loaded_bytes已加载 artifact preview bytes。
background.restore_count并发 restore 操作。
deferred.timeline_pending_countDeferred timeline jobs。

验收阈值

本标准不规定通用数值。Pack SHOULD 为具体产品定义目标:

  • first visible status
  • first text paint
  • old session shell paint
  • old session recent message paint
  • maximum mounted inactive timelines
  • large tool output preview threshold
  • artifact preview budget

目标应使用代表性的 histories 和 tool outputs 测试,而不只测空 demo sessions。

Draft runtime-first standard for agent interaction surfaces.