Registry-driven evaluation mesh

The quality, regression, and release-control mesh for the PlatPhorm ecosystem.

Discover targets from the network graph, MCP Hub, Claws, Spec, Trace, BrowserOps, AgentUI, Sandbox, Docs, and Webhook Lab. Turn capabilities into deterministic, model-graded, browser, replay, and workflow evaluations.

Open Dashboard API Documentation MCP Endpoint

84+

Services Tracked

272

MCP Tools

1,247

Capabilities Indexed

156

Eval Runs Today

Eval Suites

Active evaluation suites across the network

View all suites

MCP Tool Validation Suite

mcp-tool-validation

active

156 cases94% pass rateLast run: 2 hours ago

Spec Contract Compliance

spec-contract-compliance

active

89 cases88% pass rateLast run: 4 hours ago

Trace Integration Tests

trace-integration-tests

active

234 cases76% pass rateLast run: 6 hours ago

Docs Example Validation

docs-example-validation

draft

45 cases65% pass rateLast run: 1 day ago

Recent Runs

Latest evaluation run results

View all runs

Suite	Status	Score	Duration	Timestamp
MCP Tool Validation	passed	94%	2m 34s	Today, 14:23
Spec Contract Compliance	passed	88%	1m 12s	Today, 10:15
Trace Integration Tests	failed	76%	4m 56s	Yesterday, 22:45
Browser Journey Tests	running	—	—	Now