Subagent Assignment Matrix (Empirical Local Bench)

Updated: 2026-02-23
Source benchmark: generated/model_profiles_2026-02-23.json

Speed Summary (lower is better)

Hard rule:

Any local-model task must route through skills/ollama-agent-queue (never direct ollama run in task scripts).
If local queue fails/timeouts, escalate to API fallback.

qwen2.5:14b
Use for: operations, summaries, drafting, monitoring, report generation, first-pass analysis

qwen2.5-coder:32b-instruct-q3_K_L
Use for: root-cause debugging, non-trivial refactors, architecture/code-level reasoning
Guardrail: only invoke when task is explicitly code-heavy or qwen14b fails first pass

Task Type	Primary	Fallback 1	Fallback 2	Notes
Daily brief / ops summary	qwen2.5:14b (via queue)	mistral-small3.2:24b (via queue)	Codex 5.3 (Plus/API)	Optimize for speed
Research scan + synthesis	qwen2.5:14b (via queue)	mistral-small3.2:24b (via queue)	Codex 5.3 (Plus/API)	Escalate for strategic depth
Social copy draft batch	qwen2.5:14b (via queue)	mistral-small3.2:24b (via queue)	gpt-4o (API)	Use API for final polish
Browser automation planning	qwen2.5:14b (via queue)	qwen-coder:32b (via queue)	Codex 5.3 (Plus/API)	Coding model when selectors/scripts complex
Script writing / bugfix	qwen-coder:32b (via queue)	qwen2.5:14b (via queue)	Codex 5.3 (Plus/API)	Prefer coder model for non-trivial logic
Fast triage / inbox classification	qwen2.5:14b (via queue)	mistral-small3.2:24b (via queue)	—	Throughput-first
Financial/compliance messaging	qwen2.5:14b (via queue)	Codex 5.3 (Plus/API)	gpt-4o (API)	Human confirmation still required
High-stakes strategy / external commitments	Codex 5.3 (Plus/API)	GPT-4o (API)	Gemini (API)	Director review required before send

Escalate from local to API model only if one or more are true:

For spawned subagents, set model explicitly per task type instead of defaulting every task to one model.