LocalAI

mirror of https://github.com/mudler/LocalAI.git synced 2026-07-03 04:46:54 -04:00

Files

Ettore Di Giacinto 4d171e62bb docs(paged): reject MTP serving lever

Add the repeatable MTP serving A/B runner and record Phase 15 results showing current llama-server MTP regresses GB10 serving throughput despite passing inference gates.

Assisted-by: Codex:gpt-5

2026-07-01 02:29:28 +00:00

plans

docs(paged): reject MTP serving lever

2026-07-01 02:29:28 +00:00

specs

docs(paged): gate MTP rollback safety

2026-07-01 02:15:11 +00:00