LLMAgentHarness EngineeringOn this pageHarness Engineering为了解决生产可靠性,以及减少人工成本 Agent = Model + Harness。模型是引擎,Harness 是底盘、方向盘、刹车和仪表盘。 同一个模型在不同 harness 上 SWE-bench 得分差 20-30 个百分点——harness 才是可靠性的主要变量。 Guide(前向约束) Sensor(反馈检测) Loop(闭环收敛) 参考资料 详见 记忆系统参考资料(论文、博客、开源项目索引)