Harness 工程实践:如何让 Agent 完成自主迭代 一个人一天最多跑一次迭代实验,但每周上百个 badcase 追着我们跑——我们团队用 Harness 工程让 AI 自主运行 17 小时、完成 16 轮迭代实验,最终上线了实验。这篇文章复盘了整个搭建过程。 2026-07-02