Cursor在2026年1月14日发布《Scaling long-running autonomous coding》(链接见参考1),声称用大量AI Agents协同,让AI花了一周时间写出浏览器,从零起步,产出超过100万行代码、约1000个文件,并给出了视频与仓库链接。
然而这一仓库公开后,很快收到了大量质疑。这些质疑里纵然很多是毫无根据的猜测,但有些则非常尖锐和直接:为什么我连编译都编译不了?

博主 embedding-shapes 在他的16日发布的博文(参考2)里直言:Cursor给出的仓库根本无法编译,CI长期失败,历史提交里也难找到能通过构建的版本。Cursor暗示AI成功的开发了一个浏览器,但没有可复现实验,没有可运行版本,没有已知可用的提交点,一切只有他们所谓的成功截图和录象,和一篇宣传文。他甚至强调说:“They never actually claim this browser is working and functional”---意思就是,Cursor说他们成功了实现了scaling-agents,但根本没说这agent写出来的东西可以运行,也没说那些截图和视频是这个agents做的浏览器的截图。

不过,上面的博文的猜测可能有点太过了。embedding-shapes在该仓库的issue(参考4)反映了这个问题后,17日,官方终于出面,解决了无法编译的问题。
只是编译问题解决了之后,更严重的问题来了:这浏览器可不像官方文章宣传的那样,它根本没法用。
正如同之前的issue和最新的issue(参考5)所反映的,即使能够编译,但这个浏览器在启动后也无法做任何操作,且很快就会崩溃。官方截图和视频,只是这个浏览器偶尔运行起来的,看上去很美的样子。
至此,人类码农发现至少现在AI还是掌控不了大规模而严肃的infra开发,可以短暂的松一口气了。
在我看来,这倒算不上造假,但明显是过度营销了。对一个自称突破协调瓶颈、可规模化自治编码的团队来说,复现实验与可运行构建是最低限度,否则只是代码规模的表演。

问题来了,Cursor为什么要这么做?为什么要急着拿出一个与宣传并不配套的半成品?以下是我个人的胡乱猜测,诸位看看就忘即可。
已知背景如下:

  1. 大模型训练的Scaling law正在失效。这个基本是学术界的共识了。这意味着,以后模型基座的能力将不会有这几年的飞跃性上升。
  2. Curosr虽然也有Composer,但在大模型上依然需要仰仗LLM供应商的鼻息。ARR可观,去年已经突破了5亿美元,但由于调用第三方LLM的token成本高昂,至今营收依然是负值。
  3. Cursor光在2025年一年就融了三轮,1月份B轮估值25亿美金,5月份C轮估值99亿美金,11月份D轮估值已经达到了293亿美金。
  4. 对比:Windsurf的ARR大约4000万美金,估值30亿。虽然主要人员被google抽走,但最终还是被Cognition收购。Cognition收购windsurf后估值100亿美金。
  5. Coding作为现在少有的有明确营收途径的Agent赛道,已经十分拥挤。Cursor需要面对的对手,GUI方面有拿下了windsurf的Cognition,以及VSCode。CLI方面则有Claude Code,Codex,OpenCode等一众工具挤压它的生存空间。

列举完背景后,其实问题基本已经被回答完毕了。
一是融资与增长叙事压力。营收转正遥遥无期,投资人的钱不能无限烧。学Manus和windsurf被收购?293亿的估值实在太高,这钱足够买四次windsurf+Manus。
二是赛道竞争。单纯AI Coding工具并无太多用户粘性,哪边多快好省,他们就会去哪边,甚至可能自己写一个。不要低估码农们爱折腾的心。
所以Cursor都需要一个对市场,对投资人,对用户的强心剂,证明自己技术还是最顶流的,证明自己值得这个估值。
而宣称自己做到了其他公司没做到的事情,就是最好的强心剂。

参考