从一个月前 meta 花一百多亿美元投资 scale ai 并且该公司 ceo 跳槽到 meta 开始,我就一直关注其动向,先后挖了庞若明、赵晟佳等大模型领域的顶尖人才,而且据传庞若明四年能拿到 2 亿美元。

显然这是非常离谱的,这一次 meta 真的下狠心了,但是挖了那么多人花了那么多钱,他到底想干什么?

今早才刷到 meta 发布的小扎介绍超级智能实验室的未来愿景的视频,简单说就是围绕「个人」。

An image to describe post

四大能力指向:帮助个人①实现目标、②创造想见之物、③体验任何冒险、④成为更好的伙伴与自己期望的人格。

小扎讲的是,行业里大多数专家把 AI 主要用于「集中式自动化生产」,但是他就不这么认为(挺有个性),他认为应该让个体主导技术的使用方向。

听着有点高大上,具体是什么意思呢?

集中式自动化生产 vs 个体主导的技术使用

这个「集中式自动化生产」具体指的是什么意思呢?它跟这个「个体主导技术的使用方向」有什么不同吗?因为我们如今像 ChatGPT,或者 Claude、Gemini 这些工具,我们也是每个人都有自己的用途,这难道不算后者吗?

我们现在去使用 AI,像用 GPT、Gemini 这些工具,中央大脑和算力都是掌握在大公司手里的,我们只是通过 API 去调用。也就是说,产生的成果是由平台去再分配的。

甚至在使用 GPT 的时候,你可能会遇到比如说 IP 不干净被封控。也就是说 AI 它并不掌握在你的手上,别人有权利直接把你给掐断掉。

这么看,「集中式自动化生产」可能指的是:

  1. 单一超级智能:想象一座庞大“云上工厂”,所有推理、决策、内容与代码都由同一模型完成。
  2. 价值观内嵌:少数开发者或监管机构决定模型目标,再由它生成大部分社会财富。
  3. 人类地位:多数人不再直接劳动,而领取 AI 产出的“分红”或全民基本收入。扎克伯格称这种路线为“中央集权式管控”,担心权力与资源进一步集中。

那扎克博客的「个体主导」理念可能相对的,是去中心化或多代理生态,比如AI 实例嵌入手机、眼镜、私有云,长期跟随同一用户,长期记忆围绕个人生活并且由个人直接驱动和获益。

  1. 个人超级智能:Meta 设想的 AI 像长期伙伴——了解你的日程、记得家人生日、帮你写代码、创作音乐。
  2. 硬件承载:戴在身上的 Ray-Ban AI 眼镜、手机、AR 头显成为主要入口,让 AI 处于“随身在线”状态而非远程中枢。
  3. 多代理生态:可能由无数专属微模型协作,而不是一个“中央大脑”。

回到我们刚刚的问题,为什么 ChatGPT 等产品看似“人人可用”却仍属集中式?

首先是部署模式,用户所有请求回到 OpenAI/Google 的集中算力池处理,决策权与数据归平台。然后还有统一安全层,内容过滤、功能开放由平台集中管理——这正是扎克伯格担心的“技术权力过度集中”。

他还提到一个「自下而上」的路径,让个人技术去驱动繁荣。

20 世纪八十年代个人电脑出来后,Macintosh 把 GUI 与创意工具带到普通人桌面,催生桌面排版与数字设计行业。后来 21 世纪互联网博客以及油管这种创作平台出来后,迎来了网络文化生态的爆发。随后智能手机加应用商店,数百万独立开发者面向全球几十亿用户分发服务,诞生出了一堆超级应用。

这些案例的共同点都是「控制权」与「创新动能」从中心转向个人,带来的影响就是经济文化呈指数级长尾扩散。

Meta 把个人超级智能(PSI)描述为下一次跳跃,把几乎「博士级」的认知与创作能力缩到口袋和眼镜里,让普通个体也能获得专业能力去做专业的事。

Meta 的 AI 坎坷之路

听起来很高大上是吧,这一次光是挖人就搞的轰轰烈烈,把硅谷科技公司搞得人心惶惶,生怕下一个被挖的就是自家核心人物。

所以为啥 Meta 这一次忽然发狠呢?金融时报更是称比以前更有凝聚力了(more cohesive)。

An image to describe post

你品一品。

当下 AI 战略很清晰,通过新成立的 Meta Super-intelligence Labs、双线并行的 AI Products / AGI Foundations 架构与千亿美元级算力投资,把所有研究、产品、硬件叙事都捆在同一个目标上。

但是相比之下,2023 年呢,战略像一坨七零八碎的拼图,同年 2 月刚成立 Generative AI product group 不久就又推出开源 LLaMA,与 FAIR、Reality Labs 之间缺少统一产品路线;外部定位上,“AI” 与 “元宇宙” 两条叙事并行,却互相稀释资源和投资者注意力。

这就不得不讲一下 Llama 的屈辱史以及 meta 在大语言模型上的失败…还有他们内部自己都不用 Llama 辅助。🤣

时间 经核查关键事件 影响与细节
2023-03-03 LLaMA-1 论文发布后不足一周即被完整权重包上传至 4chan 种子论坛并迅速扩散。 - 研究许可证瞬间失效,任何人均可重训、魔改。 <br>- Meta 试图发送 GitHub 下架通知,但为时已晚;模型成为“全民开源起点”。 <br>- 美国参议员就泄露安全隐患向 Meta 致函质询。
2023-07-18 Llama 2 改用“Llama Community License”:准商用、用户月活>7亿须另签授权。 - OSI 明确声明“并非真正开源”,限制性条款引发社区抵触。 <br>- 创业者与开发者转向更宽松的 Mistral、DeepSeek 等新秀模型,Llama 下载增速被反超。
2024-04-02 内部代码助手 Metamate 推出;默认先调用 Llama,遇到复杂问题回落 GPT-4 兜底。 - 员工私下调侃“Llama ≠ Meta LLM”,对自研模型信心受挫。 <br>- 暴露 Llama 在代码推理、长链调用等场景下仍逊色 GPT-4。
2024-12-04 离职员工匿名 memo 披露:“方向漂移、缺共识”,质疑管理层只求“发布里程碑”。 - 华尔街分析师开始下调 Llama 商业化预期,Meta 股价当月回调8%。
2025-04-05 Llama 4 三款 MoE 版本发布:Behemoth(2T 参数,待完工)、Maverick、Scout。 - 官方宣称与 GPT-4o“旗鼓相当”,但独立评测显示 Maverick 仍落后 GPT-4o、DeepSeek V3 在复杂推理与编程任务上的一致性。 <br>- 社区批评“冲榜优先”,多项基准被指数据“污染”;Meta 高层连夜澄清。

一年多里,Llama 经历“泄露—许可证争议—性能掉队”三连击,错失了抢占生态的最佳窗口。员工与投资者对 Llama 信心下降,导致人才流失(原 14 名作者走掉 11 名)。

An image to describe post

所以现在可能是有点急了,不得不开始砸钱开始猛干了。

具体「更有凝聚力」体现在哪?

旧模式(≤ 2023) 新模式(2025 起)
多中心:FAIR / Gen-AI / Reality Labs 各守一摊 Meta Super-intelligence Labs (MSL) 成为唯一“顶层实验室”
模型研发→产品迁移链条长 AI Products 与 AGI Foundations 并列,两周迭代一版 demo,统一指标体系
算力按业务部申请 设立 Hyperion 级别 5 GW 数据中心池,直接对 MSL 开放预留
招人各自面试 最高层亲自“挖墙脚”,给 50 + 顶尖科学家开出据传最高 9 位数签约包

小扎亲自下场来找人了。

而且 superintelligence 的权利巨大,相当于是一个内部的初创公司,不受公司的束缚而且还管着公司一众 AI 相关的事务,此外小扎还承诺投入大量资金。

Meta 凭啥赌

有钱

An image to describe post

法国巴黎银行研究后,认为 superintelligence 招过来这些人后续公司要多花 15 亿美元到 35 亿美元。当然了,在接受 the information 的采访的时候,小扎直言公司有钱,目前的商业模式足以支撑这样「造」。

An image to describe post

首先能看到它的广告营收在 25 年的 Q2 就已经达到了 46 亿,在过往几年其实都达到了一个比较高的水平,97% 的收入都来自于广告。广告的利润你想一想,是很大的。

An image to describe post

一季度净利 166 亿美元,二季度 183 亿美元——半年已赚 350 亿美元。即便后续每年额外支出 15–35 亿美元,也只占一季度利润的 8–19 %,财务上完全“扛得住”。

高溢价买人、大笔砸钱造数据中心,把钱撒着花……

在 5 月份的财报中,Meta 将其全年资本支出预测上调了多达 10%,640 亿到 720 亿美元之间,理由是“额外的​​数据中心投资”以支持其人工智能发展以及“基础设施硬件预期成本的增加”。并且 Meta 还买了一座核电站未来二十年的电力输出来支持其人工智能项目。

不过表面虽然豪横,还是有点力不从,据传 Meta 正寻求筹集 290 亿美元,以资助其全面进军人工智能的计划,并向私人资本公司寻求融资,以在美国建设数据中心。

An image to describe post

有资源

除了有钱,他还有哪些资源?一说到 meta 首先大家想到的肯定是 Facebook、ins 以及 WhatsApp,这些产品加起来每天活跃用户数量就达到了三十多亿人,所以可以想象他只要做出一个产品出来推广速度可以多快,毕竟人家广告业务是王牌。

An image to describe post

「工欲善其事必先利其器」

他们还在同时铺设「算力、数据、硬件终端」三条资源纵深,并与既有社交-广告生态形成闭环。

在算力方面有多座「泰坦级」数据中心在规划建设中,比如Prometheus(俄亥俄)是首个千兆瓦训练超算,500,000+ GPU,现场双燃气发电站。

为什么要搞这么大?为了「快」。

单一园区容纳 500,000+ GPU,可在 一张低延迟 InfiniBand/400 Gbps 网络 下并行训练 10 T+ 参数模型,直接减少跨站点梯度同步,训练周期从数月压缩到数周。

并且这样搞还能吸引顶级研究员,试问谁打过这么富裕的仗?

An image to describe post

再看看小扎招了哪些人。

Noam Shazeer(Switch-ML 创始人、前 Google Brain)、Boris Power(前 Anthropic MoE 首席工程师)等人擅长 MoE 级模型架构,这方面 meta 内部经验薄弱。

Haoliang Jiang 是 Claude 长上下文技术负责人,可以帮助解决超长上下文梯度爆炸以及位置编码和缓存机制效率低。想推个人“记忆助手”,海量事件序列是不可避免的。

Alexander Kirillov(SAM)、Jaegle 兄弟(Perceiver 系列)是多模态方面的专家,可以帮助把把 Ray-Ban 眼镜数据转成训练集。

以及一些隐私方面和侧端微调的人才大脑……

其实可不可以比作赛车,顶级大脑是赛车手,算力数据中心就是赛车,燃料自然就是数据。或许这也是 meta斥资 $14.3 B 入股 Scale AI 的原因?直接锁定高质量数据标注团队,降低外采依赖。

再好的车也要有能发挥其全部潜力的车手才行,车手也离不开一辆好车,燃料的质量与数量也决定了他们能跑多快能跑多久。

最后,不要忘了 meta 一直在搞的终端设备Ray-Ban Meta 智能眼镜(2024–25 出货 >200 万副),这种个人的终端设备就是个人超级智能的承载工具,24 h 贴身多模态传感器 + 私域上下文入口。

An image to describe post

以及还有一些腕表头显等等,为“体验任何冒险”提供沉浸式渲染与手势/生理数据输入。眼镜年销量突破 200 万、副活跃摄像头超 400 万颗,侧端入口已成规模,现在不抓紧搞啥时候开始。

AI + Meta??

我看到扎克伯格公开发布的那封信提到是要去帮助用户实现目标,创造理想世界,体验任何冒险。这有点像是将 AI 大模型和 VR/AR 硬件深度融合,然后构建一个元宇宙一样的概念。

又要冒险,要创造东西,我一瞬间就想到了电影《头号玩家》。

An image to describe post

Meta 认为智能眼镜将成为未来主要计算设备。这一硬件形态天然适合融合个人AI助理(PSI)功能:眼镜上的摄像头、麦克风使AI可以“看到我们所见、听到我们所听”,随时理解用户所处环境并提供帮助。

凭借 AR 眼镜和 AI,用户能够在真实环境中叠加自己想要的数字信息和虚拟元素,实现对现实环境的个性化“改造”。例如,在自家客厅通过眼镜投射出一面虚拟巨幕影院,或是在办公桌上让AI生成一只可爱的虚拟宠物与你互动陪伴。

未来,每个人的眼镜所见都可以是独一无二的“增强现实”:你可以选择将周围环境渲染成科幻风格或者森林小径,AI会实时将建筑换成你喜欢的风格,天空中飘浮着你的创意数字艺术。

扎克伯格提出,让个人AI帮助人们“创造你想看到的世界,体验任何冒险”。这意味着在 Meta 的元宇宙中,每个人都可以成为创世者:用户可以按照自己喜好定制虚拟住宅的风格、打造只属于自己朋友圈的小型虚拟社交岛屿,甚至由AI根据你的梦境生成独特的世界供你探索。

元宇宙不再只是一个大型社交平台,更是现实的延伸和个性化投影

不过当然,以上都是一些猜想,具体它要怎么去实现,我也不知道。

只是信里面说的是「个人主导」,其实也离不开他们自家的超算,应该还是中心-边缘混合,所谓的「个体主导」可能更像是「隐私隔离 + 长期个性化 + 端侧微调」,而不是完全的去中心化。

第二就是要为全球几十亿人去打造个人的超级助手,让每个人都能拥有和专业机构一样的研究能力,可能有点太高大上了?

因为首先,这个算力资源以及说能买得起你这个设备可能都是一个问题。最简单的,首先就是你买一个 Meta 眼镜,可能都要几百美金,然后你未来还需要去加一些侧端的算力的上面,那可能价格就更高了。当然,可能未来这个价格也是会慢慢降低,就像现在手机的价格,成本是会慢慢降下来的。

一旦你获取这个东西需要门槛,那可能就不能让所有人都去拥有。

有资源的群体 24 小时都有一个 AI 导师,然后又有个人实验室,人才积累曲线一下就陡升。但是没有资源的群体,还是在依赖传统的教育,信息隔层被放大。有资源的群体还可以去随手生成代码、3D图,零门槛地去创作,并且他可以去让 AI 帮他去理财,帮他去自动创作变现,形成一个飞轮。

最终结果就是「AI 新贫富分化”」的马太效应加剧。


个人网站:yrzhe.top