本文译自 UX 领域先驱 Jakob Nielsen 发表于其 Substack 的文章《Intent by Discovery: Designing the AI User Experience》(2026 年 3 月 26 日)。Nielsen 是可用性工程的奠基人,提出了著名的“十大可用性启发式原则”和“雅各布定律”,从业逾 43 年。本译文力求信达雅,供中文读者参考。
摘要: AI 不只是更好的聊天框。它改变了用户的角色——从操作者变为监督者。这迫使 UX 从基于命令的交互,走向基于意图的委托、全新的可用性指标、编排层设计、刻意摩擦,以及最终通过探索来澄清用户需求的交互范式。

AI 作为界面,最重要的事情不是它能用自然语言聊天,而是它改变了用户的角色。AI 将计算从“基于命令的交互”变成了“基于意图的结果指定”:用户陈述想要达到的结果,系统自己决定过程。
在批处理系统中,用户一次性提交整个工作流。在命令式系统中,用户与计算机交替出牌。在意图式系统中,AI 自行推断并执行工作流:你不再告诉计算机怎么做,你告诉它你想要什么,它自己搞定剩下的事。
一个可用的意图至少包含三个部分:期望的结果、约束可接受行为的边界条件,以及定义系统被允许执行哪些操作的委托范围。“帮我规划芝加哥之旅”是欠规范的——除非 AI 也知道预算、不可更改的会议,以及它是被允许直接购票还是只能准备选项供参考。因此,AI UX 的大量工作将在于帮助用户表达不只是“想要什么”,还有“允许系统假设、优化和执行什么”。
意图驱动的交互改变了控制权的归属,而不仅仅是输入方式的表面变化。GUI 的出现是一次巨大飞跃,但从敲命令到点击图标的转变,远小于 AI 带来的交互设计革命。正如我在 2023 年 5 月现代 AI 诞生之初所指出的,这是一个全新的 UI 范式,也是 60 年来继批处理到命令式之后的第一次重大转变。
范式转变带来的,不只是设计和可用性评估方式的更新。AI 改变的是交互语法,而不只是某一个界面:意图式交互不是一种新的输入方法,它改变了决策发生的地方、认知负担的承担者,以及**“错误”的含义**。
在命令式界面(包括 GUI)中,用户在脑子里形成计划,再通过控件执行。界面的设计目标是让计算机“透明”,因为它始终处于用户的计划之内。直接操作之所以令人感到有力,正是因为对可见对象的操作能给出即时反馈,让用户专注于任务本身,而不是系统。
在意图式界面中,用户将计划的一部分外包出去:他们不再是在导航,而是在委托。系统现在必须解读目标、选择子目标、安排行动、获取权限、处理异常。这将系统推入了自动化的经典角色——人因工程研究已在这一领域深耕数十年:一旦自动化接管了规划和行动选择,用户就从操作者变成了监督者。监督式控制与直接操作有着不同的失效模式,需要不同的设计保障机制。
未来十年的赢家,不会是按钮最美观的系统,也不会是屏幕最少的系统。它将是最能理解用户“待办之事”、代表用户自主选择合适工具、清晰展示即将发生的事情、并在用户上下文不完整或模糊时能够优雅恢复的系统。
UX 目标的三个时代

UX 设计从未有过一个固定的目标。它已经转变了两次,现在正在经历第三次。
第一时代:商业计算(1960–1995)。主流应用是会计软件、文字处理器、薪资系统。UX 目标是生产力:帮助人们更快学会软件、减少出错、提高每小时的产出。我曾对客户说,他们的培训预算就是一块等着被可用性吃掉的猪排——设计良好的系统可以将上手时间缩短一半。
第二时代:互联网(1995–2025)。网络将 UX 目标转向影响力:让用户购买、订阅、分享,或者刷得足够久以多看几条广告。这个时代大量借助罗伯特·西奥迪尼的影响力原则,如互惠、社会证明、稀缺性。它也给我们带来了暗黑模式和无限滚动。你不为产品付钱,你就是产品。
第三时代:AI(2026 年起)。目标再次转变,转向一个更难命名的东西:增强人类的存在。当 AI 承接日常任务的执行,人类的精力便从中解放,可以用于想象、判断和意义建构。道格·恩格尔巴特最初的愿景是“增强人类智识”,但这个框架现在已经太窄了。AI 时代 UX 的目标,是扩展人类能做和能成为的边界——不只是在软件中能完成什么,而是我们能决定什么、想象什么、协调什么。因此,可用性的定义从“在既定路径上消除摩擦”,转变为“扩展可行路径的范围,开放我们尚未想象到的可能”。
短期危机:表达壁垒
当前基于对话的 AI 界面存在严重的可用性问题。意图式范式要求用户将问题写成散文。然而,识字率研究反复表明,美国、德国等发达国家约有一半人口属于低识字率用户,发展中国家情况更为糟糕。
撰写新的描述性文字,比阅读已有文本在认知上更具挑战性。这造成了巨大的表达壁垒,极大地偏袒那一小撮拥有超凡文字能力的人。“提示词工程”建议的盛行,本身就是这一根深蒂固的可用性失败的经验证明。如果用户被迫学习一套晦涩的技巧才能让 AI 给出正确结果,那这个界面就不符合以人为本的设计标准。
表达壁垒也是一个记忆问题。如果用户每次会话都必须重新陈述偏好、约束条件、语气风格、风险承受度和例外情况,那无论模型听起来多么流畅,界面都依然不可用。因此,成熟的意图式系统需要一个可见且可编辑的用户模型:一个人们可以查看 AI 对自己的理解、加以纠正、临时覆盖或要求遗忘的地方。在 AI 时代,记忆成为一等的 UX 设计面。
重新定义可用性指标
由于控制权的归属已经反转,我们几十年来评估 UX 的核心可用性指标必须被彻底重写。
我的经典可用性启发式原则仍然成立,但必须重新诠释。“系统状态可见性”过去是指:展示用户所选的步骤序列的进度。在智能体工作流中,它变成了:展示系统认为用户意图是什么、它正在做什么来满足该意图、以及它接下来打算做什么——即便这些步骤都不是用户明确要求的。“用户控制与自由”过去是指:允许撤销、取消、逃离对话框或流程。在意图式环境中,它变成了:允许中断正在执行的计划、允许纠正被误解的意图、允许跨多个系统进行安全回滚。当系统已经发送了邮件、订了机票或修改了共享文档,撤销就变得更难了。这个原则比以前更重要,但实现成本也更高。
评估成功界面的标准随之转变:
-
从可发现性到意图捕获:系统能否将模糊的自然语言请求准确映射为高度结构化的机器行动?它是否正确推断了目标、约束和优先级?
-
从错误预防到澄清质量:由于无法通过禁用按钮来防止幻觉,指标转向系统处理歧义的优雅程度。系统是否在正确的时机提出正确的追问?最佳的澄清问题是以最小的干预,避免最大的错误。
-
从“学习时间”到“委托的容易程度”:传统 UI 的可学习性,在没有菜单层级需要理解和导航时变得不那么重要。首要指标变成了:用户能多从容地委托一个多步骤目标,而不担心发生灾难性失败。纠错时间远比效率更重要。
-
从执行效率到验证效率(可评估性):在命令式 UI 中,用户的主要认知负担是逐步执行任务。在意图式系统中,执行是廉价的,但评估成为瓶颈。可用性指标转向用户能以多快的速度、多高的准确率验证 AI 的输出是否符合实际目标。界面必须针对“可评估性”进行优化,让用户无需逐字检查每个细节,就能判断质量与适用性。
-
从系统状态可见性到执行透明性:系统必须在执行之前和执行期间,准确投射其操作计划的心智模型。
-
从用户满意度到信任校准:用户是否适度依赖智能体——既不过度信任,也不废弃不用?信任不再是软性的情感附产品,它是意图式系统的首要功能指标。信任校准还依赖于展示系统为何偏好某个方案。一个好的编排 UI 应当能说:“我选择方案 A 而不是 B,因为成本比速度更重要”,或者“如果你的截止日期移动两天,这个推荐就会改变。”反事实解释往往比笼统的置信度分数更有用,因为它向用户传授了模型的决策逻辑,并指出了何处干预会产生效果。
三层设计模型

界面已死——这个说法乍看有几分道理,因为用户将越来越多地与 AI 智能体交互,而不是点来点去。
然而 GUI 不会消失,它只是被降级了。屏幕不再是工作开始的地方,而是工作被检视、协商和纠正的地方。随着软件从孤立应用走向任务编排,成熟的意图式系统将沉淀为三层设计模型:
第一层:意图层(Intent Surface)。用户在这里表达一个结果。它必须高度感知上下文,接受语音、文字、屏幕上下文或摄像头数据等多模态输入,以克服表达壁垒。随着这一层的成熟,它将越来越多地依赖隐性意图推断:通过综合环境上下文(如日历事件、当前屏幕内容、光标停顿、历史习惯),系统可以主动提出高概率意图供用户确认,替用户起草提示词,从而克服表达壁垒。
第二层:编排层(Orchestration Surface)。这是关键的协商层。在智能体执行高风险行动之前,必须展示其拟定的计划、暴露数据来源、征求同意。这个 UI 充当审计层,可视化步骤,提供执行透明性,管理“权限编排”。
预览还不够。意图式系统还需要明确的行动后回执。智能体完成任务后,UI 应总结它改变了什么、触达了哪些系统、使用了哪些假设、哪些操作还可以撤销。在传统 GUI 中,用户通常知道发生了什么,因为是他们亲手执行了每一步。在智能体系统中,这种隐性知识消失了——系统必须事后制造可读性。
大多数重要工作不是孤立进行的。在组织中,智能体在共享系统、共享预算、共享职责中行事。编排层因此必须展示它不只是为我做了什么,还有谁会受到影响、哪些规章约束了这一行动、谁来承担后果。企业 UX 中的意图,从来不只是个人偏好,而是经过机构规则过滤的个人偏好。编排层必须因此解决协作意图——标记多个人类利益相关者或专业 AI 子智能体之间相互冲突的指令,并在执行前协商出共识。
第三层:直接操作层(Direct-Manipulation Surface)。传统 GUI 作为兜底层完好保留,是那个熟悉的点按、拖拽、滑动的世界,留给边缘情况的编辑、细粒度修正和紧急覆盖。
因此,直接操作不会消亡;它向上迁移了一个抽象层级。用户操作的不再是原始控件,而是计划。他们会把任务从“稍后”拖到“现在”,在时间轴上滑动浏览提议的步骤序列,点击来源标签检查数据出处,或重新排列旅行行程——这仍然是直接操作,保留了塑造因果关系的生理满足感,只是应用在了更高的抽象层级上。
监督式控制与刻意认知摩擦

由于意图式界面带来的现象学鸿沟(行动在屏幕之外发生,无需身体直接介入),用户的角色发生了深刻转变。恰当的类比不再是驾驶汽车,而是管理一位司机。
这种监督式控制需要一套全然不同的设计原则。每一位在命令式时代成长的 UX 设计师的本能,都是无情地消除摩擦。对于日常的低风险任务(过滤垃圾邮件、安排例行会议),零摩擦的理想仍然正确。但对于高风险任务(金融交易、医疗决策、发送敏感邮件),界面必须刻意放慢用户的脚步。
自主权应当是赚来的,而不是一次性全部授予的。有效的智能体应从保守模式开始——只起草、准备,并寻求确认——同时在有限领域内积累绩效记录。随着可靠性得到证明,界面可以让用户逐步扩大智能体的行动预算:先是起草,再是准备,再是执行低风险操作,最后才涉及高风险或对外可见的系统。正确的模型不是自主与手动控制的二元对立,而是渐进式委托。
我们必须精心编排刻意的认知摩擦。生成式 AI 经常给出听起来无懈可击的答案,导致“合理性陷阱”:界面干净而即时,权威偏见随之而来,用户忍不住跳过批判性分析。
为了对抗这种危险的自动化偏见,我们必须强制一个反思的瞬间。当 AI 提议转账 500 美元时,不应提供流畅的“全部批准”按钮。我们必须使用细粒度授权、人工时延(如三秒倒计时)和来源高亮,确保人类在认知层面对结果负责。
摩擦不应是一刀切的延迟,而应被精准施加。UX 必须以视觉方式传达 AI 的置信度,让用户清楚地知道在哪里投入认知精力。我们需要认识论 UI(Epistemic UI):以视觉方式映射系统不确定性的界面。与其将综合答案呈现为铁板一块的权威事实,UI 应高亮概率跳跃、标记来源薄弱的数据、用颜色编码置信度等级。通过可视化 AI 自身的疑虑,界面将人类的认知资源精准引导至需要判断的区域,将摩擦从粗暴的延迟变为精密的工具。
慢速 AI:僵尸 UX 的回归
随着我们将越来越复杂的工作流托付给 AI,一个古怪的历史幽灵正在复苏:批处理时代的“僵尸 UX”。简单的对话查询只需几秒,但 Deep Research 或视频生成等强大工具可能需要十分钟乃至数小时。我们正快速逼近 AI 智能体独立运行三十小时乃至数天来编排大规模任务的现实。
当极端延迟打破了一问一答的交互节奏,我们必须为“慢速 AI”而设计。等待数小时的结果会带来强烈的焦虑:AI 是否走在正确的方向上?
为维护用户控制,慢速 AI 需要专门的 UX 干预:
1. 澄清与运行合约:慢速 AI 决不应猜测用户意图。它必须预先提问澄清,然后提供一份明确的运行合约,显示预计时间窗口、成本上限、“完成”的定义,以及硬性边界(如“不会向外部方发送邮件”)。
2. 概念性面包屑:传统百分比进度条对十小时任务毫无用处。AI 不只是抛出技术日志,还必须提供“概念性面包屑”——中间结论的简短摘要。如果 AI 早早报告了一个有缺陷的结论,用户可以立即介入。
3. 上下文重新登机(Context Reboarding):任务耗时三十小时,用户早已切换上下文,忘了最初问的是什么。UI 必须通过“复述摘要”优雅地将用户带回来:提醒他们原始意图、运行期间做出的关键决策、以及当前状态。
4. 分级通知:必须采用感知上下文的注意力管理。通知应分级:需要用户介入的关键阻塞事项推送即时通知,仅影响质量的决策发低优先级邮件,任务完成则打包汇总推送。
5. 渐进式披露与残值(Salvage Value):长时间运行的任务会激化沉没成本谬误——用户等了二十小时,即便结果差强人意也会接受。UI 必须渐进式披露部分结果(粗略大纲、线框图),让用户能早早纠偏。至关重要的是,如果用户中止运行,UI 必须明确展示“残值”——哪些中间产物可以复用——让重新启动在心理上不那么痛苦。
长远愿景:探索潜在空间

展望 AI 时代更远处,创造力从制作转向发现。我们正从构建(前 AI 时代)和描述(当前意图式生成)走向探索——探索由 AI 创造的潜在解决方案空间。
既然 AI 能在一分钟内生成上千个称职的方案,用户最主要的需求不再是生产,而是发现。迭代不再主要是修复错误,而是探索一个多维度的解决方案空间。然而,当前 UI 线性得过分,还在依赖老派的“返回”按钮。未来的 UX 需要 UI 支持多分支的探索导航。我们将需要“Look Lock”之类的工具——在探索相邻维度时冻结某些语义风格或视觉不变量。未来的界面将不像通道,更像协作游乐场。
**“意图源于发现(Intent by Discovery)”**应成为人机交互的未来。不要假设用户知道自己想要什么。帮助他们通过对备选方案做出反应、锁定重要的元素、探索相邻的可能性,逐步认识到他们想要的是什么。
以下是我对 UX 设计如何演进以支持“意图源于发现”的预测:
1. 潜在空间的空间导航:未来 UX 将让用户以视觉和空间方式导航 AI 的潜在空间。用户可能看到一张由生成输出构成的交互式二维地图,在其中拖动光标时,输出实时变形。用户通过无缝探索相邻可能性来发现自己的意图,在输出“感觉对了”时停下来。
2. 直接对象操作(融合 GUI 与 AI):用户将通过物理修改 AI 的输出来精炼意图。如果 AI 生成了一个网站模型或平面图,用户拖动主视觉或墙壁使之变大,AI 不只是记录坐标变化,而是反向推断底层意图(“用户重视视觉冲击和开阔空间”),自动调整排版、光线或次要元素以保持整体连贯。触觉操作本身成为提示词。
3. 苏格拉底式搭手架:系统必须从被动的接单员,转变为主动的访谈者。如果用户的初始意图模糊(“我需要一个产品发布策略”), AI 应暂停,而不是凭空生成一份通用的十页文档。它以诊断性问题或视觉反例来回应:“我们是在优化即时营收还是长期品牌认知?”通过主动呈现约束条件,AI 帮助用户凿去多余的部分,直到他们确切的意图浮现出来。
4. 生成式与即时 UI:未来,生成式 UI 将根据用户的涌现上下文,实时生成界面本身。如果 AI 检测到用户正在探索一段音乐的情绪或数据库的逻辑,它会动态生成专属的 UI 控件(自定义滑块、可视化节点图、参考板),专门服务于这一发现时刻。一旦意图锁定,这些控件便消散。
5. 策展即意图:文字是传达复杂想法、氛围或美感的低带宽方式。“意图源于发现”将越来越多地依赖多模态策展。用户可以将一堆杂乱的素材扔到数字画布上:竞品报告的 PDF、从照片中提取的色板、一段十秒的语音备忘。系统将它们组织起来,找到概念上的交叉,合成一个起点。用户通过看 AI 如何将他们碎片化的灵感连接起来,发现自己的意图。
6. 减法式雕刻:当前的提示词范式是加法式的——用户通过添加更多词汇来构建结果。但发现往往在减法中更为容易。未来的 AI UX 将频繁依赖“先生成一个过于丰富的最大化版本(超详细文档、复杂代码、繁密设计),用户的交互模式则是删除、划掉、削减不想要的部分”。对人类来说,编辑和删除比从空白处生成要容易得多。
UX 设计师的未来角色
在这一新范式中,UX 设计师的角色发生了戏剧性的转变。他们不再设计线性的用户流(屏幕 A → 屏幕 B → 屏幕 C),而是构架可能性空间——设计边界约束、潜在空间的“物理规则”,以及这些生成式环境的反馈回路。
然而,我们必须对行业中“零学习理想”的痴迷保持警惕。那个乌托邦式的愿景——用户只需许下愿望,AI 便在屏幕外无缝执行——隐藏着代价。如果用户从不需要学习系统如何运作、在层级中导航或做出决策,他们将遭受认知卸载和技能退化,沦为数字生活中的乘客,困于“认知萎缩循环”,分析性参与逐步退化。
这是 UX 从业者的终极使命:我们的设计不能充当替代人类能动性的认知轮椅,而必须充当支撑和增强人类繁荣的认知外骨骼——即便传统意义上的工作已经消失。好的 AI UX 会适度传授知识,展示计划结构,留下清晰可循的行动轨迹,让用户得以保持数字判断力。
消失的是人类执行繁琐步骤的假设。我们正进入一个管理自主司机的复杂时代。下一个十年的赢家设计,将是那些理解待办之事、通过三层界面透明地编排解决方案、在高风险之处要求摩擦、并在关键时刻保留清晰的人类权威的设计。
设计这种委托而不失控的微妙关系,是下一个十年最大的 UX 挑战。让我们开始吧。
原文:Intent by Discovery: Designing the AI User Experience — Jakob Nielsen,2026 年 3 月 26 日
译者注:本译文由 saga su 翻译整理