译文：从意图到发现:设计 AI 时代的用户体验

本文译自 UX 领域先驱 Jakob Nielsen 发表于其 Substack 的文章《Intent by Discovery: Designing the AI User Experience》(2026 年 3 月 26 日）。Nielsen 是可用性工程的奠基人，提出了著名的“十大可用性启发式原则”和“雅各布定律”，从业逾 43 年。本译文力求信达雅，供中文读者参考。

摘要： AI 不只是更好的聊天框。它改变了用户的角色——从操作者变为监督者。这迫使 UX 从基于命令的交互，走向基于意图的委托、全新的可用性指标、编排层设计、刻意摩擦，以及最终通过探索来澄清用户需求的交互范式。

An image to describe post

AI 作为界面，最重要的事情不是它能用自然语言聊天，而是它改变了用户的角色。AI 将计算从“基于命令的交互”变成了“基于意图的结果指定”：用户陈述想要达到的结果，系统自己决定过程。

在批处理系统中，用户一次性提交整个工作流。在命令式系统中，用户与计算机交替出牌。在意图式系统中，AI 自行推断并执行工作流：你不再告诉计算机怎么做，你告诉它你想要什么，它自己搞定剩下的事。

一个可用的意图至少包含三个部分：期望的结果、约束可接受行为的边界条件，以及定义系统被允许执行哪些操作的委托范围。“帮我规划芝加哥之旅”是欠规范的——除非 AI 也知道预算、不可更改的会议，以及它是被允许直接购票还是只能准备选项供参考。因此，AI UX 的大量工作将在于帮助用户表达不只是“想要什么”，还有“允许系统假设、优化和执行什么”。

意图驱动的交互改变了控制权的归属，而不仅仅是输入方式的表面变化。GUI 的出现是一次巨大飞跃，但从敲命令到点击图标的转变，远小于 AI 带来的交互设计革命。正如我在 2023 年 5 月现代 AI 诞生之初所指出的，这是一个全新的 UI 范式，也是 60 年来继批处理到命令式之后的第一次重大转变。

范式转变带来的，不只是设计和可用性评估方式的更新。AI 改变的是交互语法，而不只是某一个界面：意图式交互不是一种新的输入方法，它改变了决策发生的地方、认知负担的承担者，以及**“错误”的含义**。

在命令式界面（包括 GUI）中，用户在脑子里形成计划，再通过控件执行。界面的设计目标是让计算机“透明”，因为它始终处于用户的计划之内。直接操作之所以令人感到有力，正是因为对可见对象的操作能给出即时反馈，让用户专注于任务本身，而不是系统。

在意图式界面中，用户将计划的一部分外包出去：他们不再是在导航，而是在委托。系统现在必须解读目标、选择子目标、安排行动、获取权限、处理异常。这将系统推入了自动化的经典角色——人因工程研究已在这一领域深耕数十年：一旦自动化接管了规划和行动选择，用户就从操作者变成了监督者。监督式控制与直接操作有着不同的失效模式，需要不同的设计保障机制。

未来十年的赢家，不会是按钮最美观的系统，也不会是屏幕最少的系统。它将是最能理解用户“待办之事”、代表用户自主选择合适工具、清晰展示即将发生的事情、并在用户上下文不完整或模糊时能够优雅恢复的系统。

UX 目标的三个时代

An image to describe post

UX 设计从未有过一个固定的目标。它已经转变了两次，现在正在经历第三次。

第一时代：商业计算（1960–1995）。主流应用是会计软件、文字处理器、薪资系统。UX 目标是生产力：帮助人们更快学会软件、减少出错、提高每小时的产出。我曾对客户说，他们的培训预算就是一块等着被可用性吃掉的猪排——设计良好的系统可以将上手时间缩短一半。

第二时代：互联网（1995–2025）。网络将 UX 目标转向影响力：让用户购买、订阅、分享，或者刷得足够久以多看几条广告。这个时代大量借助罗伯特·西奥迪尼的影响力原则，如互惠、社会证明、稀缺性。它也给我们带来了暗黑模式和无限滚动。你不为产品付钱，你就是产品。

第三时代：AI(2026 年起）。目标再次转变，转向一个更难命名的东西：增强人类的存在。当 AI 承接日常任务的执行，人类的精力便从中解放，可以用于想象、判断和意义建构。道格·恩格尔巴特最初的愿景是“增强人类智识”，但这个框架现在已经太窄了。AI 时代 UX 的目标，是扩展人类能做和能成为的边界——不只是在软件中能完成什么，而是我们能决定什么、想象什么、协调什么。因此，可用性的定义从“在既定路径上消除摩擦”，转变为“扩展可行路径的范围，开放我们尚未想象到的可能”。

短期危机：表达壁垒

当前基于对话的 AI 界面存在严重的可用性问题。意图式范式要求用户将问题写成散文。然而，识字率研究反复表明，美国、德国等发达国家约有一半人口属于低识字率用户，发展中国家情况更为糟糕。

撰写新的描述性文字，比阅读已有文本在认知上更具挑战性。这造成了巨大的表达壁垒，极大地偏袒那一小撮拥有超凡文字能力的人。“提示词工程”建议的盛行，本身就是这一根深蒂固的可用性失败的经验证明。如果用户被迫学习一套晦涩的技巧才能让 AI 给出正确结果，那这个界面就不符合以人为本的设计标准。

表达壁垒也是一个记忆问题。如果用户每次会话都必须重新陈述偏好、约束条件、语气风格、风险承受度和例外情况，那无论模型听起来多么流畅，界面都依然不可用。因此，成熟的意图式系统需要一个可见且可编辑的用户模型：一个人们可以查看 AI 对自己的理解、加以纠正、临时覆盖或要求遗忘的地方。在 AI 时代，记忆成为一等的 UX 设计面。

重新定义可用性指标

由于控制权的归属已经反转，我们几十年来评估 UX 的核心可用性指标必须被彻底重写。

我的经典可用性启发式原则仍然成立，但必须重新诠释。“系统状态可见性”过去是指：展示用户所选的步骤序列的进度。在智能体工作流中，它变成了：展示系统认为用户意图是什么、它正在做什么来满足该意图、以及它接下来打算做什么——即便这些步骤都不是用户明确要求的。“用户控制与自由”过去是指：允许撤销、取消、逃离对话框或流程。在意图式环境中，它变成了：允许中断正在执行的计划、允许纠正被误解的意图、允许跨多个系统进行安全回滚。当系统已经发送了邮件、订了机票或修改了共享文档，撤销就变得更难了。这个原则比以前更重要，但实现成本也更高。

评估成功界面的标准随之转变：

从可发现性到意图捕获：系统能否将模糊的自然语言请求准确映射为高度结构化的机器行动？它是否正确推断了目标、约束和优先级？
从错误预防到澄清质量：由于无法通过禁用按钮来防止幻觉，指标转向系统处理歧义的优雅程度。系统是否在正确的时机提出正确的追问？最佳的澄清问题是以最小的干预，避免最大的错误。
从“学习时间”到“委托的容易程度”：传统 UI 的可学习性，在没有菜单层级需要理解和导航时变得不那么重要。首要指标变成了：用户能多从容地委托一个多步骤目标，而不担心发生灾难性失败。纠错时间远比效率更重要。
从执行效率到验证效率（可评估性）：在命令式 UI 中，用户的主要认知负担是逐步执行任务。在意图式系统中，执行是廉价的，但评估成为瓶颈。可用性指标转向用户能以多快的速度、多高的准确率验证 AI 的输出是否符合实际目标。界面必须针对“可评估性”进行优化，让用户无需逐字检查每个细节，就能判断质量与适用性。
从系统状态可见性到执行透明性：系统必须在执行之前和执行期间，准确投射其操作计划的心智模型。
从用户满意度到信任校准：用户是否适度依赖智能体——既不过度信任，也不废弃不用？信任不再是软性的情感附产品，它是意图式系统的首要功能指标。信任校准还依赖于展示系统为何偏好某个方案。一个好的编排 UI 应当能说：“我选择方案 A 而不是 B，因为成本比速度更重要”，或者“如果你的截止日期移动两天，这个推荐就会改变。”反事实解释往往比笼统的置信度分数更有用，因为它向用户传授了模型的决策逻辑，并指出了何处干预会产生效果。

三层设计模型

An image to describe post

界面已死——这个说法乍看有几分道理，因为用户将越来越多地与 AI 智能体交互，而不是点来点去。

然而 GUI 不会消失，它只是被降级了。屏幕不再是工作开始的地方，而是工作被检视、协商和纠正的地方。随着软件从孤立应用走向任务编排，成熟的意图式系统将沉淀为三层设计模型：

第一层：意图层（Intent Surface）。用户在这里表达一个结果。它必须高度感知上下文，接受语音、文字、屏幕上下文或摄像头数据等多模态输入，以克服表达壁垒。随着这一层的成熟，它将越来越多地依赖隐性意图推断：通过综合环境上下文（如日历事件、当前屏幕内容、光标停顿、历史习惯），系统可以主动提出高概率意图供用户确认，替用户起草提示词，从而克服表达壁垒。

第二层：编排层（Orchestration Surface）。这是关键的协商层。在智能体执行高风险行动之前，必须展示其拟定的计划、暴露数据来源、征求同意。这个 UI 充当审计层，可视化步骤，提供执行透明性，管理“权限编排”。

预览还不够。意图式系统还需要明确的行动后回执。智能体完成任务后，UI 应总结它改变了什么、触达了哪些系统、使用了哪些假设、哪些操作还可以撤销。在传统 GUI 中，用户通常知道发生了什么，因为是他们亲手执行了每一步。在智能体系统中，这种隐性知识消失了——系统必须事后制造可读性。

大多数重要工作不是孤立进行的。在组织中，智能体在共享系统、共享预算、共享职责中行事。编排层因此必须展示它不只是为我做了什么，还有谁会受到影响、哪些规章约束了这一行动、谁来承担后果。企业 UX 中的意图，从来不只是个人偏好，而是经过机构规则过滤的个人偏好。编排层必须因此解决协作意图——标记多个人类利益相关者或专业 AI 子智能体之间相互冲突的指令，并在执行前协商出共识。

第三层：直接操作层（Direct-Manipulation Surface）。传统 GUI 作为兜底层完好保留，是那个熟悉的点按、拖拽、滑动的世界，留给边缘情况的编辑、细粒度修正和紧急覆盖。

因此，直接操作不会消亡；它向上迁移了一个抽象层级。用户操作的不再是原始控件，而是计划。他们会把任务从“稍后”拖到“现在”，在时间轴上滑动浏览提议的步骤序列，点击来源标签检查数据出处，或重新排列旅行行程——这仍然是直接操作，保留了塑造因果关系的生理满足感，只是应用在了更高的抽象层级上。

监督式控制与刻意认知摩擦

An image to describe post

由于意图式界面带来的现象学鸿沟（行动在屏幕之外发生，无需身体直接介入），用户的角色发生了深刻转变。恰当的类比不再是驾驶汽车，而是管理一位司机。

这种监督式控制需要一套全然不同的设计原则。每一位在命令式时代成长的 UX 设计师的本能，都是无情地消除摩擦。对于日常的低风险任务（过滤垃圾邮件、安排例行会议），零摩擦的理想仍然正确。但对于高风险任务（金融交易、医疗决策、发送敏感邮件），界面必须刻意放慢用户的脚步。

自主权应当是赚来的，而不是一次性全部授予的。有效的智能体应从保守模式开始——只起草、准备，并寻求确认——同时在有限领域内积累绩效记录。随着可靠性得到证明，界面可以让用户逐步扩大智能体的行动预算：先是起草，再是准备，再是执行低风险操作，最后才涉及高风险或对外可见的系统。正确的模型不是自主与手动控制的二元对立，而是渐进式委托。

我们必须精心编排刻意的认知摩擦。生成式 AI 经常给出听起来无懈可击的答案，导致“合理性陷阱”：界面干净而即时，权威偏见随之而来，用户忍不住跳过批判性分析。

为了对抗这种危险的自动化偏见，我们必须强制一个反思的瞬间。当 AI 提议转账 500 美元时，不应提供流畅的“全部批准”按钮。我们必须使用细粒度授权、人工时延（如三秒倒计时）和来源高亮，确保人类在认知层面对结果负责。

摩擦不应是一刀切的延迟，而应被精准施加。UX 必须以视觉方式传达 AI 的置信度，让用户清楚地知道在哪里投入认知精力。我们需要认识论 UI(Epistemic UI)：以视觉方式映射系统不确定性的界面。与其将综合答案呈现为铁板一块的权威事实，UI 应高亮概率跳跃、标记来源薄弱的数据、用颜色编码置信度等级。通过可视化 AI 自身的疑虑，界面将人类的认知资源精准引导至需要判断的区域，将摩擦从粗暴的延迟变为精密的工具。

慢速 AI：僵尸 UX 的回归

随着我们将越来越复杂的工作流托付给 AI，一个古怪的历史幽灵正在复苏：批处理时代的“僵尸 UX”。简单的对话查询只需几秒，但 Deep Research 或视频生成等强大工具可能需要十分钟乃至数小时。我们正快速逼近 AI 智能体独立运行三十小时乃至数天来编排大规模任务的现实。

当极端延迟打破了一问一答的交互节奏，我们必须为“慢速 AI”而设计。等待数小时的结果会带来强烈的焦虑：AI 是否走在正确的方向上？

为维护用户控制，慢速 AI 需要专门的 UX 干预：

1. 澄清与运行合约：慢速 AI 决不应猜测用户意图。它必须预先提问澄清，然后提供一份明确的运行合约，显示预计时间窗口、成本上限、“完成”的定义，以及硬性边界（如“不会向外部方发送邮件”）。

2. 概念性面包屑：传统百分比进度条对十小时任务毫无用处。AI 不只是抛出技术日志，还必须提供“概念性面包屑”——中间结论的简短摘要。如果 AI 早早报告了一个有缺陷的结论，用户可以立即介入。

3. 上下文重新登机（Context Reboarding）：任务耗时三十小时，用户早已切换上下文，忘了最初问的是什么。UI 必须通过“复述摘要”优雅地将用户带回来：提醒他们原始意图、运行期间做出的关键决策、以及当前状态。

4. 分级通知：必须采用感知上下文的注意力管理。通知应分级：需要用户介入的关键阻塞事项推送即时通知，仅影响质量的决策发低优先级邮件，任务完成则打包汇总推送。

5. 渐进式披露与残值（Salvage Value）：长时间运行的任务会激化沉没成本谬误——用户等了二十小时，即便结果差强人意也会接受。UI 必须渐进式披露部分结果（粗略大纲、线框图），让用户能早早纠偏。至关重要的是，如果用户中止运行，UI 必须明确展示“残值”——哪些中间产物可以复用——让重新启动在心理上不那么痛苦。

长远愿景：探索潜在空间

An image to describe post

展望 AI 时代更远处，创造力从制作转向发现。我们正从构建（前 AI 时代）和描述（当前意图式生成）走向探索——探索由 AI 创造的潜在解决方案空间。

既然 AI 能在一分钟内生成上千个称职的方案，用户最主要的需求不再是生产，而是发现。迭代不再主要是修复错误，而是探索一个多维度的解决方案空间。然而，当前 UI 线性得过分，还在依赖老派的“返回”按钮。未来的 UX 需要 UI 支持多分支的探索导航。我们将需要“Look Lock”之类的工具——在探索相邻维度时冻结某些语义风格或视觉不变量。未来的界面将不像通道，更像协作游乐场。

**“意图源于发现（Intent by Discovery）”**应成为人机交互的未来。不要假设用户知道自己想要什么。帮助他们通过对备选方案做出反应、锁定重要的元素、探索相邻的可能性，逐步认识到他们想要的是什么。

以下是我对 UX 设计如何演进以支持“意图源于发现”的预测：

1. 潜在空间的空间导航：未来 UX 将让用户以视觉和空间方式导航 AI 的潜在空间。用户可能看到一张由生成输出构成的交互式二维地图，在其中拖动光标时，输出实时变形。用户通过无缝探索相邻可能性来发现自己的意图，在输出“感觉对了”时停下来。

2. 直接对象操作（融合 GUI 与 AI）：用户将通过物理修改 AI 的输出来精炼意图。如果 AI 生成了一个网站模型或平面图，用户拖动主视觉或墙壁使之变大，AI 不只是记录坐标变化，而是反向推断底层意图（“用户重视视觉冲击和开阔空间”），自动调整排版、光线或次要元素以保持整体连贯。触觉操作本身成为提示词。

3. 苏格拉底式搭手架：系统必须从被动的接单员，转变为主动的访谈者。如果用户的初始意图模糊（“我需要一个产品发布策略”）, AI 应暂停，而不是凭空生成一份通用的十页文档。它以诊断性问题或视觉反例来回应：“我们是在优化即时营收还是长期品牌认知？”通过主动呈现约束条件，AI 帮助用户凿去多余的部分，直到他们确切的意图浮现出来。

4. 生成式与即时 UI：未来，生成式 UI 将根据用户的涌现上下文，实时生成界面本身。如果 AI 检测到用户正在探索一段音乐的情绪或数据库的逻辑，它会动态生成专属的 UI 控件（自定义滑块、可视化节点图、参考板），专门服务于这一发现时刻。一旦意图锁定，这些控件便消散。

5. 策展即意图：文字是传达复杂想法、氛围或美感的低带宽方式。“意图源于发现”将越来越多地依赖多模态策展。用户可以将一堆杂乱的素材扔到数字画布上：竞品报告的 PDF、从照片中提取的色板、一段十秒的语音备忘。系统将它们组织起来，找到概念上的交叉，合成一个起点。用户通过看 AI 如何将他们碎片化的灵感连接起来，发现自己的意图。

6. 减法式雕刻：当前的提示词范式是加法式的——用户通过添加更多词汇来构建结果。但发现往往在减法中更为容易。未来的 AI UX 将频繁依赖“先生成一个过于丰富的最大化版本（超详细文档、复杂代码、繁密设计），用户的交互模式则是删除、划掉、削减不想要的部分”。对人类来说，编辑和删除比从空白处生成要容易得多。

UX 设计师的未来角色

在这一新范式中，UX 设计师的角色发生了戏剧性的转变。他们不再设计线性的用户流（屏幕 A → 屏幕 B → 屏幕 C），而是构架可能性空间——设计边界约束、潜在空间的“物理规则”，以及这些生成式环境的反馈回路。

然而，我们必须对行业中“零学习理想”的痴迷保持警惕。那个乌托邦式的愿景——用户只需许下愿望，AI 便在屏幕外无缝执行——隐藏着代价。如果用户从不需要学习系统如何运作、在层级中导航或做出决策，他们将遭受认知卸载和技能退化，沦为数字生活中的乘客，困于“认知萎缩循环”，分析性参与逐步退化。

这是 UX 从业者的终极使命：我们的设计不能充当替代人类能动性的认知轮椅，而必须充当支撑和增强人类繁荣的认知外骨骼——即便传统意义上的工作已经消失。好的 AI UX 会适度传授知识，展示计划结构，留下清晰可循的行动轨迹，让用户得以保持数字判断力。

消失的是人类执行繁琐步骤的假设。我们正进入一个管理自主司机的复杂时代。下一个十年的赢家设计，将是那些理解待办之事、通过三层界面透明地编排解决方案、在高风险之处要求摩擦、并在关键时刻保留清晰的人类权威的设计。

设计这种委托而不失控的微妙关系，是下一个十年最大的 UX 挑战。让我们开始吧。

原文：Intent by Discovery: Designing the AI User Experience — Jakob Nielsen,2026 年 3 月 26 日

译者注：本译文由 saga su 翻译整理

#意图式交互 #人机信任 #UX范式转变