1
让我们回想下,我们去浏览器搜索一个内容,比如“AI 在医疗行业应用”。按下搜索后,搜索引擎快速地处理这个查询,返回一系列结果。这些结果包括各种文章、研究报告、新闻和视频,每一个都链接到不同的网站。用户可以查看这些链接,了解人工智能在医疗行业相关内容。
搜索结果通常按相关性排序,最相关的内容会显示在最前面。用户可以通过阅读标题和简短的摘要来快速判断哪些内容最符合他们的需求。
但这样的搜索并不能很好地满足我们搜索的意图。
2
一般而言,用户搜索目的是多样的:
导航意图:用户想要找到并访问某个特定的网站或网页,比如搜索"百度"或"微博"等,目的是直接导航到这些网站。
信息需求:用户想要获取某个主题的信息或知识,比如搜索"彩虹是怎么形成的"或"如何减肥"等,表明了对相关信息的需求。
交易意图:用户想要完成某种交易行为,比如购买产品或服务,搜索类似"在线购买iphone15"或"笔记本电脑优惠"等查询。
商业调研意图:与交易意图相似,但用户处于产品或服务的调研比较阶段,还未做出购买决定。搜索类似"最好的耳机"或"营销公司评论"等。
本地化需求:用户需要查找附近的本地商家、服务或景点信息,比如搜索"附近的餐馆"或"xx市的水暖工"等。
另外,有些查询可能混合了多种搜索意图。因而,准确把握用户的搜索目的对于提供相关内容和优化搜索体验至关重要。
3
当然,搜索引擎为了准确把握用户的搜索目的,做出了诸多努力:
比如自然语言处理(NLP),利用先进的自然语言处理技术,不仅仅是简单匹配关键词,而是努力理解查询语句背后的上下文和意图,判断是导航、信息、交易等不同类型的搜索目的。
比如语义搜索,理解词语之间的上下文关系和含义,更好地把握自然语言查询背后的用户意图。另外还包括机器学习算法、用户信号和行为分析、查询分类、实体识别等。这些努力的目标都是为了摆脱简单的关键词匹配,朝着更深层次理解用户真正的搜索目的迈进,从而提供更加准确和令人满意的搜索体验。
但这些努力在大模型下,也变得不再强大。而Perplexity这个领域的佼佼者,正在改变传统的搜索体验。
4
相比于传统搜索引擎,Perplexity提供了一个新东西——确定性。比如,它会在所生成内容的某些关键信息后面添加数字小标,你可以根据这些小标,知道这个答案的信息是来自于各种知名媒体报道链接。
Perplexity创始人兼CEO Aravind Srinivas说,「用户可以直接提出任何问题,并得到一个实际的答案,而不仅仅是一个可能包含或不包含答案的网页列表。」
相比于AI搜索,他更愿意称之为「答案引擎」(Answer Engine)。
事实上,答案引擎的历史其实比搜索引擎更古老。1970年代,信息检索领域的研究者就开始制作一种通过自然语言处理(NLP)来访问文本的应用程序。1990年代中期出现的Ask Jeeves服务在网页中提供问答服务。2020年左右,Google也曾探索过通过简单的文本提取方式实现问答服务。
但这样的功能在此前都是比较鸡肋的存在,因为文本提取式问答无法综合多个页面的内容,也无法回答更为复杂的问题。
5
目前,Perplexity产品模式已经得到了市场和同行的认可。而让Perplexity如此不同的原因是在于RAG(Retrieval-Augmented Generation)的检索增强生成技术。这种技术使大型语言模型(LLMs)可以连接到外部知识库,利用从外部来源获取的事实提高生成式AI模型的准确性和可靠性,减少模型本身的「幻觉」。
通过搜索引擎来增强LLM便是一种RAG实现方式。它的核心思路就是在回答用户提问时,先使用搜索引擎检索相关信息,然后把相关信息作为上下文提供给LLM,让它基于这些信息作“推理”并回答问题。这样做有几个好处:
- LLM无法实时获取最新的信息。而搜索引擎可以获取到更加实时的信息。
- LLM有“幻觉”问题,在缺少相关事实信息的情况下,它就会编造。而搜索引擎可以检索出相关的信息,这些信息可以作为LLM“推理”的依据。
- LLM无法给出准确的引用来源。你无法去到信息源,去自己做验证。而搜索引擎可以给予准确的信息源。
给搜索引擎加上LLM,或许可以带来更优的信息检索体验,Perplexity就是基于这个思路,这个思路的技术实现也不复杂,很多人都在复制perplexity。
6
作为AI搜索的探索者,Perplexity产品成功是多方面的因素,一部分是用户都在寻求某种确定性,相比于各种大模型聊天软件,Perplexity的信息来源更满足用户对内容的需求。另一部分,Perplexity产品逻辑也是非常优秀的。
网络上有人整理了Perplexity的产品设计:
- 向用户展示了系统在为你请求的信息进行搜索时的确切工作状态,还通过显示如**“正在考虑8个来源”或“已研究并总结”等文本,让用户不仅看到系统在工作,还了解它在做什么以及这项新技术是如何运作的
- 当预期提示提供的结果不够具体时,Perplexity会要求用户进一步细化问题。
- Perplexity预测你可能会提出的跟进问题,并在每个答案的结尾展示这些问题。
最终呈现给用户的便是,输入搜索指令后,Perplexity生成的信息页面里,包括了“sources”,信息来源“answer”,AI总结的精简回答以及“related”,相关问题。想要更精准搜索,就可以在Focus中选择不同的信息来源,比如可以检索源自学术论文的信息、也可以在YouTube上搜索视频,在Reddit上搜索相关讨论。Perplexity会在内容页面上附上信息来源标签,减少AI问答的造假可能性。
这一套流程非常符合一个用户通过搜索引擎获取信息。比如,我想了解如何减肥,通过搜索,我能看到网站页面,就是搜索引擎给到的前3页的内容,我会选择点击并阅读几篇文章,然后找到自己的答案。这基本等同了Perplexity引用“sources”,然后整理相关文章给出回答。
然后我可能在这个领域有其他问题,比如控制饮食可以减肥吗?如何锻炼才能减肥?这些问题Perplexity则是采用了“related”相关问题来呈现。而如果我想要在小红书等社交媒体获取特定的信息,那么Focus便能实现这样的想法。
如果你计划做商业调研或者写文章,使用Perplexity绝对是最好的选择。
7
Perplexity让AI搜索成了很多公司关注的重点。
2023年8月,昆仑万维官宣发布“天工AI搜索”,成为国内第一款AI搜索;2023年9月,淘宝对电商搜索导购方式进行迭代,启动“淘宝问问”的内测;2023年10月,百度升级为AI互动式搜索引擎,在搜索页面内置文心一言大模型技术,用户实现Chat AI;2024年1月,360 AI搜索上架;2024年3月20日,知乎推出知乎大模型上全新AI功能:“发现·AI搜索”。
另外,阿里巴巴旗下的夸克据说会推出有类似用户UI的搜索产品,中国初创公司中的智谱、豆包、月之暗面、元宝都已为自己的问答机器人加入了提供参考链接功能。于此同时,小红书也在内测AI搜搜薯,给用户提供最佳建议。
接下来,可能会有更多产品上线AI搜索。
8
目前而言,AI搜索主要有这么几类:
1.AI搜索代替搜索引擎
比如说秘塔AI搜索,360AI搜索。
秘塔AI搜索可以看作是结构化的AI问答。在普通的问答基础上对内容进行结构化处理,然后以播客、法律和学术等领域进行切入。而AI问答的逻辑让产品把追问的逻辑隐藏地特别深。
360AI搜索,本身逻辑是搜索引擎,通过AI来实现结果的确定性,并尽可能地匹配用户的搜索意图。比如用户搜索bilibili,给出直达链接、网站介绍信息,以及下载方式,是360AI搜索对用户目的预测。但在这个基础上通过追问、相关内容、相关视频、延伸阅读来满足用户其他的搜索意图。
360AI搜索在Perplexity的基础上新增了“导航意图”,但对于信息需求,反而减弱了,很多回答都比较简短。而秘塔AI搜索则是基于结构化,加强了回答的逻辑完整性和内容长度。
2.强化AI 机器人的能力
月之暗面、腾讯元宝都为自己的问答机器人加入了提供参考链接功能。这不仅可以让LLM获取最新的信息,也能让LLM有较少“幻觉”问题。还可以通过准确的引用来源,给到用户确定性。
这些AI 机器人除了底层大模型能力不同外,加入的参考链接的条数,以及链接来源,以及相关的系统提出词可能是主要差异。
体验后,我发现kimi一般会采用8-15篇文章为基础信息,腾讯元宝则最多能以20篇内容为基础信息。另外,腾讯元宝会更多的引用微信公众号相关内容。信息源的丰富性以及优劣将会很大程度上影响AI机器人的回答质量
3.应用类AI搜索
知乎AI搜索、淘宝问问、小红书的搜搜薯、抖音的AI搜,这些都是“内容”平台针对于自身平台而做的AI搜索,其逻辑是利用其丰富的内容资源来丰富搜索结果,在众多搜索内容之外,呈现一个AI总结性的内容。在某种程度上,在应用类里,用户搜索需求依然是以想内容为主,所以,AI搜索并不会代替原来搜索,而是作为一个搜索的补充,来满足某个场景下搜索意图。
这样的逻辑是非常自然的,thegigabrain 便是基于reddit上的内容而做的搜索工具。未来,AI搜索可能会成为每个产品的标配,就像现在每个产品的搜索框一样。
9
就目前而言,Perplexity只能解决信息需求和商业调研意图,对于导航意图、交易意图、本地化需求则无能为力。其他沿用了Perplexity思路的产品,只是在Perplexity现有的功能更进一步,比如答案更结构化,有不同的引用源,目前只有360AI搜索在导航意图做了一些尝试。而如何解决并把导航意图、交易意图、本地化需求等意图融入产品,也是Perplexity等AI搜索产品未来的发展方向。
在AI搜索上,一些公司正在做一些新的尝试。
andisearch 是一个搜索助手,以聊天对话的形式为核心,然后以网页为搜索信息展示。这个产品逻辑跟腾讯元宝基本是一样的逻辑,只是andi搜索结果是无限的。
另外,andi深入地思考过导航意图,它以文本编辑的形式来实现,如果你想去instagram网站,那么直接输入“go instagram”即可,这种逻辑在聊天对话的产品形式下很自然。比如,chatgpt里可以通过@来使用插件。如果以notion或者discord等软件的形式,可能后面也会采用/ 或者# 来实现更多场景。

Exa.ai 是一款专为人工智能系统和大型语言模型(LLMs)设计的搜索引擎。它使开发者能够使用复杂的查询过滤和搜索互联网内容,使得 AI 应用能够访问和利用网络上的庞大知识资源。
看到exa,你便能理解为什么Perplexity称作答案搜索。Exa尝试真正理解用户的搜索意图,与传统的搜索引擎(如 Google)相比,具有多项优势。
- 语义理解:不同于传统的基于关键词的搜索,Exa 使用先进的语言模型和嵌入技术理解查询背后的意图和含义。这使得它能够提供更相关和更有上下文的结果,即使是对于复杂或含糊的查询。
- 内容检索:Exa 不仅提供链接,还能从网页检索完整的文本内容,或直接生成与查询相关的智能高亮和摘要。这通过消除需要访问多个链接并筛选无关信息的需求来节省时间。
- 可定制性:Exa 允许用户应用过滤器并在网上特定的子集中搜索,如日期范围、包含/排除的域名或自定义数据垂直领域。传统搜索引擎提供的自定义选项有限。
- 相似性搜索:Exa 支持基于相似性的搜索,查询可以是 URL、多个段落或所需内容的示例。这使得搜索更加直观和具有上下文性,超越了仅仅是关键词。
- AI 集成:Exa 特别为与人工智能系统和大型语言模型(LLMs)的集成而设计,使开发者能够通过利用为特定的网络搜索提供的功能,构建更具知识性和能力的 AI 应用。
以上功能使其成为开发者、研究者和任何寻求从互联网广阔领域中获取更精确和更有上下文信息检索的强大工具。
其具体效果如下,但我想找一些早年关于谷歌的文章,它的结果如下:

另外我想了解tiktok是如何增长的。以下是Exa和google的结果


按照创始人Ben Sternhell 的说法,Exa 旨在弥合人工智能系统与互联网上丰富信息之间的差距。
10
Exa的出现,我觉得给了AI搜索新的可能性。
Exa的产品逻辑是搜索本身是给用户提供各种网页结果,并不是要通过AI改变搜索本身的框架,去把网页变成一个确定的答案,而是通过AI给到用户最想查看的网页。
但像Perplexity那样提供某个确定的答案,是很多用户更偏好的选择。
不过总结类AI虽然可以帮助我们更高效地筛选信息,但也会让人忽略到一部分有价值的信息。因为总结类AI没办法代替阅读,在某些场景下阅读的价值在于阅读本身。Perplexity虽然可以方便让研究者快速了解某个主题内容,但如果研究者想要通过阅读文章来了解更多细节,显然是不太方便的(虽然可以复制答案,找到相关链接,但内容质量无法保证)
而Exa显然是给享受阅读本身的人最好的工具。因而,Exa的定位便是想成为开发者、研究者和任何寻求从互联网广阔领域中获取更精确和更有上下文信息检索的强大工具。
也许,perplexity与Exa的结合,再加上Kagi的可定制搜索结果和隐私保护,才是我们想要的AI搜索。
11
AI搜索另一个需要关注的是商业化的问题。用搜索引擎强化AI 机器人的能力以提升体验,和应用类AI搜索补齐用户搜索需求,这两个本身可能对原本产品商业化并没有非常大的影响。但对于想要做成搜索引擎的产品们,并不是如此。
秘塔AI搜索主打无广告,未来可能采用会员的模式来实现商业化,目前Perplexity便是以订阅会员的模式。
但会员模式到底能到有多高呢?主打可定制无广告的搜索引擎kagi,截至 2024 年 1 月,大约 20515 名订阅会员。当然,Perplexity会员订阅肯定会优于kagi。
但2023年,Netflix 的订阅用户超过2.6亿,年收入为337亿美元。而作为搜索市场的霸主google,2023年通过其自有属性(搜索、Gmail、地图等)的搜索广告收入为1750.3亿美元。Perplexity的会员规模达到Netflix的级别,收入也无法跟Google相比。
这也是导致Google一直难以跳下来做AI搜索的原因。自2000年以来,Google的主要收入来源就是广告。如果生成式AI能够对于用户提问给出快速且完整的回答,可能使得传统搜索引擎和夹杂在网页列表中的高利润广告变得多余。Google需要评估加入AI搜索后,对其营收的影响。
当然,Perplexity目前便在商业化上进行积极地探索。比如:针对企业的企业订阅计划、搜索结果后的“相关问题”部分或者是针对商业查询的赞助答案或产品列表增加广告、向企业出售汇总数据进行市场研究、为特定行业定制的 AI 模型和应用程序等。但这些商业化尝试结果只能在未来才能知晓。
12
这两天又出来了一个新的AI搜索软件genspark.ai,这是一款基于AI多智能体系统的创新型搜索引擎,能够实时生成定制化的Sparkpages内容页面,综合多源信息并通过AI助手提供个性化、高效、无偏见的搜索服务。

这让我感受到了类似于现阶段AI视频的繁荣。但不同于AI视频技术验证后导致的各种新产品涌现,AI搜索产品的涌现则取决于各团队对未来产品形态的认知。
这种认知会随着时间的发展越来越趋同,但现阶段,产品的各种形态,一切皆有可能。
ps:发布之际,有报道称《福布斯》注意到 Perplexity 一直在窃取其新闻报道。Perplexity拿走了关于埃里克·施密特的新无人机项目的独家新闻,并将其用于其新的“页面”产品。
参考:
我用Coze手搓了一个极简版Perplexity(基本可以替代Google搜索)
OpenAI、Google、Kimi都在「Perplexity化」,谁是Perplexity?
Perplexity背后的AI用户体验高标准解析
用户用 AI 搜索,到底在「搜」什么?
AI搜索市场迎来强大对手,Genspark获6000万美元融资
How to stop Perplexity and save the web from bad AI