自AI浏览器之战拉开序幕至今,无论是Arc浏览器试图革新交互方式,抑或是Opera Neon浏览器所展示的“代理”功能,乃至传闻中OpenAI即将发布的浏览器,众多行业巨头纷纷尝试对这个我们最为熟知的网络入口进行重新定义。
本周,备受瞩目的AI搜索引擎Perplexity携其新成果亮相——Comet浏览器,这款浏览器自称是“AI Agent原生”。
然而,Comet在社交媒体上的影响力尚未达到预期,这主要是因为它目前仅对Perplexity Max的订阅用户以及少数持有特定邀请码的用户开放(每月需支付200美元的订阅费用)。未来,Comet计划通过候补名单的方式,逐步放宽用户准入门槛,逐步扩大用户群体。
幸运的是,借助邀请码,极客公园迅速获得了体验Perplexity公司推出的AI Agent浏览器的机会。
Perplexity的CEO,Aravind Srinivas,对Comet的未来抱有雄心壮志,他阐述道:“我们致力于打造Comet,旨在实现互联网长久以来的梦想:提升我们的智能水平。”Comet的核心宗旨可概括为“从浏览走向思考”(From Browse to thinking)。
其规模看似庞大,然而,Comet究竟能为现行的浏览器使用体验带来哪些实质性的改进?它与内置了人工智能技术的Dia浏览器,又或是即将融入Gemini功能的Chrome浏览器相比,又有哪些显著的区别呢?
以AI搜索技术起家的Perplexity,能否借助Comet的力量,将自身的估值提升至更高水平?
一、什么是“思考伙伴”
为了领悟Comet的抱负以及它当前所面临的主要挑战,我们必须从“在Perplexity的视角下,AI代理浏览器用户的需求究竟是什么”这一问题入手。
传统浏览器已成功解决了信息获取的难题,然而Comet正致力于攻克信息理解和运用的挑战。该系统深信,问题的核心在于,每个标签页都如同孤立的信息岛屿。因此,其提出的策略是将这些岛屿串联起来,形成一个具备整体智能的广阔大陆。
Comet这一理念贯穿于其所有功能之中;它并非典型的浏览器首页设计。反倒是更像是一部智能手机的桌面,上面摆放着各式各样的应用软件。
Comet浏览器桌面|图片来源:极客公园
传统浏览器宛如一座由众多独立空间(即标签页)构成的宏伟建筑,每个空间内都存放着各异的信息,你必须亲自穿梭于各个空间以搜集和整理。然而,Comet正尝试将此建筑转变为一个集统一神经系统于一体的智能实体,你只需在大厅(即Comet助手)中发出指令,该智能实体便会自动为你遍历所有空间,并将你所需的一切信息带回。这是一种从“空间管理”到“智能委托”的范式转移。
Comet实现宏伟目标的关键工具,便是位于边栏的Comet助手。此助手的神奇之处,在于其两大核心功能的完美结合:一方面,它具备超越单一页面的“情境感知”能力;另一方面,它还拥有将信息转化为行动的“代理执行”功能,这与我们在Manus AI中曾见过的相似。
这种体验并非以往那种仅依靠单一网页信息读取来达成人工智能效果的AI浏览器所能比拟,Comet所具备的这一功能,具备着将我们处理复杂信息流的方式带来根本性变革的潜力。
设想你正准备挑选一台新相机,为此你查阅了诸多资料。你的电脑屏幕上散布着多个网页:电商平台上的商品详情页、专业摄影网站的详尽评价、YouTube上的操作演示视频、一篇对比该相机与同类产品的博客文章,还有一个论坛中关于其不足之处的讨论帖子。按照传统的工作方式,这无疑是一场需要在各个网页间频繁切换、借助大脑或笔记本进行记录的繁琐较量。
但在Comet中,这个流程被彻底重构了。
您可以直接向助手咨询:“请针对我浏览的这些页面,对这款相机的优点与不足进行详尽概括。尤其是,与另一款同类产品相比,它在视频拍摄和操作体验方面有哪些差异?请以表格形式展示结果。此外,关于论坛中提到的在低光环境下画质不佳的问题,专业评测网站又是如何评价的?”
Comet助手此刻正承担着一位顶尖专业助手的职责|资料来源:极客公园
它能够快速浏览并领悟每一页的信息,涵盖视频字幕以及论坛的讨论内容,随后为你编制出一份条理分明、融合多角度观点的详尽报告。这便是“情境感知”的神奇之处,它将分散的标签页融合成了一个整体且不断变化的“浏览会话”,而这个会话便是它的记忆库和操作领域。
无需我亲自查阅,智能助手已替我完成这一任务|图片源自:极客公园
这种能力不仅限于对消费领域的探究,它真正能够大显身手的领域,是在那些需要更深入、更复杂专业知识的研究性工作中。
在撰写市场分析报告的过程中,你的标签页中存放着一份PDF格式的行业研究报告、一个基于Google Sheet的数据分析表格,以及你正在编辑的Google Docs报告初稿。你可以对Comet发出一系列连贯的指令:首先,从PDF文档的第三章里挑选出所有与市场规模和增长率相关的关键数据;接着,将这些数据输入到我已经打开的Google Docs文档里;最后,基于这些数据,提炼出三个关键的战略建议要点。
在这连串的操作指令中,Comet Assistant能够生成所需内容,随后以人工智能助手的身份,协助我以恰当的格式对在线文档进行排版填充。
Comet助手具备读取并处理多个网页信息的功能,同时还能进行相应的操作;该图片的来源是极客公园。
你当然有权利提出更高的要求:你可以要求对格式进行微调、对细节进行补充,甚至可以请求它帮你构思一个标题并自动进行修改。
彗星通过同步监听与操控多个网页,实现了对复杂任务请求的处理|图片来源于极客公园

为了提供更加流畅的交互体验,Comet会向你请求获取相关的日程安排和邮件阅读权限,这样做是为了能够提供更加贴合个人需求的智能助手服务。
在使用Comet的过程中,系统会主动向用户请求授权获取各类权限;相关信息展示于极客公园。
除此之外,Perplexity在Comet平台中引入了AI Agent这一关键功能。Comet平台支持AI agent在本地浏览器中直接执行任务,例如进行批量网页操作、自动化表单填写以及跨平台操作等。这一功能无需借助云端虚拟环境,操作流程顺畅,且用户无需反复登录。
您可以直接向其提出需求,Comet便能自动识别并访问相应的网站,协助您编辑个人信息;这便是Comet最初为何需要获取大量敏感账号权限的缘由——然而,您无需过分担忧数据泄露的风险,因为涉及到的网页信息编辑操作均是在本地进行处理的。
Comet已不再仅仅是信息的整合者,它已转变为工作流的执行者。它不仅能协助你进行观察,还能协助你完成各项任务。
Perplexity Comet的核心优势在于实现了浏览器级别的自动化操作以及深度人工智能的深度融合,这使得“让AI帮你上网、处理事务”这一设想变成了新一代生产力的实际应用场景。
二、AI浏览器的“战略抉择”
就实际使用感受而言,Comet堪称当前体验最为完善的AI Agent浏览器之一,它继Arc之后,再次激发了我将默认浏览器从Chrome切换至Comet的念头。然而,这真的意味着Comet能够在AI浏览器的竞争中脱颖而出,最终站稳脚跟吗?
在AI的冲击之下,市场上的浏览器产品实际上采纳了三种迥异的演变方向。Comet的抉择,不仅为其确立了独特的市场定位,同时也预示了它将遭遇的种种挑战。
最为常见且较为保守的途径,通常被称作“工具强化派”。以搭载Gemini功能的Chrome浏览器和集成了Copilot的Edge浏览器为例,它们的核心运作模式是“浏览器+人工智能”。人工智能作为一项崭新的强大功能被融入其中,使得用户能够更加便捷地归纳网页内容、修饰文字表达。这确实很有帮助,然而,浏览器的基础形态以及用户的操作习惯并未发生根本性的变化,AI仅仅是一个功能更加强大的新型工具。
今日,我们见证了Gemini在Chrome平台上的成功应用,它无疑是该领域内的一个显著标杆;相关图片来源于极客公园。
更进一步,我们称之为“代理执行派”。这类项目中,以探索性项目为典型,AI得以根据用户的不明确意图,更加主动地操控浏览器,甚至能在云端为用户创建报告或应用。在此过程中,AI的角色已从单纯的“工具”转变为“初级助理”,并展现出一定的自主能力。
Comet选择了第三条道路,这条道路既激进又充满想象力,被称为“环境重构派”。在这个派别中,探索者们持有这样的观点:在AI时代,AI不应仅仅成为浏览器的一项功能,而是浏览器本身应当成为一个AI化的环境。他们的目标是全面重塑浏览器的形态,将分散的网页信息流整合成一个连贯的、能够进行对话的、智能化的交互空间。
Perplexity观察到,随着AI聊天机器人在信息获取方面的应用日益广泛,传统的搜索与浏览方式正经历着变革。Comet则致力于捕捉这一发展动向,旨在通过提供更加高效和智能的AI驱动服务,来吸引更多用户。
因此,Comet毅然决然地选择了“环境重构派”这一立场,这表明它对用户的期待,不仅限于“使用”它,更在于用户能在其中“栖息”。它期望用户能够转变对互联网的使用习惯,把浏览器看作一个可以进行深入交流、可以完全信赖去执行任务的“思考伙伴”,而非仅仅是一个被动展示信息的平台。
三、高昂的门票与用户“惯性”
然而,选择最激进的道路,也意味着将直面最陡峭的悬崖。
Comet的推出过程并非毫无波折,其采用的策略和秉持的理念,都使得它陷入了创新者常遇到的困境。
首先,那引起广泛争议的发布策略备受关注。目前,Comet的体验资格仅向每月支付200美元的Perplexity Max订阅用户开放。这一做法让众多每月仅支付20美元、作为核心支持者的Pro用户深感失望,甚至产生了被背叛的感觉。
在社交媒体上,一位用户的评论道出了众多人的感受:“情绪的起伏就像过山车一般……我们原本以为Pro将会是下一个。”尽管Perplexity官方承诺Comet未来将向所有用户免费开放,然而这“200美元的入场券”无疑给Comet贴上了“精英主义”和“疏离大众”的标签,极大地阻碍了口碑的广泛传播和早期用户群体的构建。
众多用户对Comet当前的测试方案表示了强烈的不满,| 信息源自:Twitter平台。
更深层次的争议在于用户习惯的巨大挑战。在回顾其备受赞誉的Arc浏览器时,The Browser Company曾坦率地表示,Arc之所以备受瞩目却未能广泛推广,其根本原因在于它“过于独特,需要学习的新内容过多,而相应的回报却相对较少”。
这就是AI浏览器领域内人人谈之色变的“Arc的教训”——它精确地揭示了所有“重构派”产品所遭遇的核心困境:过于保守,使得用户难以割舍成熟的Chrome生态系统;而过于激进,则可能导致用户因高昂的学习成本,在真正感受到其价值之前便已选择放弃。
彗星正是这一矛盾的集中体现。它所提供的“会话式”浏览体验,尽管对部分用户而言或许代表着效率的显著提升,然而,对于大多数已经习惯了使用Ctrl+T(创建新标签)、Ctrl+W(关闭标签页)以及在不同标签页间切换的用户来说,这无疑是在要求他们去掌握一门全新的操作“方式”。彗星必须展现出其无可置疑的、超越现有工具的巨大价值,以此来证明这种学习投资的合理性。
在人工智能如今如同水与电般融入数字生活的当下,我们历经二十余载使用的浏览器,其本质究竟应当如何?它是否应当成为一个融合更多人工智能特性的、更加智能化的工具?抑或是一个能够彻底释放我们大脑潜能、重新构建信息关联的全新数字化空间?
Comet通过其提供的信息解决了疑惑:浏览器理应成为一位能够“重新塑造人与信息互动模式”的思考伙伴。在技术层面,Comet是在开源的Chromium项目基础上进行开发的,这让它与大多数Chrome扩展实现兼容,确保了基础体验的稳定性以及生态系统的持续性。这像是它为自己激进的革命理想,上的一道现实主义的“保险”。
Comet的核心价值并非在于其与过去的兼容性,而在于其对未来的塑造。它所呈现的,是下一代互联网入口的初步轮廓:界面设计简洁而优雅,而在幕后,强大的AI能够深刻理解语境、整合信息,并且能够主动执行任务,构建出一个智能化的环境。
Comet的诞生,与其被视作一款产品的正式推出,倒不如被视为一种勇敢的、面向整个业界及广大用户群体的未来探询。
这条路能否成功通行,不仅在于Perplexity技术的更新速度和商业策略的制定,还在于我们这些被“标签页地狱”困扰的用户,是否已经做好准备,去接受、去掌握、去适应这种全新的信息交流模式。它已然存在,如同一份来自未来的邀请函。我们是否敢于全力一跳,去迎接那个崭新世界的到来,这一决定将直接影响这场浏览器革命的最终走向。
Comet浏览器,其名称中的Comet一词,在日常生活中最常被理解为一种天体,即天文学中的彗星。
或许Perplexity期望这款浏览器能够如同璀璨的新星,在激烈竞争的浏览器领域快速崭露头角,并赢得广泛关注。
但它也会像彗星一样“转瞬即逝”吗?