◎本报记者 张佳星
11月21日,智能体入选2025年度十大科普热词。从娱乐、教育到医疗,都能见到智能体的身影。
人们曾经希望智能音箱具有日常协助的能力,但由于每个动作都需要指令,难以达到减轻工作量“少操心”的目标。如今,智能体成为最具潜力的“数字搭档”,人们寄望它能解决生活和工作中的难题。
它与过去的人工智能(AI)有什么不同?具有什么样的特质才能称为智能体?为此,科技日报记者采访了业内专家。
生活陪伴:从科幻电影走进现实
“2013年有一部叫《HER》的科幻电影,里面先进的人工智能系统‘萨曼莎’就是对理想智能体的塑造。”上海灵宇宙科技发展有限公司创始人顾嘉唯告诉科技日报记者,电影里,“萨曼莎”被固定在胸前,通过摄像头等感知世界,可以为主人提供任何事情的建议。
“试想你正参加小组讨论,你的智能体根据当前的话题,主动持续通过耳机给你提供网络上的最新信息、最全面的数据。”顾嘉唯说,智能体应具备堪比“军师”的能力,提供无缝衔接的帮助。
IDC中国研究总监卢言霞说,尽管目前对于智能体的定义比较多样,但有几个能力是不可或缺的,包括理解、记忆、规划与自主决策能力。
为了实现这些能力,智能体开发者探索了很多新方案。“受《HER》的启发,也考虑到人类80%以上信息来自视觉,我们研制的小方机装配了感知世界的摄像头,通过算法实现对真实世界的立体感知。”顾嘉唯介绍,由于能精准感知人类所处的环境,智能体的判断力大幅提升。
在语义理解方面,精准捕捉人的意图并进行“一镜到底”的执行是智能体的使命。
“AI精准的回应需要对‘提示词’的精准捕捉,为此我们开发了本地模型,在生成式基础大模型调用前,先进行快速预处理。”顾嘉唯解释,人刚开口说出几个字时,本地模型就在推理意图、研判调用路径。这种分层结构设计兼顾了快速反应和精准应答。
在深度思考、推理应用等场景,消费级智能体的效果不错。“相较而言,企业级智能体目前主要落地于智能客服、办公助手等辅助类角色,要想基于多模态内容形成服务于核心业务的行业垂直智能体,还有一定难度。”卢言霞说。
初入“职场”:由机械式响应进阶为主动预判
“人们在工作中期望的是一种更深度的‘伙伴级’协同,即智能体能够根据工作任务,主动分解目标并逐步完成。”北京云迹科技股份有限公司(以下简称“云迹科技”)研发中心负责人龚汉越说,由机械式响应进阶为主动预判,是场景智能体的进化方向。
当前,智能体已逐步应用于酒店、工厂、医院等多个场景,帮助人类完成重复性、流程化或需要人机协同的工作。“相较于生活陪伴,场景智能体响应闭环的环节更多、流程更长。”龚汉越说,为了实现从感知、认知、决策、执行直到反馈的端到端服务,云迹科技“服务智能体”采取“具身智能”与“离身智能”相结合的方式。“具身智能”UP机器人负责执行具体的物理任务;“离身智能”HDOS(云迹科技自研AI数字化系统)接驳包括小度音箱等多种入口,实时响应客户需求,并根据社会常识对意图进行感知预判,然后完成决策、执行和反馈全闭环服务流程。
“理想中的成熟智能体可以代替人类工作,人类只需监督、校正就可以。”卢言霞说。
如何让智能体从一个强大的任务“识别器”和“执行者”演进为一个能深度交互、自主进化且安全可靠的“智能伙伴”?
卢言霞认为,这一进阶过程还面临着行业企业数据与知识积累不足、大模型的处理能力与准确率不高等挑战。
“特斯拉通过海量电动汽车的数据采集,构建了真实的场景闭环,然后才去做Robotaxi(无人驾驶出租车)。”顾嘉唯说,每一个在职场上深度应用的智能体,都需要垂直领域的海量经验积累。除了特斯拉,已经有不少企业在通过个体设备的铺设,为未来成熟智能体汇聚足够多的真实场景应变能力和模糊信息处理能力。
龚汉越建议,发展智能体的深度推理能力,即从识别“是什么”到理解“为什么”,应进一步推动智能体与人类价值对齐,为智能体设定复杂场景下明确且动态的行动边界,确保其在物理环境和社会交互中的行为相对安全。