首页 > 产业市场 > IT > IT滚动新闻

高德地图发布“AI 伴行”:让导航不止找方向,还能做决策

2026-04-24 17:35 来源:中国经济网
查看余下全文
首页 > 产业市场 > IT > IT滚动新闻

高德地图发布“AI 伴行”:让导航不止找方向,还能做决策

2026年04月24日 17:35 来源:中国经济网
[字号 ]

4月24日,高德地图面向导航场景正式推出“AI 伴行”产品,它不仅能理解用户的语言,还能实时感知用户的位置、方向与周边环境,通过摄像头理解街景画面,并结合地图数据给出与当前处境高度相关的建议。

这是行业首款面向真实世界出行场景打造的全模态出行伙伴。通过多模态感知与地图能力融合,高德正试图把导航服务升级为能够理解现实世界的 AI 伙伴。

从“找方向”到“做决策”

在日常出行中,许多用户都会遇到这样的情况:导航刚开始时站在路口,却不知道自己应该往哪个方向走。某些导航会提示“向东步行200米”,但对于不熟悉方向的人来说,“东”并不是一个直观的概念;如果以“向左或右……”替代,虽然能解决大部分问题,但在某些特殊位置也会显得不那么直观。

AI 伴行则会给出更贴近现实环境的指引。例如用户询问“我该往哪边走”,AI 伴行会根据用户当前朝向与周边地标回答:“朝着你右手边那个麦当劳的方向走。”系统会将抽象方向转化为用户眼前可见的参照物,从而降低理解成本。

在更复杂的出行需求中,AI 伴行也能够理解多重意图。例如,当用户说“我走累了,前面哪里可以坐公交回酒店?我还想买瓶水”,系统会同时分析当前位置、酒店位置、附近公交线路与周边店铺信息,给出完整方案:先经过附近便利店购买饮料,再步行至公交站乘坐相应线路回到酒店,并在地图上同步标注路径与地点。

在景区场景中,AI 伴行还可以充当实时导览。例如用户提出“故宫必逛路线,顺便看看翊坤宫”,系统会生成一条完整的游览路径,并标注沿途核心景点。当用户在行进过程中提出新的需求,如“最近的洗手间在哪”,AI 伴行会结合当前位置即时给出导航方案。

此外,AI 伴行还支持视觉识别场景。用户在街区或历史建筑前举起手机,询问“这栋建筑给我讲讲”,系统会识别画面中的建筑,并结合地理位置提供历史信息、开放时间、门票情况等,同时提供前往入口的导航选项。如果用户对一家店铺感兴趣,也可以通过拍照获取评分、人均消费和招牌菜等信息。

四项关键技术支撑真实世界理解

这些场景背后,是高德为 AI 伴行构建的一套以 Agent 为核心的技术体系,主要由时空上下文感知、多模态融合理解、空间行动能力以及复杂任务处理机制四个部分组成。

首先是时空上下文感知能力。AI 伴行始终运行在一个持续更新的时空上下文中,系统会实时感知用户的位置、行进方向、导航进度以及周边环境,并持续更新空间、时间、环境和行为等信息。当用户提问时,这些信息会一起参与AI的推理,使系统能够准确理解“前面”“左边”“顺路”等与具体情境密切相关的表达。随着使用时间增加,系统还可以逐渐积累长期记忆,从而更好地支持用户连续和复杂的出行需求。

第二是多模态融合能力。AI 伴行能够同时融合文本、语音、视觉和位置信息,对用户所处的真实场景形成整体理解。例如,当用户对着一栋建筑说“这栋建筑真壮观,给我讲讲”时,系统会结合语音内容、摄像头画面以及当前位置识别建筑并提供相关介绍。

第三是空间行动能力。传统 AI 助手通常只提供信息,而 AI 伴行可以直接调用地图能力完成具体操作,例如规划路线、发起导航、在地图上标注推荐地点,或根据用户需求实时调整路径,系统还可以结合用户位置进行主动提示。这让 AI 实现了从被动应答到主动伴行的转变,成为能同时操控语音、视觉、地图和导航的出行伙伴。

第四是复杂任务处理机制。AI 伴行内置了“龙虾模式”,能够将包含多个条件的需求拆解为不同步骤,并调用相应能力逐步完成。例如用户提出“在双井附近找一家评分4.5以上、人均100元以内的淮扬菜,饭后还能遛弯”,系统会先筛选符合条件的餐厅,再以餐厅为中心寻找适合散步的公园,并将相关地点和路线展示在地图上。

这一能力依托于 QwenPaw 任务处理框架,通过调用搜索、路线规划、视觉识别等不同工具,并在多轮对话中持续记录用户需求,使 AI 能够一步步完成更复杂的任务。与此同时,这一架构也支持持续扩展能力,使AI 伴行可以在真实出行中承担越来越多的辅助角色。

从导航服务到出行伙伴

从行业角度看,AI 伴行代表着地图导航的一次重要范式变化。

过去十多年,地图导航主要是在把真实世界“数字化”——把道路、建筑、商铺等信息变成地图里的数据,再通过算法帮用户规划路线。而 AI 伴行更进一步,它尝试让 AI 不只是读取这些数据,还能理解用户所处的真实环境和当下情境。

这种能力意味着用户可以用更自然的方式与地图交互——通过说话、提问或拍照获取信息并执行行动。AI 不再只是搜索工具,而是能够在用户身边持续理解环境、提供建议并主动协助决策的出行伙伴。

从导航到伴行,高德正尝试让 AI 不仅理解互联网信息,也能理解真实世界。在高德看来,步行导航是这一能力最合适的起点。相比驾车导航,步行场景更复杂、需求更碎片化,也更依赖环境信息,因此最能体现 AI 理解现实世界的能力。

随着技术和生态能力的持续扩展,这种“伴行式导航”有望逐渐延伸到更多出行场景,重新定义人与地图、人与城市空间的交互方式。

目前,用户开启高德步行导航后,即可通过导航页面下方的“按住说话”按钮进行交互。该功能目前已启动测试,并正稳步扩大开放范围,预计将于近期向更多用户提供体验。

(责任编辑:佟明彪)