时间:2025-08-21 12:35 作者:暗魇之喵
首个国产“手机智能体”问世,智谱补位Manus
(文/陈济深 编辑/张广凯)
作为一款纯国产智能体,AutoGLM的发布也给了中国用户一个在Manus退出中国后可以合规便利体验智能体的选择。
不同于Manus等网页端原生的智能体产品,智谱AutoGLM 2.0作为全球首个手机通用Agent,被定位为“执行型助手”。相比目前主流AI产品和智能体助手多停留在“对话”层面,只能实现信息查询和整理回答,AutoGLM则实现了质的飞跃——它不再只是“说”,而是真正能够“做”。
作为全球首个通用手机智能体,AutoGLM的发布也代表着AI从能说会道到真能干活的技术跃迁,而AI不再需要和人类争抢手机开启“自动驾驶模式”,不仅有效地解放了真人诸多日常繁琐操作的时间,能够24小时执行任务的数字“牛马”也直接打开了Agent发展的无数可能性。
用嘴真能操作手机
同时,中国用户侧重移动端的特点也和传统Agent重PC端轻移动端的思路有所冲突,对于AI智能体到底应该是什么产品形态,显然需要更加了解中国用户的中国公司去探索开发。
他表示,一方面目前互联网上,很多基础设施都隐藏在各种网站和数据库中,如果不采用类似人工点击浏览器登录的模式,也没有办法充分发挥个人所拥有的生产资料和数据带给你的价值。
相比传统的问答式和信息辅助式的手机智能助手主要通过AI输出文本答案让用户自己根据指示操作,本次新发布的AutoGLM内置了智谱GLM4.5模型,不仅全部国产还实现了端到端操作设备的能力,让AI真的长出了“手”,替用户自动操作设备。
面对稍微复杂一点的单一APP全链路操作,AutoGLM也能胜任。
在向AI提出“搜索知乎今日最热门的话题,总结一下高赞评论的核心观点,然后关注点赞数前三的博主”的需求后,AutoGLM直接登陆了知乎并看到了今日最热门的话题《黑神话:钟馗》的官宣,随后整理了高赞内容的核心并顺利的关注点赞了前三的答主。
而随着任务进一步复杂涉及长链路,多应用交互的行为,AutoGLM也能做到常用场景下基础操作层面的游刃有余。
再给出“播放QQ音乐,搜索今日热门歌曲播放,然后搜索B站东方明珠大战蜜雪冰城热门视频播放并一键三连”的提示后,AutoGLM成功播放了排行榜第一的热门歌曲时代少年团“I Like U Like”,然后打开了B站搜索并播放了“在上海随便喝蜜雪冰城,故乡会保护你”的视频
不过在测试过程中,在支付、发布帖子等环节,依然需要人类接管确认,我们不止一次遇到在自动发布文案时触发风控/系统连接限制等情况无法发帖的情况。
而想要使用云手机和云电脑,用户需要提前在虚拟设备上登录账号。对于用户安全和隐私问题,智谱表示,其云服务与阿里云合作,智谱并不会读取用户的登录信息。但是如何赢得用户的信任显然并不是一个简单的问题,也不是智谱一家企业能够自行解决的痛点。本次智谱没有在默认程序中内置微信这个国民应用的理由,恐怕也是出于这方面的用户顾虑。
在初步体验后,可以发现AutoGLM除了让普通用户也能体验到AI智能体的便捷外,它的出现也显著的帮助了另一个很容易被忽视的群体——中老年用户。
互联网时代,随着数字化和智能化的发展,无论是银行,医院,还是政务类业务,在线或者扫码办理成为了司空见惯的日常,而很多APP的交互设计对于老年人群体来说难度显而易见。
另一方面,中老年群体在自主学习如何下载APP时,也很容易在安装各类APP软件的过程中无意间下载广告乃至诈骗软件而不自知。
相比Manus等Agent采用Linux+VSCode的配置范式,智谱本次采用了云端手机+电脑的技术新范式。
对于为何选择云端执行的战略,智谱总裁张鹏分享了AutoGLM的「3A 原则」:
Around-the-clock(全时),是指AI 必须能够 24 小时待命并持续执行任务。无论用户是在工作、睡觉还是娱乐,AI 都应在云端持续产出价值。
Autonomy without interference(自运转、零干扰),官方也称之为 Asynchronous (异步),其核心是 Agent 在云端设备的独立运行,不占用用户的本地屏幕和算力。
Affinity(全域连接),则意味着Agent 的能力不能局限于浏览器对话框,必须能连接手机、电脑、手表、眼镜等多种设备与服务,打通数字世界与物理世界。这三大原则,共同构成了 AutoGLM 对一个成熟 Agent 形态的定义,也解释了其当前产品架构。
而为了实现这个愿景,选择云手机和电脑不仅能解决用户和AI抢屏幕的痛点,也解决了软件适配的难度,成为了顺理成章的选择。
AutoGLM技术负责人、算法研究员刘潇对观察者网解释道:“如果智能体为满足用户需求诸如点外卖,发微信都需要抢占手机屏幕,AI在做事时真人就不能插手,这种让人类二选一的情况既不智能也不合理,因此通过本地调用APP抢占用户屏幕并不是一个合适的解决方案。”
采用云手机/电脑的另一个动机则在于减少适配难度,尤其是安卓设备的适配难度,尽管每家基于安卓厂商的系统看着大差不差,实际上底层可谓大相径庭,在这个系统生态下,自家的软件能在哪个系统跑已经属于玄学范畴,存在巨大的适配成本门槛。
具体到技术细节,过去,许多 Agent 的训练依赖于监督微调(SFT),即学习人类专家的操作轨迹。这种方法的弊端是「泛化能力差」——AI 只会模仿它见过的操作,对于未见过的场景或界面改动,往往束手无策。
为了让 Agent 在复杂多变的真实环境中(数千个并发的手机、电脑、浏览器环境)真正具备完成任务的能力,AutoGLM 团队选择了端到端在线强化学习的技术路线。
而在跑分之外,智谱模型即Agent的模式也带来了巨大的成本优化空间。
这种数量级的成本降低,让智谱有底气在此次发布中不用邀请码,直接向所有 C 端用户开放。
智能体背后的生态布局
而在后续的更新中AutoGLM将添加定时任务功能,即AI从被动接受命令执行响应转变成半主动规划,从每天早上根据自己的消费记录买一杯合适口味的咖啡,到办公室自动总结未读邮件,也将从梦想走进现实。
而对智能硬件生态的赋能才是智谱真正的杀手锏。
目前的智能设备中,存在明显的算力、续航和交互的不可能三角,如苹果的Vision Pro存在续航短板,Meta Quest 2则存在显著的算力短板,苹果即将发布的桌面机器人更是在预告公布后因为糟糕的交互能力饱受诟病。
对于很多智能设备,堆大电池和复杂系统的解决方案并不合适,如何在性能合格情况下控制成本也成为了制约硬件厂商的痛点。
智谱对观察者网展示了若干案例,如体重秤接入智能体后,在检测体重超标后自动下单减肥代餐,而气体传感器在接入了智能体后,一旦检测到鞋柜发愁就会下单除臭脚垫。
打印机接入Agent实现缺墨自动购买
这条物理传感器—云端 Agent—现实世界服务的链路,打开了智能体实现对物理世界的连接和操作的可能性。
对于AI和智能体发展的未来时,AutoGLM技术负责人刘潇提出了一个关于 AGI(通用人工智能)的阶段性定义,他称之为“AGI 的下限”——当一个 Agent 能自主稳定地运行一整天(24小时),作为你的同事或秘书,协同完成工作与生活任务,使你的综合效率提升超过 2 倍时,AGI 的曙光初现。
从同步操作转变为异步委托,或许是人机协作范式的转变的开始,未来的个人竞争力可能取决于自身能力+N 个 AI 智能体模式,用户通过下达指令,让多个 AI 并行完成任务,从而根本性地改变个人处理日常与工作事务的方式。
1、《生万物》大爆之际!爱奇艺再传“二次上市”、或融资21亿!
2、市场监管总局拟对公用事业领域反垄断出台新规,市场监管总局反垄断处罚
3、新华社快讯:装备方队按照实战化联合编组,装备方队来自哪里