赵明表示,当前市面上的智能体主要分为两类■■★■:一类是端侧的智能体★■■★◆,能调用其他终端的应用★■◆■,两个智能体之间可以进行协同和合作■★;另一类是更为复杂的智能体,可以跨应用★◆、跨智能体来模拟人类◆◆,进行屏幕的分析学习以及主动进行相应操作■★★。
技术层面,智谱AI研究员表示,AutoGLM 基于智谱自研的■◆“基础智能体解耦合中间界面”和“自进化在线课程强化学习框架”■★★,核心技术WebRL克服了大模型智能体任务规划和动作执行存在的能力拮抗、训练任务和数据稀缺、反馈信号稀少和策略分布漂移等难题■■,加上自适应学习策略★◆■■★■,能够持续迭代。未来,智谱认为大模型的工具能力应像人类一样,感知环境■★◆◆◆■、规划任务■■◆★★◆、执行动作,最终完成特定任务。实现模仿人类的Plan-Do-Check-Act 循环,形成自我反馈和自我提升。
当一款APP应用可以代替用户进行微信发送、外卖下单、工作总结、打车出行,AI(人工智能)时代下的AI Agent(智能体)或许开始真正影响到普通人的日常生活■■◆。
智谱用三分钟的视频展示了AutoGLM带来的便利■★■★■:手机成为AI助理◆■■,无需手动操作■◆■■,用户对着手机说话(发出指令)◆◆◆,便可让其自动打开手机上的各类App。
从宣传视频中已经有的功能看,智谱已获得淘宝、美团、微信等App的授权■◆■,这三个公司也是智谱的投资方■■★★◆。
海内外人工智能企业密集瞄准Agent方向,本质上是为了向AI提升应用效率★★、落地现实更进一步。智谱AI研究员对第一财经记者表示◆★,从第四季度行业密集发布类 Agent 功能和应用来看,实现大规模落地应用不是未来时,而是进行时。
海外市场中,上周,Anthropic推出Computer use功能,实现AI接管人类电脑;谷歌正开发同类新项目Project Jarvis,可以将Chrome网页任务自动化;微软团队在Claude后推出屏幕解析工具OmniParser,可以将截图转化为结构化数据,帮助AI精准理解用户意图;OpenAI尚未发布的AI智能体雏形据悉可以操控计算机完成在线订餐★■★■★◆、自动查询解决编程难题等任务。
行业内,智谱Agent产品并非孤例。此前,字节跳动豆包发布AI 智能体耳机◆◆■,接入豆包大模型后可以与豆包 APP 深度结合◆◆,通过语音交互实现信息查询、旅游出行、英语学习等功能;金蝶AI 管理助手苍穹APP面向员工提供制度问询等功能★◆■◆◆,面向HR提供智能招聘、智能调配等能力;荣耀终端有限公司CEO赵明披露荣耀AI 智能体与中国移动灵犀行业首发AI智能体互联互通。
10月28日,智谱AI概念股走强。截至收盘,创业黑马、首都在线◆◆■、豆神教育、传智教育■★■★◆◆、正和生态等相关概念股涨停★■。消息面上,北京智谱华章科技有限公司(简称智谱)技术团队日前推出一款智能体产品AutoGLM,能够模拟人类操作手机,执行各项任务。
智谱CEO张鹏表示,AutoGLM 是智谱按照AGI通用人工智能升级路线图进行的探索,可以看作是智谱在人工智能能力分级 L3 使用工具能力方面的尝试,为构建 GLM-OS 、即以大模型为中心的通用计算系统打好基础。
:第四季度行业密集发布类Agent 功能和应用, 可以看出实现AI Agent大规模落地应用不是未来时■■★,而是进行时。
对于第一批合作APP的选择,智谱AI研究员对记者表示,AutoGLM 是一个系统级功能,理论上★★◆,AutoGLM 可以完成人类在电子设备上的所有需求,不受限于简单的任务场景或 API 调用★★。目前AutoGLM在开发、适配的过程中,优先考虑用户使用最高频的场景。至于产品不完善之处,该人士称,AutoGLM基于模型能力■■★、内容识别能力、自动纠错能力和语音能力,还在不断提升中★★★■◆,存在的问题将持续优化迭代。
目前智谱AutoGLM处于内测阶段。第一财经记者通过体验发现★◆,该应用当下合作APP包括微信■★★★、美团★★◆、淘宝★★、大众点评◆★★◆、小红书★■、高德、携程等★◆■◆◆◆。向Agent语音传递命令后,AutoGLM会经过用户授权,自动打开目标APP,执行相关命令。但在准确度、完成度等方面尚有瑕疵◆■。
需要注意的是,虽然智能体在执行任务前需要用户的授权确认★★◆■★,但将智能主导权交给AI会否存在网络安全隐患★■◆◆?对此,智谱AI研究员对记者表示◆◆,AutoGLM本身不会主动获取用户的个人隐私信息,对于授权范围以外的任务会主动提示用户、获取用户同意,涉及交易、支付等重要操作的步骤也会向用户进一步询问是否执行。每次关闭应用在后台再次启动AutoGLM功能,都会重新向用户申请无障碍权限。用户想退出使用时也可以选择在手机设置页面进行手动关闭★★。