甬兴证券:计算机行业点评:AI Agent—人机交互新范式

  • 5
  • 约 423.65KB
  • 约 3页
  • 2024-11-05 发布
  • 3金币
  • 预览图可能不清晰,实际为下载为清晰文档
事件概述据智谱微信公众号,公司发布在自主智能体领域最新人机交互范式—基于CogAgent以及AutoGLM-Web架构,可让AI接受指令并自主操控手机的AIAgent,目标为实现模仿人类的Plan-Do-Check-Act循环,形成自我反馈和自我提升,为迈向AGI愿景夯实基础。核心观点AIAgent底层原理:使用VLM与GUI交互,效果与效率双升据《LightweightNeuralAppControl》(HuaweiNoah’sArkLab等,2024.10)及《CogAgent:AVisualLanguageModelforGUIAgents》(WenyiHong等,2023.12),当前来看,智谱,华为等行业领先厂商多应用VLM(视觉语言模型)执行人机交互程序。大语言模型虽擅长处理文字生成等任务,但在理解与交互GUIs(图形交互界面)方面存在短板,同时大语言模型运算时间及调用成本都相对较高,基于GPT-4o的AIAgent单任务运行时间需约1-2分钟,单任务平均运行成本高达1美元。相比之下,VLM模型直接感知视觉信号,阅读及编程能力得到显著强化。参数量方面,CogAgent的VL...

甬兴证券:计算机行业点评:AI Agent—人机交互新范式.pdf

  1. 1、本文档共3页,其中可免费阅读3页,需付费后方可阅读剩余内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。

相关文档

相关热门