发布日期:2025-04-06 05:20 点击次数:181
当深度念念考遇上 Agent伪娘 拳交,真万能的 AI 来了?
智谱 AI 在 OpenDay 上发布了内行首个集深度研究和操作实施于一体的 Agent 家具—— AutoGLM 千里念念。有别于大多数只会打嘴炮的 AI,这款堪称"边想边干"的家具不仅能念念考,还能及时操作浏览器,像真东谈主相似掀开网页、检索信息、生成敷陈。
咱们第一时刻进行了一手评测,用三个试验使命场景测试后不得不说:此次不是 PPT 家具,此次是果然能用!
通用 Agent 一直濒临的最浩劫题是 C 端场景过于复杂多变,导致褂讪性和准确性难以保证。智谱通过"先念念考再实施"的战术管制了一部分准确性的痛点。AutoGLM 千里念念会先制定好意思满研究磋商,再一步步实施,终末进行系统回来,大大缩小了幻觉率和操作装假率。
快播在线影院AutoGLM 千里念念之是以能真能用,要津在于其背后的技艺栈。它基于智谱自研的推理模子 GLM-Z1-Air 试验,这个模子堪称性能并列 DeepSeek-R1,但速率擢升最高 8 倍,价钱仅需其 1/30。深度推贤人力让它不仅能像 OpenAI 的 Deep Research 相似进行深度念念考,AutoGLM 框架则赋予了它真实的操作智力,能自动浏览和操作网页,获得更多高质地信源。
而且对于打工东谈主来说,AutoGLM 千里念念王人备免费且不限次数使用,现场智谱用它演示了"怎么赚到 100 块钱"以及" 14 天小红书起号磋商",咱们实测下来,AutoGLM 千里念念率性了"通用 Agent 等于玩物"的刻板印象,不外由于"边想边干"的使命方式,它完成一项复杂任务常常需要 5-20 分钟不等,成果确乎有待提高。但商量到它能完成的任务复杂度和准确性,这个时刻资本其实依然比东谈主工低得多。
当深度调研与试验操作智力相和谐,通用 Agent 终于要从意见走向实用了?
以下是硅星东谈主针对自媒体常见三个场景:热门分析、财务分析和磋商制定,对 AutoGLM 进行了实测。
一、热搜话题商量分析
我让 AutoGLM 千里念念分析一下微博上对于"胖东来店长月薪近 8 万"这个热门话题的主要不雅点、省略占比和能得出什么论断,AutoGLM 千里念念总共这个词运作的经过如下。
本文视频均经过倍速处理
接到任务后,AutoGLM 千里念念先去了解了胖东来这家公司和这个话题的基本情况,证明了讯息着手和薪资数据。它尝试平直去微博执取和分析持续,但好像遭遇了点技艺贫穷,可以执取微博帖子,但没法平直看多半的商量。
于是,它换了个念念路,初始世俗搜索联系的新闻报谈、首创东谈主于东来的发言、以过火他叮咛平台(像知乎、小红书)上对于这个话题的持续和帖子。通过阅读这些替代着手的信息,零散是小红书上的一些帖子和商量。
最终如故给出了一个信息量丰富、逻辑澄澈的分析敷陈。值得可贵的是不仅回话了我的问题,还深挖了配景信息和生意逻辑,让论断更有劝服力。
从这个经过来看 AutoGLM 千里念念挺活泼,路子堵了知谈换条谈走,终末如故把任务完成了。不及是因为没平直看微博,不雅点比例是靠其他平台的信息,莫得严格慑服用户的条目,如果能平直处理微博数据,分析会更塌实。
二、特斯拉股票分析
咱们让 AutoGLM 深念念作念一份全面的特斯拉股票分析敷陈,条目包含财务、阛阓情谊、技艺面、竞品对比等方面。
AutoGLM 深念念接到任务后,先是征集了特斯拉的基本情况和最新动态,了解了省略的功绩。然后它初始深入挖掘,找详备的财务数据,固然尝试平直读官方年报没生效,但如故从其他财经网站把要津数据(像营收、利润、现款流)扒拉出来了。接着,它又去查了分析师们怎么看这只股票、阛阓情谊怎么样、股价图走势怎么,还要点相比了特斯拉和比亚迪等竞争敌手的优劣。
终末,它把这些信息汇总起来,从价值投资的角度分析了后劲和风险,作念了个 SWOT 回来,并针对不同类型的投资者给出了提出,酿成了一份详备的敷陈。
和上头热搜商量分析的情况雷同,AutoGLM 深念念能按照给出的框架一步步去征集和分析信息,粉饰面很全。即使遭遇信息获得的小防碍(比如平直读年报失败),也能换个门道把任务完成。不外总共这个词经过看起来挺繁琐,搜了好屡次,花了些时刻。
试验上这个股票分析的任务亦然 Manus 的官决议例之一(https://manus.im/share/xFgpHb15vKqfRPWIs3JJPJ?replay=1),对比两个家具完成任务的经过来看,Manus 像一个自动化分析师 + 开导者。它明确地实施磋商、调用器具、获得特定数据(如股价、财务磋商)、进行计算(如 DCF 估值、技艺磋商)、生成图表,况兼经过卓绝透明,用户能看到它一步步在作念什么。除了生成了详备敷陈,还作念出了一个交互式的数据看板。AutoGLM 千里念念在信息征集和回来方面作念得可以,但显得器具化和分析智力稍弱一些。
三、日本七日游旅行磋商
咱们持续让 AutoGLM 千里念念和 Manus 同题"打擂",让 AutoGLM 千里念念权术为一双好意思国公民权术一个 4 月中从西雅图动身的 7 天日本行程:预算在 2500-5000 好意思元,可爱历史文化(零散是剑谈、茶谈)、想看奈良的鹿,而且盘算在此次旅行中求婚,需要推选个零散地点,终末还要个简略的网页版旅行手册。
接到任务后,AutoGLM 千里念念先去查了西雅图到东京的航班省略价钱和时刻,证明了好意思国公民去日本无须签证。然后它研究了在日本几个城市间怎么走最便捷(主若是新主线),接着就针对意思意思点(历史、文化体验)去搜东京、京都、奈良的景点和举止,零散找到了东京可以体验茶谈和剑谈的方位(从小红书上找的信息)。还查了 4 月份天气怎么样,况兼证据别东谈主的教导推选了东京塔下的公园动作求婚地点。
终末,它把这些信息整合起来,作念了一个每天的详备行程安排,加了些日语短语和旅行领导,还生成了一个简略的 HTML 局势的旅行手册,但可视化进程有限,基本上是索求了一些要点。
回来:
对比来看,AutoGLM 千里念念签订是贵府获得和信息集合,但经过有点"黑箱",不太明晰它怎么筛选信息、怎么作念的决策,但遭遇问题知谈换个措施试试,很可爱小红书这类叮咛平台,这让它可能更擅长找到一些粗浅用户共享的、非官方的、以至有点"网红"性质的地点或体验。这可能是个上风,能挖到那种更依赖官方或结构化数据的 AI 找不到的信息。对于想平直"抄功课"的用户来说,可能更平直、更省事。
而 Manus 的经过(https://manus.im/share/brWKUSp51ItvVMBpcXNCZ1?replay=1 任务演示视频)更透明,用的智力更千般,终末给的东西(行程、求婚指南、手册分开)更规整、更专科。
举座来看,经过此次 AutoGLM 千里念念的评测体验,固然有一些槽点,但不得不说,AutoGLM 千里念念给东谈主的印象确乎是贫寒得令东谈主印象深化,而且商量到其免费特质,它很可能是你能斗殴到的最佳用的免费 AI 劳能源了。它就像一位不知疲劳的实习生,缄默在后台为你征集信息、整合分析,而且王人备免费。这意味着你可以宽心尝试千般不同场景,探索它的智力边界。免费的最大平允即是极低的试错资本,用户可以宽心肠让它尝试千般不同的控制场景和任务。探索它的智力边界。
天然,它也有彰着的短板。任务处理速率不算快,有时一个分析可能需要半小时以上。不外好在你不必干等着,王人备可以让它在后台缄默使命,我方去向理其他事情。独一的小烦躁是,它会时常地自动掀开新网页,如果你正在 Chrome 浏览器中使命,可能会有些侵扰。
这巧合是东谈主类与 Agent 之间的第一次"领地争夺战"——谁才是电脑的确切主东谈主?(笑)伪娘 拳交