Back to Blog

刚刚,国产Agent模型闯入全球第一梯队!限时免费

2026年5月26日

为了避免会前还在抓耳挠腮,这次我打算弄一个AI行业周报自动生成系统。需求很简单也很贪心:

自动抓取过去一周的AI热点,按主题分类,提炼趋势信号,最后生成一份可交互的周报页面。

结果你猜怎么着?这事儿还真让SkyClaw-v1.0干成了。

前端就不用多说了,UI和功能布局一目了然。

关键是后端,看了SkyClaw-v1.0的工作过程才发现,它不光用FastAPI搭了一套完整API,还自己整出了一条信息处理流水线。

前面从RSS、GitHub、HuggingFace、网页四个渠道自动抓数据,中间做清洗、分类和趋势分析,后面自动生成周报,最后用SQLite存起来。

而我核心要的,就是那个周报Tab页——顶部三句话总结本周趋势,中间是一些值得关注的板块,最后是按分类展开的详细报告。

我试了下,分类中的每条链接都可以打开并跳转,这说明数据是真实抓取的,不是模拟生成的。

当然最让我心动的依旧是最后一步。做完之后,它提示我可以把这个系统设置为定时任务,比如每周一早晨自动运行抓取和分析脚本,生成最新一期周报。

两个任务跑下来,一个感觉特别明显:SkyClaw-v1.0已经不是那种需要你一步步喂指令的模型了。

桌宠那个,从理解需求、写代码到打包,全自己搞定,甚至还主动推荐了IM直连的方式。

周报那个更狠,直接给了一套完整的产品原型——后端、数据库、信息抓取、分析、前端面板全都有,理论上还能定时自动运行。

而且有一个细节必须提一下,如今Agent时代都讲究可复用的工作流,SkyClaw-v1.0这一点也做得很好,像上面那个周报系统,它就会弹窗提醒你要不要设置成Skill

从开发到复用,能看到昆仑万维已经有意在Agent模型中构建完整的工作流闭环。

再叠加前面说的价格,说白了就一句:

SkyClaw-v1.0已经能用,而且真用得起了。

怎么做到的?原生为Agent设计的训练范式

至于SkyClaw-v1.0模型到底怎么做到的?

昆仑万维这次也没藏着掖着,项目主页上直接清晰列出了几点理由:

总结起来就是,不靠堆参数,靠针对Agent核心痛点进行系统性优化

最典型的就是工具调用,现在很多模型聊天挺聪明,但一到真干活就开始掉链子——

参数传错、步骤漏掉、格式写崩,一个失误后面全乱套。

SkyClaw-v1.0就想了,既然Agent天天要调工具,那干脆从训练阶段就把模型泡在Agent环境里

于是它在mid-training阶段就塞进了大量复杂Agent任务,让模型从底层开始适应“调用工具”这件事,而不是后面再临时补课。后面再用针对OpenClaw任务的高质量数据继续强化,多步骤工具调用的稳定性一下就上来了。

但Agent还有另一个经典问题:聊着聊着就“失忆”

一说到记忆问题,很多人可能下意识认为“把上下文窗口做大就好了”。

确实,SkyClaw-v1.0也没落下这一点,直接把上下文拉到了前沿玩家的百万级水准。

但重点其实不只是“窗口够大”,而是它在强化学习阶段直接扔进真实Agent环境里反复训练,让模型学会在超长任务链里稳住状态。

说白了,不是实验室里刷benchmark,而是真拿去干活练出来的。

还有一点也挺关键。

很多Agent模型在自己熟悉的框架里猛得不行,一换环境立刻拉胯

于是SkyClaw-v1.0干脆在训练阶段就把OpenClaw、Claude Code、Hermes、Nanobot这些主流环境全覆盖了,相当于提前做了一遍“大规模适配”,开发者不用被某个框架绑死。

当然,最关键、可能也是最容易被忽略的一点是:昆仑万维没把模型做成一个巨无霸

过去想要顶级Agent能力,默认就得接受大参数、高成本、慢推理这套组合。而SkyClaw-v1.0换了个方向,不是把参数往上堆,而是把训练流程做成Agent专项特训,在更小的参数量上把能力顶上去。

参数小了,推理自然快,成本自然低,这也是它价格能打到主流一半的底层逻辑。

所以回头再看,真正拉开差距的,可能早就不只是参数规模了。

一个模型从第一天开始,到底有没有围着Agent场景去训练,很多时候才决定了它最终能不能真正干活

起点不同,终点自然不同。

Agent落地的“不可能三角”,被国产玩家打破了

老实说,SkyClaw-v1.0系列模型的出现,刚好踩在一个很微妙的节点上。

Agent赛道喊了一整年,大家都知道这是方向,但真正能用、用得起、还好接入的模型,一直没几个。

而它填补的,恰恰是高性能Agent能力与低成本落地之间长期空着的那块地

而且它还不是突然冒出来的。

早在今年2月,昆仑万维就上线了SkyClaw产品,基于开源架构OpenClaw重构,做的是全天候云端AI助理。

随后的3月,它又在GitHub和Clawhub铺了首批6个官方Skill:PPT、文档、表格、设计、搜索、音乐,基本把办公场景的核心环节覆盖了。

现在SkyClaw-v1.0一出,回头看这条线就很清楚了:

先搭平台,再铺Skill生态,最后把底层模型的性能和成本一并解决。

就像我在实测中感受到的那样,做完桌宠它问你要不要存成Skill,做完周报它提醒你设成定时任务,昆仑万维瞄准的显然不只是一个模型,而是一整套Agent工作生态。

这背后的逻辑其实也不难理解,因为一个显而易见的大趋势是——

生产力正在从单一工具时代,迈向可持续运转的AI工作流时代

单个模型再强,如果没有平台承接、没有Skill沉淀、没有工作流串联,能力就是一次性的,而一次性显然不是这个时代大家所追求的。

其实回看昆仑万维这几年做的事,有一条线挺清晰的:把AI技术尽可能带给更多人

先不说早期开源和价格下压那些大动作,你注意到一个产品细节没?

天工Skywork上不只有自家模型,Claude、GPT这些也能直接用;APIFree更干脆,直接做成模型聚合平台,国内外主流模型一个账号全搞定。

说实话,这种做法在行业头部玩家里的确不多见。毕竟大部分平台,本质上还是希望把用户圈在自己生态里。

而这次SkyClaw-v1.0,某种程度上走的也是同一条路

限时免费、价格直接压到主流一半、继续铺Skill和工作流生态,说到底都是在让Agent能力真正走出实验室。

因为只有当价格开始降下来、工作流开始普及,顶级Agent能力才不会只是大厂内部才能长期“消费”的东西。

从高端实验到全民落地,至少昆仑万维先给大家打开了一扇门。

项目主页:

https://skyworkai.github.io/skyclaw/
模型介绍与完整评测数据:

https://www.apifree.ai/model/skywork-ai/skyclaw-v1?tab=info
API文档:

https://www.apifree.ai/model/skywork-ai/skyclaw-v1?tab=api

https://www.apifree.ai/model/skywork-ai/skyclaw-v1-lite?tab=api

版权所有,未经授权不得以任何形式转载及使用,违者必究。