Kimi升级到K2.5,一手测评

Kimi2.5官网更新,确定支持多模态输入,还支持视频输入理解,支持文生图,图生图,再次迈入第一梯队,我决定用kimi2.5替换那个傻不拉几的gemini!
在之前的使用中,kimi的长思考和思考深度在我用过的国模产型中绝对我心中的是No.1,但由于不支持多模态的理解,主要是图片,在分析一些UI问题,和UI设计上,使用非常不便,因此订阅到期就没续了,昨晚上kimi偷偷升级到了K2.5,今天一早官网也更新了,立马续订使用!
1.手机APP端,文生图/图生图测试
这时候我还没有升级订阅,是免费用户,看到kimi已经支持文生图和图生图(P图),通过调用Kimi Computer这个agent,免费用户有3次KO的额度。我让他帮我生成一张狗狗的照片,看起来效果还是不错的。之后又让他帮我P图,改成黑白照片也成功完成。


2.去官网看了一下,官网也更新了,昨天晚上我发一篇的时候还没更新,Kimi又深夜偷偷更新?,K2.5上线!
官网明确说了kimi-k2.5还能理解视频内容!!!
3.先测试一下自家的Kimi CLI,主要看一下是否支持当下最火的Skills
第一次安装使用Kimi CLI,发现版本号和Kimi的版本并不同步,版本显示是1.1,官网也说了Kimi CLI 目前还在 Technical Preview 阶段。

试一下是不是支持skills,先看能否找到skills,这是我目前的skill,有一个是我自己创建的用于完成“知乎的每日打卡任务的”项目级skill,看到也识别出来,但是并没有说明这个是项目级的,无伤大雅。
接下来,就试一下让kimi帮我完成知乎的打卡任务,可以成功调用我自己创建的“知乎打卡任务”的skill,我的这个skill是通过agent-browser这个skill实现的,也成功的调用了agent-browser,发现知乎没有登陆,提示让我登陆。
由于执行过程太长,就不贴图了,第一个任务发布一个想法完成了,在回答别人问题的时候,始终无法正确找到入口,尝试改用JS调用来完成,触发了知乎的反爬虫,再进一步尝试时,报了429,我是刚订阅的99的 Moderato套餐,官网查了一下,2048次的额度一下子干掉了108次,额度是够的,kimi Cli的右下角显示上下文使用 context: 14.3% ,上下文也没有过载,不知道这个报错是什么意思,总之测试以失败告终,之后我会再尝试接入Claude Code进行测试。
LLM provider error: Error code: 429 - {'error': {'message': 'The engine is currently overloaded, please try again later', 'type': 'engine_overloaded_error'}}


虽然这个任务失败了,我让它帮我给这篇文章生成一个公众号封面图吧,就是本篇文章的封面图,看着还是可以的,我觉得比gemini强,我在让gemini帮我完成知乎打卡任务的时候,浏览器都打不开!
关注我,评论区交流下你的使用感受,期待Kimi2.5接入CC之后的下一篇测评~
