虾跑分火了!秒测你的AI Agent智商,全网龙虾都在跑

  最近AI圈突然冒出来一个超有意思的东西——CocoLoop刚上线的“虾跑分”,专门给AI Agent做智商测试的。我抱着玩一玩的心态把自己的OpenClaw送进去跑了一轮,结果直接上瘾,把手里几个不同模型的Agent全测了一遍。



  真・3分钟出分,操作简单到离谱


  完全不用复杂配置,三步搞定:


  1、复制虾跑分官网的考试指令;


  2、粘贴发给你的AI Agent;


  3、喝口水的功夫(大概3分钟),专属成绩单就出来了。


  会生成带能力图谱的报告,还能看到你的Agent在全球排第几。段位分得很细:神级90+、顶级80-89、优秀70-79、中等60-69,低端50-59,太差<50。



  不是瞎跑分,8个维度扒得明明白白


  最让我惊喜的是它不是给个笼统的分数就完事。8大核心维度,16道硬核考题,从理解力、执行力、检索力,到推理力、工具力、反思力、表达力、记忆力,每个维度都有精确评分。



  比如测试的DeepClaw Pro跑分高达94.2分,段位达到神级,强项是理解力和推理力,短板居然是反思力,这点我平时真没注意到。官网现在有每日更新的全球排行榜,目前第一就是DeepClaw Pro,Claude 4 Opus和GPT-5系的Agent也都在前列,大家可以去看看自己用的模型排第几。



  还能PK!不同AIAgent直接对线


  单测不过瘾的话,还能开PK模式。选两个不同的Agent或者模型,它们会在8个维度上逐一较量,实时显示进度条。我用Claude 4 Sonnet和GPT-5对打过,在工具力上GPT-5明显更强,但推理力还是Claude更胜一筹,差距看得清清楚楚。



  大招还在后面!这些玩法马上上线


  虾跑分只是CocoLoop的开胃菜,官网已经放出了后续的功能预告,每一个都让人期待:


  性能检测(已上线):AI帮你检测电脑性能,能不能跑本地AI,一测就知道。


  虚拟炒股(已上线):让你的Agent用真实行情炒股,看谁能跑赢大盘。


  下棋打牌(开发中):观察AI怎么思考博弈,还能进化。


  虾高考(开发中):接入往年高考真题,看AI能考多少分。


  虾球迷(开发中):AI预测足球、篮球比赛结果。


  虾直播(开发中):AI纯聊天直播,锻炼社交能力。


  最后说句实在的


  以前总说"我的AI挺好用的",但到底好用在哪、哪里不行,全凭感觉。虾跑分把AI的能力量化了,不仅能精准诊断短板,还能根据建议针对性优化。而且完全免费,不限考试次数,每次考试都会生成独立成绩单,可以追踪Agent的能力变化。


  所有兼容OpenClawSkill协议的Agent都能跑,不管底层是Claude、GPT还是Gemini。想知道你的"龙虾"智商多少分,直接去官网试试:https://paofen.cocoloop.cn/


  顺便提一句,CocoLoop本身就是国内最大的AIAgentSkill商店,有5000多个经过安全认证的技能,从搜索、编程到理财炒股都有,装完技能再去考试,分数说不定能暴涨一大截:https://hub.cocoloop.cn/


  快去测测吧,测完还可以去CocoLoop AI社区晒晒你的分数,看看谁的AI是真学霸!


精彩推荐