模型

我的私人 LLM Leaderboard

语速

2025-12-16

  • Code Agent: Sonnet 4.5
  • Talk: Opus 4.5

2025-10-24

  • Code Agent: Kilo Code - GLM 4.6
  • Code Agent: Claude Code - Sonnet 4.5 or Deepseek Reasoner (v3.2)
  • 解决困难问题: Claude Sonnet 4.5
  • 日常对话: GPT-5

2025-10-09

当前工作流:

2025-09-22

当前工作流:

2025-08-08

工作流:

2025-07-27

阿里云官方的 qwen 实在是忒贵了,都搞不清楚为什么,50块就划掉了。而且实际上通过 leaderboard 上的测试,性能不如 r1-0528。

2025-07-26

Previous

Licensed under CC BY-NC-SA 4.0