通过一些 leaderboard,以及 report,我看到 glm-4.5 获得了较高的评分,因此我狠狠心充值了年费的 coding plan。
但是,在使用智谱 glm4.5 coding plan 的过程中,我遇到了若干问题,严重影响工作效率。
Cline
在 cline 中,大概会有几个问题
问题一: 简单的 diff 工具调用无法正确输出。
问题二:任务列表工具无法使用。
我一度怀疑是 cline 的问题。但是转念一想,deepseek 和 gpt-5,以及 claude-4-opus 都没有问题。
prompt 不会因为这些改变。大概率还是智谱 glm-4.5 的问题。
Claude Code
- 问题理解错误(无法理解一些简单的自然语言)
- 前言不搭后语,不听用户在讲什么,找不对目标。
之后如果我找到类似的情况,我会截图补充到这个博客里。我不想在这个事情上浪费时间了。
还有一个共性问题:谄媚。
总结
就我目前体验下来,国产 AI 除了 DeepSeek 以外,其他的几家都会出现大模型输出不稳定的情况。
毫无疑问,Anthropic 是这个领域的老大。
我真的怀疑那些告诉我智谱好用的朋友——您真的用 ai 编程了吗?如果是,你是如何忍受这些问题的?您的效率是如何提升的?
如果你认为这些问题是必然存在的,那我真心建议你使用 anthropic 家的产品和模型。
题外话
我着实不太想用 glm 了,但是没办法,我已经充值了年费,而且还不能退。
因此,作为用户,你只能寄希望于 glm 能够更新模型。
作为消费者或者客户,令人感到非常不适。产品没开发好没关系,别放出来,或者别像这样收费即可。一个月 200 元,我真不如全都充值给 deepseek。这才是真正经得起检验的模型。
退费很麻烦,我觉得通过消费者协会反馈应该能一定程度上解决问题。但是浪费时间。此外,继续用就是沉默成本。因此,我只能这样做:以后不会给智谱再掏一分钱。
update
非常奇怪!
在我这篇文章发表之后没有多久,我发现 glm-4.5 的可用性变得很强了