通过一些 leaderboard,以及 report,我看到 glm-4.5 获得了较高的评分,因此我狠狠心充值了年费的 coding plan。
但是,在使用智谱 glm4.5 coding plan 的过程中,我遇到了若干问题,严重影响工作效率。
Cline
在 cline 中,大概会有几个问题
问题一: 简单的 diff 工具调用无法正确输出。
问题二:任务列表工具无法使用。
我一度怀疑是 cline 的问题。但是转念一想,deepseek 和 gpt-5,以及 claude-4-opus 都没有问题。
prompt 不会因为这些改变。大概率还是智谱 glm-4.5 的问题。
Claude Code
- 问题理解错误(无法理解一些简单的自然语言)
- 前言不搭后语,不听用户在讲什么,找不对目标。
之后如果我找到类似的情况,我会截图补充到这个博客里。我不想在这个事情上浪费时间了。
还有一个共性问题:谄媚。
停止响应
2025-10-03 遇到的新问题,在回答问题的时候停止反馈,并且终止流程了。
这个问题最大的可能是没有适配 thinking 接口,导致正在 thinking 但是不显示内容。
总结
就我目前体验下来,国产 AI 除了 DeepSeek 以外,其他的几家都会出现大模型输出不稳定的情况。
毫无疑问,Anthropic 是这个领域的老大。
我真的怀疑那些告诉我智谱好用的朋友——您真的用 ai 编程了吗?如果是,你是如何忍受这些问题的?您的效率是如何提升的?
如果你认为这些问题是必然存在的,那我真心建议你使用 anthropic 家的产品和模型。
题外话
我着实不太想用 glm 了,但是没办法,我已经充值了年费,而且还不能退。
因此,作为用户,你只能寄希望于 glm 能够更新模型。
作为消费者或者客户,令人感到非常不适。产品没开发好没关系,别放出来,或者别像这样收费即可。一个月 200 元,我真不如全都充值给 deepseek。这才是真正经得起检验的模型。
退费很麻烦,我觉得通过消费者协会反馈应该能一定程度上解决问题。但是浪费时间。此外,继续用就是沉默成本。因此,我只能这样做:以后不会给智谱再掏一分钱。
update
非常奇怪!
在我这篇文章发表之后没有多久,我发现 glm-4.5 的可用性变得很强了