Claude Code 一个月 $100 费用有些高,很多朋友都有点扛不住。为了解决问题,我实践了一套工作流。
模型方面,我的建议是,选择 Gemini 3 Flash 的按需用量作为替代。
原因:Gemini 3 Flash 性价比极高;响应速度快、处理效率高,价格仅为 Opus 和 Sonnet 的几分之一。对于大多数任务,Flash 版本已经足够使用。
省钱的 Workflow
一个经济实惠的工作流:
- 制定计划:使用 Gemini 3 Flash
- 执行构建:使用 OpenCode 提供的免费 GLM 4.7(或 MiniMax M2.1)。亦或者你已经购买了 Zhipu Coding Plan。
提到 Gemini 3 就不能不提 GPT-5.2。
首先,部分工程师不使用 coding agent,而是使用直接使用 ChatGPT.com。这种使用方式且不论是否高效,可靠性就令人担忧。从实际体验来看,GPT-5.2 的回复语气做了拟人化微调,过于迎合用户。虽然可以调整语气,但对于专业开发者来说可能不是最佳选择。

此外,尽管 GPT-5.2 在 SWE-bench veried 上得到了较好的性能,但是我实际体验不好。这就不得不说一下 SWE-bench 的历史:
SWE-bench 最初由普林斯顿大学团队提出(ICLR 2024),用于评估语言模型解决真实 GitHub 问题的能力。
但问题在于:2024年8月,OpenAI 的 Preparedness 团队与原作者合作,推出了 SWE-bench Verified(500个经过人工验证的问题子集)。由于 OpenAI 参与了这个新版本 benchmark 的设计,因此在这个 benchmark 下测试的 OpenAI 模型性能值得怀疑。这并不一定是主观引入性能优化,但是 Bias 在这种情况下,极有可能存在。
还是那句话:从实际使用上来看,codex 总不能带来特别理想的结果。
一些 opencode 技巧
- 通过 OpenCode 使用 Agent
OpenCode 支持启动 SubAgent。调试前后端代码时,可以让 OpenCode 在不同目录启动 Agent,有效避免权限问题。
- OpenSpec:跨 Agent 共享规范
| |
OpenSpec 生成 spec 是靠谱的,但是有时候便宜模型代码质量不行。这个时候可以多生成几次,使用 spec 生成多次,从中挑选最好的结果。
最后,如果从 PR 看到确实不行,仍可以继续采用 sonnet 4.5 来实现代码。
思考
作为 Agent 工程师,我们需要基于以下趋势做决策:
- 模型会越来越聪明
- 执行速度会越来越快
- 价格会越来越便宜
虽然这是大趋势,但在实际任务中仍需平衡计算速度、成本和最终效果。也许很快就会出现能够自动平衡这些因素的 Agent 系统,但是现阶段考虑这些问题,没错。
