高效省钱：我的 AI Agent 工作流选择

语速

Claude Code 一个月 $100 费用有些高，很多朋友都有点扛不住。为了解决问题，我实践了一套工作流。

模型方面，我的建议是，选择 Gemini 3 Flash 的按需用量作为替代。

原因：Gemini 3 Flash 性价比极高；响应速度快、处理效率高，价格仅为 Opus 和 Sonnet 的几分之一。对于大多数任务，Flash 版本已经足够使用。

省钱的 Workflow

一个经济实惠的工作流：

制定计划：使用 Gemini 3 Flash
执行构建：使用 OpenCode 提供的免费 GLM 4.7（或 MiniMax M2.1）。亦或者你已经购买了 Zhipu Coding Plan。

提到 Gemini 3 就不能不提 GPT-5.2。

首先，部分工程师不使用 coding agent，而是使用直接使用 ChatGPT.com。这种使用方式且不论是否高效，可靠性就令人担忧。从实际体验来看，GPT-5.2 的回复语气做了拟人化微调，过于迎合用户。虽然可以调整语气，但对于专业开发者来说可能不是最佳选择。

GPT-5.2 回复语气截图

此外，尽管 GPT-5.2 在 SWE-bench veried 上得到了较好的性能，但是我实际体验不好。这就不得不说一下 SWE-bench 的历史：

SWE-bench 最初由普林斯顿大学团队提出（ICLR 2024），用于评估语言模型解决真实 GitHub 问题的能力。

但问题在于：2024年8月，OpenAI 的 Preparedness 团队与原作者合作，推出了 SWE-bench Verified（500个经过人工验证的问题子集）。由于 OpenAI 参与了这个新版本 benchmark 的设计，因此在这个 benchmark 下测试的 OpenAI 模型性能值得怀疑。这并不一定是主观引入性能优化，但是 Bias 在这种情况下，极有可能存在。

还是那句话：从实际使用上来看，codex 总不能带来特别理想的结果。

一些 opencode 技巧

通过 OpenCode 使用 Agent

OpenCode 支持启动 SubAgent。调试前后端代码时，可以让 OpenCode 在不同目录启动 Agent，有效避免权限问题。

OpenSpec：跨 Agent 共享规范

1
2
3
4
1. OpenCode + Gemini 3 Flash → 生成 proposal
2. Codex → 代码审查
3. Claude Code → 再次审查
4. OpenSpec Apply → 最终执行

OpenSpec 生成 spec 是靠谱的，但是有时候便宜模型代码质量不行。这个时候可以多生成几次，使用 spec 生成多次，从中挑选最好的结果。

最后，如果从 PR 看到确实不行，仍可以继续采用 sonnet 4.5 来实现代码。

思考

作为 Agent 工程师，我们需要基于以下趋势做决策：

模型会越来越聪明
执行速度会越来越快
价格会越来越便宜

虽然这是大趋势，但在实际任务中仍需平衡计算速度、成本和最终效果。也许很快就会出现能够自动平衡这些因素的 Agent 系统，但是现阶段考虑这些问题，没错。