Featured image of post 高效省钱:我的 AI Agent 工作流选择

高效省钱:我的 AI Agent 工作流选择

分享我使用 OpenCode + Gemini 3 Flash 的高效省钱工作流

语速

Claude Code 一个月 $100 费用有些高,很多朋友都有点扛不住。为了解决问题,我实践了一套工作流。

模型方面,我的建议是,选择 Gemini 3 Flash 的按需用量作为替代。

原因:Gemini 3 Flash 性价比极高;响应速度快、处理效率高,价格仅为 Opus 和 Sonnet 的几分之一。对于大多数任务,Flash 版本已经足够使用。

省钱的 Workflow

一个经济实惠的工作流:

  • 制定计划:使用 Gemini 3 Flash
  • 执行构建:使用 OpenCode 提供的免费 GLM 4.7(或 MiniMax M2.1)。亦或者你已经购买了 Zhipu Coding Plan

提到 Gemini 3 就不能不提 GPT-5.2。

首先,部分工程师不使用 coding agent,而是使用直接使用 ChatGPT.com。这种使用方式且不论是否高效,可靠性就令人担忧。从实际体验来看,GPT-5.2 的回复语气做了拟人化微调,过于迎合用户。虽然可以调整语气,但对于专业开发者来说可能不是最佳选择。

GPT-5.2 回复语气截图

此外,尽管 GPT-5.2 在 SWE-bench veried 上得到了较好的性能,但是我实际体验不好。这就不得不说一下 SWE-bench 的历史:

SWE-bench 最初由普林斯顿大学团队提出(ICLR 2024),用于评估语言模型解决真实 GitHub 问题的能力。

但问题在于:2024年8月,OpenAI 的 Preparedness 团队与原作者合作,推出了 SWE-bench Verified(500个经过人工验证的问题子集)。由于 OpenAI 参与了这个新版本 benchmark 的设计,因此在这个 benchmark 下测试的 OpenAI 模型性能值得怀疑。这并不一定是主观引入性能优化,但是 Bias 在这种情况下,极有可能存在。

还是那句话:从实际使用上来看,codex 总不能带来特别理想的结果。

一些 opencode 技巧

  1. 通过 OpenCode 使用 Agent

OpenCode 支持启动 SubAgent。调试前后端代码时,可以让 OpenCode 在不同目录启动 Agent,有效避免权限问题。

  1. OpenSpec:跨 Agent 共享规范
1
2
3
4
1. OpenCode + Gemini 3 Flash → 生成 proposal
2. Codex → 代码审查
3. Claude Code → 再次审查
4. OpenSpec Apply → 最终执行

OpenSpec 生成 spec 是靠谱的,但是有时候便宜模型代码质量不行。这个时候可以多生成几次,使用 spec 生成多次,从中挑选最好的结果。

最后,如果从 PR 看到确实不行,仍可以继续采用 sonnet 4.5 来实现代码。

思考

作为 Agent 工程师,我们需要基于以下趋势做决策:

  1. 模型会越来越聪明
  2. 执行速度会越来越快
  3. 价格会越来越便宜

虽然这是大趋势,但在实际任务中仍需平衡计算速度、成本和最终效果。也许很快就会出现能够自动平衡这些因素的 Agent 系统,但是现阶段考虑这些问题,没错。