<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>思考随笔 on Svtter's Blog</title><link>https://svtter.cn/categories/%E6%80%9D%E8%80%83%E9%9A%8F%E7%AC%94/</link><description>Recent content in 思考随笔 on Svtter's Blog</description><generator>Hugo -- gohugo.io</generator><language>zh-cn</language><lastBuildDate>Mon, 06 Apr 2026 21:49:34 +0800</lastBuildDate><atom:link href="https://svtter.cn/categories/%E6%80%9D%E8%80%83%E9%9A%8F%E7%AC%94/index.xml" rel="self" type="application/rss+xml"/><item><title>我还是自己写文章，以及对 GPT-5.4 的一些想法</title><link>https://svtter.cn/p/%E6%88%91%E8%BF%98%E6%98%AF%E8%87%AA%E5%B7%B1%E5%86%99%E6%96%87%E7%AB%A0%E4%BB%A5%E5%8F%8A%E5%AF%B9-gpt-5.4-%E7%9A%84%E4%B8%80%E4%BA%9B%E6%83%B3%E6%B3%95/</link><pubDate>Mon, 06 Apr 2026 21:49:34 +0800</pubDate><guid>https://svtter.cn/p/%E6%88%91%E8%BF%98%E6%98%AF%E8%87%AA%E5%B7%B1%E5%86%99%E6%96%87%E7%AB%A0%E4%BB%A5%E5%8F%8A%E5%AF%B9-gpt-5.4-%E7%9A%84%E4%B8%80%E4%BA%9B%E6%83%B3%E6%B3%95/</guid><description>&lt;img src="https://svtter.cn/p/%E6%88%91%E8%BF%98%E6%98%AF%E8%87%AA%E5%B7%B1%E5%86%99%E6%96%87%E7%AB%A0%E4%BB%A5%E5%8F%8A%E5%AF%B9-gpt-5.4-%E7%9A%84%E4%B8%80%E4%BA%9B%E6%83%B3%E6%B3%95/cover.jpg" alt="Featured image of post 我还是自己写文章，以及对 GPT-5.4 的一些想法" /&gt;&lt;p&gt;我重新让&amp;quot;自己&amp;quot;写文章了。之所以说&amp;quot;自己&amp;quot;写文章，是因为：&lt;/p&gt;
&lt;p&gt;最近几篇文章实际上都是让 deepseek 与我交流，然后我让 deepseek 输出的。&lt;/p&gt;
&lt;p&gt;在文章输出后，我会让 codex 润色一下。（但是 codex 润色的像💩一样。）&lt;/p&gt;
&lt;p&gt;中间也尝试过让 gpt-5.4 进行输出，也就是跟我交流 + 写初稿。&lt;/p&gt;
&lt;h2 id="问题是什么"&gt;问题是什么
&lt;/h2&gt;&lt;p&gt;之所以不用 gpt-5.4，这个看起来厉害无比的大模型，是因为 gpt-5.4 输出的结果实在是太垃圾了，AI 味道特别重，并且读起来一股子翻译腔，让人非常不舒服。除了翻译腔，还有一个比较大的问题是词不达意。中文在我看来是很容易有较多的语义和倾向性的，因此这种表达很容易偏离我本身的想法和医院。我认为中文讲究的是含蓄的表达，而不是平铺直叙。gpt-5.4 有大量的平铺直叙。让人非常不舒服。我想读者读下来肯定也会不舒服。&lt;/p&gt;
&lt;p&gt;但是归根结底，最主要的问题就是 AI 味道。AI 输出的文章普遍有 AI 味儿的问题，其中 gpt-5.4 最明显。&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;最近大概率是因为 codex 有 x2 优惠，大家都想用来试试。另外，Simple Codex 获得 Terminal Benchmark 认证的得分也让人多了很多信心。&lt;/p&gt;&lt;/blockquote&gt;
&lt;p&gt;不讲人话这个问题不是我自己的观点。这是大家的槽点。&lt;/p&gt;
&lt;blockquote class="twitter-tweet"&gt;&lt;p lang="zh" dir="ltr"&gt;先什么时候能让gpt讲人话，而不是叽里咕噜讲一堆车轱辘废话，难绷。&lt;/p&gt;&amp;mdash; 竹筒Tom (@0xAzathoth_) &lt;a href="https://twitter.com/0xAzathoth_/status/2040752766860329461?ref_src=twsrc%5Etfw"&gt;April 5, 2026&lt;/a&gt;&lt;/blockquote&gt; &lt;script async src="https://platform.twitter.com/widgets.js" charset="utf-8"&gt;&lt;/script&gt;
&lt;p&gt;在最近的文章中，我在沟通时说明：&amp;ldquo;不要对厂商有攻击性&amp;rdquo;，它就会写：&amp;ldquo;这篇文章不是针对谁&amp;rdquo;。典型的文章就是后来几个关于 LLM 价格讨论的几篇文章。&lt;/p&gt;
&lt;p&gt;他要是知道中文有个梗是&amp;quot;我不是针对谁，我是说在座的各位，都是xx&amp;quot;（出自周星驰电影）。我想就不会这么表达。&lt;/p&gt;
&lt;p&gt;因此我还是打算自己来写文章——锅也是我自己背。&lt;/p&gt;
&lt;h2 id="进一步分析---说说别的"&gt;进一步分析 - 说说别的
&lt;/h2&gt;&lt;p&gt;gpt-5.4 还有一个明显的问题，就是我说了不做，但是它仍然会做。还有就是自己输出的内容，明明输出了要做，然后下一步却没做。如果是比较长的多轮对话，显现出这个问题，我认为是可以接受的。但是目前这个情况，上一句刚说了要做，下一步就没做，这种表现，我觉得不太行。&lt;/p&gt;
&lt;p&gt;ASI 讲究的不仅仅是&amp;quot;安全&amp;quot;，实际上还有&amp;quot;对齐&amp;quot;。SAM 不了解这个。实际上&amp;quot;讲了不听&amp;quot;，就是没有做&amp;quot;对齐&amp;quot;。我不喜欢 Sam，这个问题实际上就是管理的问题。安全团队得不到承诺的 20% 计算量。那么自然对齐就会做不到。&lt;/p&gt;
&lt;p&gt;这一点我后续会再补充一些 supporting materials。或者新开一个博客聊聊。&lt;/p&gt;
&lt;p&gt;在与 opencode 的合作上，与其说是更开放，实际上则是狙击。我们用户占了便宜。厂商打得越厉害，用户才越能占到便宜。&lt;/p&gt;
&lt;p&gt;当 opus 额度下调之后，codex 马上就改成了根据 token 计费。&lt;/p&gt;
&lt;h2 id="也说两句豆包"&gt;也说两句豆包
&lt;/h2&gt;&lt;p&gt;另外，豆包则是一个典型的大阴阳师。群聊天到语音，均是如此。我也不知道这个语料是哪里出了问题。&lt;/p&gt;
&lt;p&gt;还有就是群聊小助手在群里怼人也是我没想到🤣&lt;/p&gt;
&lt;h2 id="补充"&gt;补充
&lt;/h2&gt;&lt;p&gt;恰好看到老冯云数也在说这个问题。&lt;a class="link" href="https://mp.weixin.qq.com/s/TINtWWri5ghccVnJ9BIEPw" target="_blank" rel="noopener"
&gt;&lt;em&gt;是的，我用AI写文章&lt;/em&gt;&lt;/a&gt;。&lt;/p&gt;
&lt;p&gt;他的文章看起来 AI 味道没有那么重。可能是 opus 比较适合写。&lt;/p&gt;
&lt;p&gt;此外，如果把自己的行文风格也作为其中 prompt 可能会进一步降低 AI 感觉。&lt;/p&gt;</description></item></channel></rss>