2 days ago 论codex的幽默虚假测试🌐 链接: https://linux.do/t/topic/2165379🔍 关键词: #codex🏷️ 分组: LinuxDo论坛🕒 时间: 2026-05-13 09:10:15 LINUX DO 论codex的幽默虚假测试 我:你把这个系统跑一下,然后把它的整个跑的流程固化下来,形成我们展示的基础。 Codex:(一顿猛猛干,一顿稳) Codex:结果非常成功! 我:(点进去一看) Codex写了个py脚本直接把整个链路的所有“模拟结果”(他自己认为的结果)用硬编码编辑出来然后直接生成一个虚假测试结果。 。。。。。。我在想这毛病是只有codex有还是其他模型也有……太蠢了……问题是我开的5.5 xh,按理来说不至于这么蠢吧。我写了几版Prompt都压不住