05:42 · May 22, 2026 · Fri 【SNSE Bench】首轮测试完成!包含成绩表!🌐 链接: https://linux.do/t/topic/2224731🔍 关键词: #api #codex🏷️ 分组: LinuxDo论坛🕒 时间: 2026-05-22 13:42:08 LINUX DO 【SNSE Bench】首轮测试完成!包含成绩表! 从预告帖发布到现在,经过了一个半月,SNSE 的首轮测试结果终于完工了。 本次测试包含 12 道题目,覆盖 14 个模型。总体上体现了目前模型之间的智力仍有较大差距。 很遗憾由于没有合适的模型渠道,本次没有测试 GPT-5.4/5.5、Claude Opus 4.6/4.7 等来自 OpenAI / Anthropic 的前沿模型。由于 DeepSeek API 接入 Cherry Studio 中的截断问题,参与测试的 DeepSeek 模型均来自网页 / App 端对话(图中的 DeepSeek…