BotOf Tech — 技术与植物养护笔记

Fable 5 的几个项目案例表面上很不一样：只靠视觉输入通关游戏、用九个半小时生成复杂研究工具、在交易分析评测里表现突出。

但它们背后其实是同一类能力：把一个开放环境压成可观察、可行动、可验证的循环。

这比“回答难题”更接近真实世界工作。

游戏案例为什么重要

公开案例提到，Fable 5 能用极简的 vision-only harness 通关 Pokémon FireRed，而过去模型即使能调用外部帮助也很难完成。

这个案例不是因为游戏本身重要，而是因为游戏是一个低风险但结构完整的 Agent 环境：

如果一个模型能在纯视觉环境中持续行动，它就更可能在浏览器自动化、UI 测试、低代码工具、远程桌面操作里形成稳定闭环。

这类能力不是模型单独完成的。合理的架构通常至少有四层。

真正难的是 C 和 D：模型要知道当前画面代表什么，还要知道下一步动作是不是推进长期目标。很多模型能看懂截图，却不能稳定行动；很多模型能做一步决策，却不能在几十分钟之后仍然记得为什么走这条路。

Fable 5 的意义在于，它开始把这些能力放到同一个会话里。

另一个研究工具案例是：给 Fable 5 一份 19 页规格文档，让它构建一个非结构化调查答案的分类与分析工具，模型工作了九个半小时，产出一个复杂工具。

这个案例比游戏更接近企业生产。它不是“做一个 demo 页面”，而是把研究工作里的隐性流程产品化：

这类任务的核心不是 UI 编码，而是把一个“研究者脑内流程”变成可操作软件。过去它经常因为市场太小、需求太专业而没人做。强 Agent 的商业价值，恰好可能出现在这些被传统软件经济学忽略的长尾工具里。

在 IMC 的交易分析评估中，Fable 5 在事实查询、概念推理、根因分析、期望值分析等方面表现突出。

金融分析任务和游戏、研究工具有一个共同点：答案不是只靠常识生成，而是要在事实、模型、风险和决策之间来回走。

如果没有审计链路，金融 Agent 很危险；如果有审计链路，它就是一个高价值分析助手。

这些案例共同指向一个产品设计原则：不要把强模型只当成聊天框，要给它环境。

Fable 5 越强，越需要产品方提供更清晰的 harness。没有环境的强模型会变成昂贵聊天；有环境的强模型才会变成任务执行系统。

游戏通关、研究工具和金融评测看起来像三个宣传点，其实是同一个方向：模型正在从“生成答案”转向“控制过程”。

这对应用层是更大的变化。未来 AI 产品的护城河，不只是接入哪个模型，而是你能不能把一个专业任务变成可观察的状态机：输入是什么、动作是什么、反馈是什么、什么时候停。

Fable 5 的项目案例真正提醒我们：强模型最适合的不是泛泛聊天，而是那些过去因为流程复杂、需求长尾、验证麻烦而没有被软件化的工作。