经过数周铺天盖地的业内热议,anthropic于周二正式对外推出阉割版新模型 claude fable 5,应用开发者终于得以直观体验其旗舰模型 mythos 的基础版本。
体验过该模型的开发者表示,这款 ai 配得上外界的高度期待。在代码编写、通识分析、空间逻辑推理三大领域,它的表现全面超越anthropic过往所有模型;不过为防范技术滥用,所有网络安全相关提问会自动分流至性能偏弱的 claude opus 4.8 处理。
但首批测试者提到,面对简单、中等难度任务(类似人们在谷歌搜索、chatgpt 上常问的常规问题),这款新模型相比旧版提升并不明显。
claude fable 5 真正拉开差距的场景,是超长文本、高复杂度综合任务 —— 例如仅靠一段提示词,就能独立完成一整款电子游戏的开发。

anthropic与 stripe 称,若依靠多名工程师人工操作,该工程以往耗时长达两个月(当然,更具参考价值的对比对象是前代 ai 模型)。
不过 fable 存在一大短板:定价更高。其调用成本是上一代 opus 模型的两倍,但远低于anthropic此前放出的 mythos 原始定价(初代 mythos 报价为最新 opus 版本的五倍)。
一名早期测试者表示,claude fable 5 的令牌使用效率优于anthropic历史模型。举例来说,因其推理能力更强,写代码时出错更少、反复调试的次数大幅降低,部分场景下综合使用成本反而和 opus 4.8 基本持平。
即便优势突出,现在断言anthropic在模型性能上彻底领先 openai 等对手仍为时过早。一位同时拥有两家企业模型内测权限的开发者透露,他们正在测试的 openai 下一代模型,综合能力不输、甚至有可能强于 claude fable 5。
而anthropic本次针对 claude fable 5 新增的限制规则,将大幅抬高竞品的追赶门槛。此前 xai 等 ai 实验室普遍采用模型蒸馏技术:调取 openai、anthropic 顶尖大模型的输出数据,用来训练优化自家模型。
有观点认为,anthropic全新大模型瞄准专业重度用户,同时切断竞品ai蒸馏训练渠道还有较大的技术改进空间。