anthropic日前宣布,将修改其最新ai模型claude fable 5的开发者安全限制措施。此前,该公司因试图通过“隐蔽降级”模型性能来阻止竞争对手利用其技术开发新模型的政策,遭到了全球ai研究界的强烈反对。
anthropic在发给媒体的官方声明中承认,在这一政策的处理上“做出了错误的权衡”,并就未能平衡好相关关系公开致歉。该公司表示,将把此前隐蔽的限制措施调整为“对用户完全可见”。
本周早些时候,anthropic发布了最新版模型claude fable 5,并增设了防止滥用的安全护栏。

此举被指企图通过“秘密破坏”手段,落实其服务条款中禁止竞争对手使用其数据进行模型训练的规定。这一举措随即引发了ai科研界的广泛批评。
美国创新基金会高级研究员、前白宫人工智能顾问迪安·鲍尔(dean ball)在社交媒体上指出,在不告知用户的情况下暗中降低机器学习的研究性能,是一种极其敌视科研群体的行为,这种“秘密破坏”政策将严重阻碍ai安全领域的跨机构合作。
开源ai初创企业prime intellect研究负责人威尔·布朗(will brown)则直言,此举表明anthropic在行业中“过河拆桥”,试图垄断前沿ai研究。
布朗同时警告称,这种黑箱限制还将对独立第三方评估机构进行模型的安全与可靠性测试带来负面干扰。相关信息仍在持续更新中。