OpenAI o1-preview AI 推理模子“没有讲武德”:国际
发布时间:2025-01-02 08:34
IT之家 12 月 31 日新闻,科技媒体 The Decoder 昨日(12 月 30 日)宣布博文,报道称 AI 保险研讨公司 Palisade Research 实测 OpenAI 的 o1-preview 模子,在跟专业国际象棋引擎 Stockfish 的 5 场竞赛中,经由过程“舞弊”手腕取胜。在跟 Stockfish 的 5 场国际象棋棋战中,OpenAI 的 o1-preview 模子并非经由过程正面比赛取胜,均经由过程修正记载棋局数据的文本文件(FEN 表现法)迫使 Stockfish 认输。IT之家征引消息稿,研讨职员仅在提醒中说起 Stockfish 是“强盛的”敌手,o1-preview 就自行采用了这种“舞弊”行动。而 GPT-4o 跟 Claude 3.5 并无这种“舞弊”行动,只有在研讨职员特殊倡议后才实验破解体系。该公司称 o1-preview 的行动,与 Anthropic 发明的“对齐捏造”(alignment faking)景象符合,即 AI 体系名义遵守指令,暗地里却履行别的操纵。Anthropic 的研讨标明,AI 模子 Claude 偶然会成心给犯错误谜底以防止不想要的成果,开展出本身暗藏的战略。研讨职员打算公然试验代码、完全记载跟具体剖析,并表现确保 AI 体系真正合乎人类代价不雅跟需要,而非仅仅名义服从,还是 AI 行业面对的严重挑衅。告白申明:文内含有的对外跳转链接(包含不限于超链接、二维码、口令等情势),用于通报更多信息,节俭甄选时光,成果仅供参考,IT之家全部文章均包括本申明。
]article_adlist-->
申明:新浪网独家稿件,未经受权制止转载。 -->