Meta发布新AI模型：利用AI来评估AI的能力，无需人类参与

梦里流年 10-20 5

默认

摘要： 率队在英超第轮客场击败伯恩茅斯之后切尔西主教练马雷斯卡出席了新闻发布会我认为我们踢了两场不同的比赛我认为上半场我们踢得很艰难而下半场则要好得多我认为上半场我们踢得很挣扎的原因是我们...

率队在英超第4轮客场1-0击败伯恩茅斯之后，切尔西主教练马雷斯卡出席了新闻发布会。我认为我们踢了两场不同的比赛。我认为上半场我们踢得很艰难，而下半场则要好得多。我认为上半场我们踢得很挣扎的原因是我们没有赢得对抗，也没有赢得二点球，而在这个球场面对这支球队，首先你需要表现出赢得对抗的渴望，然后战术部分也很重要，但首先你需要表现出这一点。

IT之家 10 月 19 日消息，据路透社报道，Meta 当地时间周五宣布，其研究团队推出了一系列新的 AI 模型，其中包括一个名为“自我训练评估器”的工具。该工具有望推动 AI 开发过程中减少对人类干预的依赖。这个工具早前在 8 月的论文中首次亮相，其使用与 OpenAI 新发布的 o1 模型类似的“思维链”技术，让 AI 对模型的输出做出可靠判断。

Meta发布新AI模型：利用AI来评估AI的能力，无需人类参与

这种技术将复杂问题分解为多个逻辑步骤，从而提高了在科学、编程和数学等高难度领域中的准确性。Meta 的研究人员使用完全由 AI 生成的数据来训练这个评估器，从而在这一过程中完全摒弃了人类的参与。

使用 AI 来评估 AI 的能力展示了实现自主 AI 智能体的可能性，这类代理能够从自身错误中学习。两位负责该项目的 Meta 研究人员表示，许多 AI 专家设想未来可以开发出“智能化程度极高”的数字助手，可以自主处理大量任务，而无需人类介入。

自我改进的模型有望减少目前使用的“基于人类反馈的强化学习”（RLHF）过程的需求。这一过程往往昂贵且低效，因为它依赖于拥有专业知识的人类来标注数据和验证复杂问题的是否正确。

“我们希望，随着 AI 的发展，它能超越人类，逐渐具备自行检查工作的能力，并在准确性上超过普通人类水平，”项目研究员之一 Jason Weston 说。“自我训练和评估的能力是实现超人级 AI 的关键因素之一。”他补充道。

IT之家从报道中获悉，包括谷歌和 Anthropic 在内的其他科技公司也在研究 RLAIF（基于 AI 反馈的强化学习）这一概念，但与 Meta 不同，这些公司通常不会公开发布其研究模型。

Meta 此次发布的其他 AI 工具还包括对其图像识别模型“Se ent Anything”的更新，一个加速大语言模型响应时间的工具，以及一些有助于发现新型无机材料的数据集。

标签：模型人类工具

海报

阅读

相关推荐