开发AI不需要靠人类了?Meta推出能“训练AI的AI”

阿六
metaaitrainai

就在刚刚,Meta推出一个“可以训练AI的AI”,进一步取代人力在训练AI的参与,让AI不依靠人类就能评估其他的AI模型是否有在正产耕耘做。

开发AI不需要靠人类了?Meta推出能“训练AI的AI”

根据Meta的说法,这个AI模型能够训练自己,或是其他的AI模型,甚至是能在没有人类反馈的情况下完成这些训练,这意味着这个AI能够自己评估其他AI模型的工作状况,实际表现等等,这些我们认为至少还需要人工进行的工作现在进一步的被压缩了。

在过去,训练AI需要透过一个名为Reinforcement Learning from Human Feedback(RLAIF)的机制,就是利用人力回应来判断AI的运作是否能行,而现在,这个行为也开始被认为是“缺乏效率”的,特别是现在各大AI厂商之间的竞争愈加激烈,这种过程也开始要被优化。

开发AI不需要靠人类了?Meta推出能“训练AI的AI”

对此,Meta这里就采用了一个“连环思考”(Chain of Thought),让AI能够将一个问题的复杂解答拆分成多个细小的步骤,这样就能进一步提升AI的精准度,而类似的技术在Open AI训练o1 AI模型的时候亦有派上用场。

然而这样连环套娃下去,AI监督AI,人类的运作越来越低,是否会持续加剧人类被AI取代的步伐呢?

Leave a Comment
订阅
通知
guest

0 Comments
内联反馈
查看所有评论
0
希望听到您的想法,请评论x