马斯克xAI发布Grok-1.5模型:可处理128k上下文、内存容量增加16倍!

0
caipng

就在今天,马斯克旗下的 xAI 公司部落客 上宣布推出最新的生成式 AI 模型 Grok-1.5!

部落客文章中有指,最新的 Grok-1.5 模型改进了 AI 的推理和解决问题的能力,并且在编码和数学任务的相关性能中有不错的进步。

Screenshot 2024 03 29 160348

从 xAI 所提供的数据来看,可以发现到 Grok-1.5 模型可以在包含小学至高中竞赛问题的测试中获得不错的成绩,例如:数学基准(MATH Benchmark)的测试里获得了 50.6% 的分数;在 GSM8K 基准上则取得 90% 的成绩;另外在评估代码生成和解决问题能力的 HumanEval 基准测试中得分 74.1%。

Screenshot 2024 03 29 160338

此外, Grok-1.5 模型在内存容量有所升级,增加了 16 倍之余,在上下文窗口中还可以处理高达 128k tokens 的长上下文,进而让 Grok-1.5 模型可以读取更长和更复杂的提示,并且还可以保持指令追踪的功能。

当然,xAI 官方也公开了 Grok-1.5 的基本构建方,它是基于 JAX、Rust 和 Kubernetes 的自定义分布式训练框架所构建的,而官方的自定义训练编排器可以自动检测有问题的节点再对其从训练作业中去除,借此做到优化检查点、数据加载和训练作业重启,以及最大程度地减少发生故障时的停机时间。

Screenshot 2024 03 29 160357

xAI 官方也强调,Grok-1.5 模型将会在未来几天内在 X 平台上提供给现有的测试人员和有订阅 Grok AI 的用户,并且还会同时推出新功能!

根据之前的报道,xAI 已经公开 Grok 模型的源代码,让大家免费构建和进行商用目的。而具体 Grok-1.5 新模型会在何时正式上线,还需等官方所释出消息为基准了,敬请留守 Zing Gadget 来获取最新消息!

About author

Amanda

文字人也有一个小小的玻璃心,家人们轻点喷~

订阅
通知
guest

0 Comments
内联反馈
查看所有评论
0
希望听到您的想法,请评论x