马斯克即将开源的大模型Grok AI什么水平？V1.0版本性能超GPT-3.5、LLaMA2-70B，本月将推V1.5版本-AI奇点网

首页 > 资讯 > 文章

2024-03-12 11:06

马斯克即将开源的大模型Grok AI什么水平？V1.0版本性能超GPT-3.5、LLaMA2-70B，本月将推V1.5版本

AI奇点网3月12日报道丨当地时间3月10日，马斯克通过推特（X）平台宣布，自家人工智能研究公司xAI，计划在本周内开源人工智能助手Grok。

以身作则兑现开源承诺：马斯克宣布xAI公司本周内开源Grok AI大模型

马斯克通过推特（X）平台宣布，自家人工智能研究公司 xAI，计划在本周内开源人工智能助手 Grok。

阅读文章

马斯克宣布将开源其人工智能模型Grok，作为针对OpenAI诉讼“道德制高点”的回应。Grok是马斯克旗下的xAI公司开发的人工智能聊天机器人，于去年11月发布与OpenAI的ChatGPT不同，Grok可以通过推特（X）社交媒体平台获取实时的新闻信息，并回答其他一些人工智能系统拒绝回答的更多热点问题。

这一举措与马斯克在对OpenAI的诉讼中提出的要求一致，即为了推进开源人工智能（AGI）以造福人类Grok是一个旨在回答几乎任何问题的人工智能，具有幽默和叛逆特质，可以通过推特（X）平台拥有接触全世界实时知识的优势。

根据使用者的介绍，Grok-1模型在编码任务和MMLU任务上表现良好，水平介于GPT-3.5和GPT-4之间。

这款类似ChatGPT的AI聊天对话机器人产品，去年11月首次亮相，针对生成文本、代码、邮件和信息检索等多个领域提供功能。Grok经过测试，其性能在某些方面超越了GPT-3.5和LLaMA270B，但相对于GPT-4略显不足。

根据xAI官方公布的信息，Grok的开发团队采用了创新的训练方法。首先，他们训练了一个包含330亿参数的原始大模型Grok-0，其性能相当于拥有700亿参数的LLaMA2，但只使用了大约于Meta一半的训练资源。紧接着，基于Grok-0的原始模型，进行了蒸馏和微调，并推出了Grok-1。

根据公开的测评榜单，Grok-1在多个测试平台上的性能表现显著，超越了LLaMA2-70B和GPT-3.5。然而，在与Claude 2和GPT-4的比较中，仍存在一定差距。开发团队还通过人工测试，使用了2023年匈牙利全国高中决赛的数学题，结果显示Grok-1在考试中以C级（59%）的成绩通过，相较之下，Claude-2获得55%，GPT-4则以68%的成绩获得B类评级，显示其推理能力较为优越。

尽管Grok-1在信息处理方面表现卓越，但需要注意的是其生成的内容仍需审核。并且Grok-1不是一款多模态产品，缺乏独立搜索网络的能力。

马斯克还透露，最快将在未来两周内发布Grok-1.5版本。据悉，Grok V1.5将为用户带来一系列令人期待的新功能，其中最为引人注目的当属「Grok分析」按钮。这一创新功能能够自动梳理并总结整个对话线程及回复，极大地帮助用户在面对复杂对话时轻松把握关键信息。

在谈到「Grok分析」功能的灵感来源时，马斯克幽默地透露，这一想法源于动画电影《马达加斯加的企鹅》中的企鹅角色——Kowalski，它是主角团企鹅三人组里边的军师。坚如磐石的Kowalski是Skipper身边的二把手，时时向他提供完成任务所需的原始数据。Kowalski做事如科学家般的精准无误，却又有神学家一样的献身精神，他牵强附会的分析与细致入微的观察让企鹅们的冒险历程在真实与幻想间取得了绝佳的平衡。