首页  >  资讯  >  文章
2024-03-12 11:06

马斯克即将开源的大模型Grok AI什么水平?V1.0版本性能超GPT-3.5、LLaMA2-70B,本月将推V1.5版本

AI奇点网3月12日报道丨当地时间3月10日,马斯克通过推特(X)平台宣布,自家人工智能研究公司xAI,计划在本周内开源人工智能助手Grok。

马斯克宣布将开源其人工智能模型Grok,作为针对OpenAI诉讼“道德制高点”的回应。Grok是马斯克旗下的xAI公司开发的人工智能聊天机器人,于去年11月发布与OpenAI的ChatGPT不同,Grok可以通过推特(X)社交媒体平台获取实时的新闻信息,并回答其他一些人工智能系统拒绝回答的更多热点问题。

这一举措与马斯克在对OpenAI的诉讼中提出的要求一致,即为了推进开源人工智能(AGI)以造福人类Grok是一个旨在回答几乎任何问题的人工智能,具有幽默和叛逆特质,可以通过推特(X)平台拥有接触全世界实时知识的优势。

根据使用者的介绍,Grok-1模型在编码任务和MMLU任务上表现良好,水平介于GPT-3.5和GPT-4之间。

这款类似ChatGPT的AI聊天对话机器人产品,去年11月首次亮相,针对生成文本、代码、邮件和信息检索等多个领域提供功能。Grok经过测试,其性能在某些方面超越了GPT-3.5和LLaMA270B,但相对于GPT-4略显不足。

根据xAI官方公布的信息,Grok的开发团队采用了创新的训练方法。首先,他们训练了一个包含330亿参数的原始大模型Grok-0,其性能相当于拥有700亿参数的LLaMA2,但只使用了大约于Meta一半的训练资源。紧接着,基于Grok-0的原始模型,进行了蒸馏和微调,并推出了Grok-1。

根据公开的测评榜单,Grok-1在多个测试平台上的性能表现显著,超越了LLaMA2-70B和GPT-3.5。然而,在与Claude 2和GPT-4的比较中,仍存在一定差距。开发团队还通过人工测试,使用了2023年匈牙利全国高中决赛的数学题,结果显示Grok-1在考试中以C级(59%)的成绩通过,相较之下,Claude-2获得55%,GPT-4则以68%的成绩获得B类评级,显示其推理能力较为优越。

尽管Grok-1在信息处理方面表现卓越,但需要注意的是其生成的内容仍需审核。并且Grok-1不是一款多模态产品,缺乏独立搜索网络的能力。

马斯克还透露,最快将在未来两周内发布Grok-1.5版本。据悉,Grok V1.5将为用户带来一系列令人期待的新功能,其中最为引人注目的当属「Grok分析」按钮。这一创新功能能够自动梳理并总结整个对话线程及回复,极大地帮助用户在面对复杂对话时轻松把握关键信息。

在谈到「Grok分析」功能的灵感来源时,马斯克幽默地透露,这一想法源于动画电影《马达加斯加的企鹅》中的企鹅角色——Kowalski,它是主角团企鹅三人组里边的军师。坚如磐石的Kowalski是Skipper身边的二把手,时时向他提供完成任务所需的原始数据。Kowalski做事如科学家般的精准无误,却又有神学家一样的献身精神,他牵强附会的分析与细致入微的观察让企鹅们的冒险历程在真实与幻想间取得了绝佳的平衡。

「Grok分析」功能就会类似于动画片里边的“Kowalski分析”。这一趣味横生的背后故事无疑为Grok V1.5增添了一抹独特的色彩。

马斯克选择开源Grok的背后可能与最近起诉OpenAI有关,强调兑现早期开放AI理念,反对转向闭源盈利的商业行为。马斯克的xAI公司试图致力于确保人工智能技术仍然是一股正义的力量,通过设计出对各种背景和政治观点都有用的AI工具,并在遵守法律前提下增强用户能力。

5
查看相关话题: #Grok AI #马斯克 #xAI

相关文章