全新通用大模型Gemini基准测评30项碾压GPT-4，谷歌演示视频上演现实版的“贾维斯”-AI奇点网

首页 > 资讯 > 文章

2023-12-12 12:00

谷歌开大！全新通用大模型Gemini基准测评30项碾压GPT-4，谷歌演示视频上演现实版的“贾维斯”

最新更新：当地时间12月8日，谷歌发言人在外媒彭博社的采访中承认，官方发布的 Gemini 演示视频并非真实交互效果实时录制。换而言之，仅仅只是广告效果。

谷歌于2023年12月8日发布了Gemini大模型，这是一款由6000亿个参数组成的多模态语言模型。Gemini是谷歌人工智能团队在LaMDA和PaLM的基础上开发的，能够处理文本、代码、音频、图像和视频等多种格式的信息。 Gemini在32项学术基准测试中都达到了SOTA水平，在MMLU测试中，Gemini Ultra的得分率高达90.0%，是第一个超过人类专家的模型。

谷歌Gemini大模型里边体积最小的Gemini Nano搭配AICore, 可用 LoRA 来做 Fine Tune。

这天迟早要来，但没想到这么快！

简单的一张架构图，开启在智能手机上实现大语言模型和生成式 AI 的序幕。

变革应该只是开始而已，将来做 IC 设计、 AI Compute Architecture 和手机上的生成式 AI 应用的等等，未来几年有得忙了！

这段谷歌的Gemini演示Demo视频，简直可谓是现实版的“贾维斯”，非常震撼，很好的展示了多模态大模型的未来！

【视频简介】

视频中展示了谷歌Gemini大模型的各种功能，如识别使用者画的图、猜出手部游戏的答案等，甚至还能理解手绘图中的逻辑并播放音乐。这标志着谷歌在AI领域取得了巨大进步。

【视频时间戳】

谷歌全新多模态大型语言模型Gemini，涵盖文字、声音、图像和影片处理，适用于不同应用场景。

00:01 谷歌发布多模态大型语言模型Gemini

00:31 鸭子识别：Gemini能够识别使用者画的鸭子并调侃鸭子的颜色

01:08 手绘图识别：Gemini能够识别手绘图，并推理出其中的逻辑，还能够识别手绘图中的文字

9

查看相关话题： #谷歌 #Gemini #AI大模型 #GPT-4

相关文章

鹅厂程序员

腾讯技术工程事业群（TEG）

作者已发布 24 篇文章

近期文章

更多

AI绘画趣味案例丨生成与「龙」相关的成语，你画我猜：龙年的成语！你能猜对几个？

AI绘画趣味案例丨生成与「龙」相关的成语，你画我猜：龙年的成语！你能猜对几个？

AI绘画趣味案例丨将中国34个省市区以古装大侠的形象呈现，会是什么样子？

AI绘画趣味案例丨将中国34个省市区以古装大侠的形象呈现，会是什么样子？

0成本借助AI搞钱！手把手教你掌握利用生成式AI绘图来绘制微信红包的封面：教程来了！躺赚！

0成本借助AI搞钱！手把手教你掌握利用生成式AI绘图来绘制微信红包的封面：教程来了！躺赚！

马斯克旗下AI聊天机器人Grok被曝出现尴尬“AI幻觉”：一直强调自己是OpenAI开发的产品丨官方回应：已经修复

上一篇

李飞飞团队×谷歌联合打造AI视频生成模型W.A.L.T：支持文生视频、图生视频以及3D建模成像片段

下一篇