首页  >  资讯  >  文章
2024-01-02 16:19

年末盘点丨GPT-4横扫天下、Photoshop集成大模型、Pika惊艳登场…2023年「AI元年」行业都发生了这些大事!

2023年已经过去,这一年被不少科技博主称为「AI元年」。而今天,已经是2024年的第二天,也是全球打工人的第一个工作日。

来自Everypixel Journal的一份统计报告,以AI工具推出的时间线维度,为我们从头到尾梳理了2023年3月~12月AI行业值得关注的若干大事件。

图片

这份报告将今年井喷的AI创作工具主要分为三大门类:文本生成、图像生成以及视频生成。

文本生成工具

为啥要从3月开始看起?大概是这个月里,GPT-4、Bard先后发布,直接把大模型趋势推向更高潮。

这和Writerbuddy的数据也有所对应,2023年的3月~4月,光这一个月内,50大热门AI工具的总访问量增加了9亿,是调查期中AI工具日活增速最快的一个月。AI聊天机器人的能力也是从这时开始向各个维度延伸。

其中,谷歌的Bard使用多模态数据集训练而成。GPT-4发布后不断更新,扩展了插件、联网、支持语音、图像生成等功能。

另一边是Meta发布著名的开源大模型Llama 2,催生了大批“羊驼变种”,AI模型的开源社区也热闹了起来。

图片

此外,开发者平台Stack Overflow推出OverflowAI,支持AI驱动搜索,开发者可在Visual Studio Code和Slack中轻松找到所需信息。

还有一款开源模型是Mistral AI推出的Mixtral 7B,Mixtral 7B也是开源基础模型里最强的那一档,可以越级挑战13B、34B。基于Mistral-7B微调的Zephyr-7B-beta也成为了多个评测排行榜前排唯一的7B模型。

另外,11月李开复的零一万物推出Yi-34B,在Alpaca经认证的模型类别中,以94.08%的胜率,超越LLaMA2 Chat 70B、Claude 2、ChatGPT。

马斯克7月份成立的新公司xAI也发布了自家第一个大模型Grok,据说可以实时获取推特(X)平台的数据。

年末也很重磅,先是谷歌发布新模型Gemini,被称作是和ChatGPT性能最为接近的竞争者之一。

而后Mistral AI年末推出Mixtral 8x7B(70亿参数×8个专家模型),这是首个开源MoE大模型。MoE架构也就是传闻中GPT-4采用的方案,可以说这是开源大模型离GPT-4最近的一集。

图像生成工具

2023年,图像生成领域竞争格外激烈。

3月份,Adobe Firefly大模型发布,Adobe Firefly被集成到最多人使用的绘图工具Photoshop中,艺术字文本创作的效果也是一大看点。

图片

Midjourney推出V5版本,提高了图像生成效率、连贯性和分辨率 。最近的12月份,V6版本也问世,带来了5大升级,支持在图像上进行简单的文本单词生成。

图片

不得不提的还有ChatGPT的绘图搭档DALL·E 3,DALL·E 3无需复杂提示工程,简化了图像生成,且还能根据用户反馈细化提示并进行图像调整。

图库网站Shutterstock也推出了AI功能,用户可使用AI生成新内容,也可对图库中的图片进行简单编辑、转换。

图片生成领域也已今时不同往日,下面是2007年文本-图像生成和2023年的效果对比:

图片

视频生成工具

视频生成效果在2023年发生显著变化。Pika在最初内测版推出的时候就引了50万用户,每周生成数百万视频。年末,Pika 1.0的升级使用户能够以3D动画、动漫、卡通、电影等各种风格创建编辑视频。

Meta这边还推出了Codec avatars,该模型专注于视频中的3D人脸生成。

Runway的Gen-2模型将视频效果一口气拉到了4K超逼真的高度,且做到这种效果只需简单一句话输入。

图片

AI翻译配音工具HeyGen推出了AI视频创作工具,包含100+数字人素材和模板,还支持300+不同音色和40+语言。只需选形象、写文本、等输出三步,就能让霉霉很自然的开口说中文。

图片

此外,Stability AI也推出了自家视频生成工具Stable Video Diffusion,不仅支持文本到视频、图像到视频生成,还支持物体从单一视角到多视角的转化。

总之,在AIGC的各个领域,都是竞争格外激烈的一年。

但行业中也发生了一些重大合作,值得关注。首先是行业领头羊之间的重大合作。

Stability AI & Init ML

Stability AI收购了图像处理应用ClipDrop背后的核心团队Init ML,将Stability AI整合到ClipDrop的生态系统中,促成了SDXL Turbo的开发。

Runway & Getty Images

Runway与Getty Images联手,推出了新的视频生成模型RGM,将Runway的AI功能与Getty Images的创意内容库相结合,改变了内容创作流程,使公司能够根据其品牌形象生成高质量的定制视频。

Snowflake & Neeva

数据仓库平台Snowflake收购了使用生成式AI工具来增强搜索体验的初创公司Neeva,Neeva最近关闭了无广告搜索引擎。

Shutterstock & OpenAI

Shutterstock和OpenAI已达成为期6年的合作伙伴关系,Shutterstock为OpenAI提供图像、视频、音乐库等高质量数据集。

整个人工智能行业也在2023年发生了一些里程碑事件。

最明显的就是法律方面——OpenAI等AI巨头都深陷维权争议,这也促成了AI方面立法脚步的推进。

比如欧洲议会、欧洲理事会和欧盟委员会三方就《人工智能法案》达成协议。该法案将成为全球首部人工智能领域的综合性监管法规。以及美国版权局明确了对AIGC生成的内容的司法立场:拒绝为AI生成的图像注册版权。同时全球各国也在积极出台治理AI方面的政策条款。

最后,报告还列出了一些行业热议事件。

其中3件都和OpenAI有关。分别是:

① 摩根大通、花旗集团等金融机构出于安全考虑限制员工使用ChatGPT;

② OpenAI低薪雇佣人工筛查ChatGPT敏感内容;

③ OpenAI的管理层与董事会之间发生的宫斗内讧。

图片

另外,这份报告还关注了2023年索尼世界摄影大赛,首次出现评委将获奖颁给AI而非人类摄影师的事件,当时创作者拒绝领奖并宣布自己是AI生成图像,引发了关于AI创作方面的激烈讨论。

总之过去一年里,AI行业诞生了许多新事物,也发生了许多前所未有的大事件。通过它们可以更好理解2023,也能更好展望已经到来的2024。

2

相关文章