首页  >  资讯  >  文章
2024-04-28 09:19

苹果与OpenAI就AI功能合作恢复谈判丨清华团队打造国产「Sora」丨阿里开源1100亿参数Qwen1.5-110B

AI奇点网2024年4月28日报道丨AI资讯早报

苹果与OpenAI就AI功能合作恢复谈判

据华尔街日报当地时间4月26日报道,据知情人士指出,苹果公司就AI合作项目重启与OpenAI谈判。双方计划酝酿在今年秋季推出的新一代iPhone产品中使用后者的技术。两家公司正在探讨整合OpenAI技术到iOS 18/新一代macOS系统的可能性。

除此之外,苹果也在与谷歌、百度及其他AI公司讨论合作的机会,该公司CEO库克承诺今年苹果将在AI领域实现突破,如何将生成式AI引入iOS 18平台将是关键途径,此外手机端AI个人助理Siri也将获得改进。

清华团队打造国产「Sora」,画面效果比肩OpenAI 

生数科技和清华大学联合发布了新的AI视频生成模型“Vidu”,该模型可以一键生成长达16秒、分辨率达1080p的高清视频内容。“Vidu”在多镜头语言、时间和空间一致性、遵循物理规律等方面表现出色,能够产生非常逼真的超现实主义画面。

同时,“Vidu”还具有丰富的想象力,能生成现实世界中不存在的画面,为创作超现实主义内容提供了新的可能。全新技术突破仅用了两个月时间,迅速实现。

韩国团队打造IDM-VTON扩散模型,实现AI一键试衣

近日,一款AI图像生成模型的论文走红。该大模型由韩国科学技术院(KAIST)、OMNIOUS.AI共同打造,他们提出了一种名为「IDM-VTON」的新型扩散模型,该技术在提高服装保真度的同时,还能生成真实的视觉效果。

让 AI 系统帮顾客试穿衣服,想穿什么款式直接一键搞定。精准捕捉服装细节,衣服纹理、图案、缝线等属性高度还原:

图片

即使是在户外,AI 试衣也能准确展示试穿效果,保持较高质量的输出:

图片

人物坐立姿势对衣物有遮挡,AI 也会毫无破绽的实现一键换衣,高度保持服装细节的一致性:

图片

科大讯飞5月推出AI智能硬件「语音台历」产品

4月22日,科大讯飞在上周六的股票交易市场互动平台透露,该公司计划在 5 月推出一款 AI 大模型的智能硬件产品,这款产品是一种基于大模型开发的「智能台历」。将会在京东、天猫等电商平台上新搭载星火大模型的语音台历,具备更广泛的知识覆盖、更强的理解能力及更自然的人机交互。

这款语音台历产品的详细配置、规格信息,官方没有过多透露。根据外接推测,这跨产品可能类似于目前市面上的智能音箱产品,它更突出办公场景的需求,在日历台历与提醒事项日程、AI个人助理等方面,提供更多的智能化解决方案。

阿里开源1100亿参数Qwen1.5-110B模型,与Llama 3媲美

4 月 27 日消息,阿里巴巴日前宣布,开源 Qwen1.5 系列首个千亿参数模型 Qwen1.5-110B,该模型在基础能力评估中与 Meta-Llama3-70B 相媲美,在 Chat 评估中表现出色,包括 MT-Bench 和 AlpacaEval 2.0。

据介绍,Qwen1.5-110B 与其他 Qwen1.5 模型相似,采用了相同的 Transformer 解码器架构。它包含了分组查询注意力(GQA),在模型推理时更加高效。该模型支持 32K tokens 的上下文长度,同时它仍然是多语言的,支持英、中、法、西、德、俄、日、韩、越、阿等多种语言。

阿里 Qwen1.5-110B 模型与最近的 SOTA 语言模型 Meta-Llama3-70B 以及 Mixtral-8x22B 进行了比较,结果如下:

上述结果显示,新的 110B 模型在基础能力方面至少与 Llama-3-70B 模型相媲美。在这个模型中,阿里巴巴没有对预训练的方法进行大幅改变,因此他们认为与 72B 相比的性能提升主要来自于增加模型规模。

苹果、谷歌下架多款恶意「AI脱衣」应用

苹果、谷歌的手机应用商店近日下架了多款标榜可以实现“一键去衣”的AI应用,此类恶意AI软件广告曾在Meta旗下社交媒体平台上投放。Meta应对此问题采取了广告下架等措施,美国学生因使用相关软件而被逮捕。美国参议院提出《打击非法伪造图像法案》应对此类行为。

3

相关文章