每日时讯!AI“百模大战”风向变了？360、美图先后出招视觉大模型上演“神仙打架”

来源：华夏时报时间：2023-06-22 12:54:51

随着AI大模型研发应用热潮持续高涨，记者注意到，赛道内的玩家开始将重心从语言大模型转向视觉大模型。近期，Adobe、Meta、360、美图等多家国内外互联网头部企业纷纷发表大模型成果，为本就火热异常的AI市场再添了一把火。

(资料图片)

“人工智能在视频领域的应用越来越受到重视。”中国通信工业协会两化融合委员会副会长吴高斌向《华夏时报》记者表示，这些大型AI模型的发布为企业间的竞争带来了新的动力。企业之间的竞争将促进技术创新和进步，同时也将带来更好的产品和服务。竞争还将促进企业间的合作和共享资源，从而更好地满足市场需求。

海内外视觉大模型“神仙打架”

在鳞次栉比的语言大模型、多模态大模型纷纷涌现之后，“视觉大模型”成为又一个兵家必争之地。日前，美图发布AI视觉大模型MiracleVision，一同发布的还有AI视觉创作工具WHEE、AI数字人生成工具DreamAvatar、美图AI助手RoboNeo等7款产品。

据介绍，MiracleVision具有强大的视觉表现力和创作力，能从绘画、设计、影视、摄影、游戏、3D、动漫等视觉创作场景反推技术演化。与市面上其他大模型不同，它尤其擅长亚洲人像摄影、国风国潮、商业设计等生成方向。

美图公司创始人、董事长兼首席执行官吴欣鸿在接受《华夏时报》记者采访时表示：“美图大模型的核心优势是‘懂美学’，C端用户基础足够大，大模型冷启动的获客成本低，美图目前有2.43亿的月活用户，全球VIP会员数为719万，能在短时间去验证产品成功与否。不同于其他厂商，美图大模型聚焦于美学（画面画质设计等），未来如果非要竞争，会在美学上面去‘卷’。”

无独有偶，360也日前正式发布“360智脑－视觉大模型”。 360创始人周鸿祎表示，大语言模型是构建视觉大模型的基础，多模态能力增强的核心是借助了大语言模型的认知、推理、决策能力。同时，视觉大模型也是“360智脑”的重要能力组成，能够看懂图片，未来还能看懂视频、听懂声音。

海外企业也已经开始在视觉大模型上布局。日前，社交媒体巨头Meta宣布，将向研究人员开放一个名为I-JEPA的“类人”人工智能模型的部分组件，该模型可以比现有模型更准确地分析和完成未完成的图像，而不是像其他生成式人工智能模型那样，只根据附近的像素进行推断。

Meta公司首席人工智能科学家杨立昆曾公开指出，当前的GPT自回归模型存在缺乏规划、推理的能力，未来GPT系统或将被抛弃，并给出了他认为的正确答案——世界模型。据称I-JEPA是第一个基于其愿景关键组成部分的AI模型，能比现有模型更准确地分析和完成未完成的图像。

除此之外，Meta还发布了语音生成AI模型“Voicebox”，支持从文本中生成语音，能够根据仅两秒长的样本匹配音频风格，并将文本样本转换为另一种语言，在给定单独的语音样本的情况下，并能够以说话者的原始语音朗读翻译后的文本内容，目前支持六种语言：英语、法语、德语、西班牙语、波兰语和葡萄牙语。

而早在今年4月，Adobe便将其Adobe Firefly功能（类ChatGPT产品）集成在Premiere Pro、After Effects、Audition、Remix等音视频产品矩阵中，为用户提供一键生成内容、剪辑、调色、更换音乐等功能。

从“语言大模型”到“视觉大模型”

《中国人工智能大模型地图研究报告》显示，从全球已发布的大模型数量及分布来看，中国和美国大幅领先，超过全球总数的80%。同时，欧洲、俄罗斯、以色列等越来越多的研发团队也在投入大模型研发。但值得注意的是，我国在计算机视觉等领域的大模型还较少。

究其原因，北京智源研究院访问首席科学家颜水成向《华夏时报》记者表示：“现在视觉模型发展稍微滞后的主要原因，是因为视觉大模型吃算力吃得比文本要大很多，所以我们也期待芯片更快速的发展，甚至有可能把非GPU其他的芯片融合在一起来做。现在大家见到的模型一般千卡级比较常见，但可能明年就有人会用万卡级来做。”

而在北京智源人工智能研究院院长黄铁军看来，视觉领域是大模型领域下一个浪潮的重点。他指出，视觉大模型和语言大模型背后的思想方法和基本路线是异曲同工的，只是输入的数据变成了图像和视频，训练出来的模型则具有一定的通用视觉语言能力，一种是之前提到的AIGC（人工智能自动生成内容），可以生成图像和艺术品，“还有一种更基本的能力，就是看到世界之后，得首先能把这个世界（万物）分清。”

对于视觉大模型的发展，不少机构也表达出看好的态度。中金研究发布的研报认为，计算机视觉未来有望实现更高程度的自动化、高精度和低功耗，进一步丰富元宇宙的内容生态，降低进入门槛。计算机视觉的进步引领了三维重建和动捕技术快速成熟，并逐渐在各自的领域积累技术进步。计算机视觉未来有望迎来更高程度的自动化、更高的精度，以及更低的功耗，逐渐在移动端实现更好的视觉效果，被应用在大量下游行业，逐渐迈向连接物理世界和数字世界的长期愿景。

中信证券研究也表示，在设计领域，大模型引领数字设计走向智能设计，相关工业设计软件结合GPT等技术，可应用在设计规划、布局优化、插件助手、草图绘制等场景，工业设计软件有望在AI升级的大趋势下迎来新一轮生产力革命。

（文章来源：华夏时报）

标签：

最近更新

每日时讯!AI“百模大战”风向变了？360、美图先后出招视觉大模型上演“神仙打架”

随着AI大模型研发应用热潮持续高涨，记者注意到，赛道内的玩家开始将重

时间：2023-06-22 12:54:51
第10届上海荷花睡莲展6月22日开幕

2023年6月20日，上海，第10届上海荷花睡莲6月22日开幕，为期两个月。古

时间：2023-06-22 12:05:43
水中分娩的好处和坏处_快来看看吧

1、好处：水中分娩是指在装满温水的分娩池中分娩。可以减少孕妇在整个

时间：2023-06-22 11:54:02
粤港澳大湾区12个“朋友圈”正在创新“出圈”_环球热消息

5G技术分联盟创造效益1 95亿元，78名工作室联盟维护骨干成长为企业岗位

时间：2023-06-22 11:06:53
农业农村部启动实施农垦两项行动推动粮油产能提升

农业农村部近日印发《农垦粮油等主要作物大面积单产提升行动实施方案（

时间：2023-06-22 10:10:05
炎性细胞因子IL-16在移植免疫反应中的作用及其机制_关于炎性细胞因子IL-16在移植免疫反应中的作用及其机制介绍

1、《炎性细胞因子IL-16在移植免疫反应中的作用及其机制》是依托北京大

时间：2023-06-22 09:45:07
十大著名管理学效应

加（微信：New-leaders）进入《领导者管理笔记》读者群►领导者说：公

时间：2023-06-22 09:11:49
世界关注：工商管理专业学科类别工商管理专业属于什么专业类别

1、所属类别:管理学专业介绍业务培养目标：本专业培养具备管理、经

时间：2023-06-22 08:09:07
即时焦点：丝杆是什么丝杆和丝杠的区别

1、看看就知道了。相信通过丝杆和丝杠的区别这篇文章能帮到你，在和好

时间：2023-06-22 07:08:08
实时：蜱虫叮咬后伤口图片大全_蜱虫叮咬后伤口图片

1、正常情况下被蝗虫咬过之后，我们应该尽快的对皮肤进行清洁处理，清

时间：2023-06-22 06:03:59
环球要闻：房贷利率转换为lpr好不好_房贷利率转换为lpr是什么意思

1、lpr是指贷款基础利率，由18家银行的利率共同决定，该利率每月20号会

时间：2023-06-22 05:08:24
环球今日报丨管理学的概念是什么（管理学概念）

理学的概念是什么，管理学概念这个问题很多朋友还不知道，来为大家解答

时间：2023-06-22 03:00:02
鲜活农产品运输绿色通道_关于鲜活农产品运输绿色通道简述

小伙伴们，你们好，今天小夏来聊聊一篇关于鲜活农产品运输绿色通道，关

时间：2023-06-22 02:43:19
习惯的英文形容词_习惯的英文

1、beusedtodoing习惯做某事be getusedto习惯于···。本文分享完毕，

时间：2023-06-22 00:59:15
宋都控股所持*ST宋都3.05亿股突遭司法冻结存单质押担保余额21.64亿元尚待解决

6月20日—21日，*ST宋都（即“宋都基业投资股份有限公司”，简称“宋都

时间：2023-06-22 00:37:36
6月21日抽奖合集全球播资讯

礼包https: b23 tv YXyUxD6泥膜https: b23 tv FYS0oCh立牌https: b2

时间：2023-06-21 22:22:12
如何提高服务意识和服务质量的方法_如何提高服务意识和服务质量全球观点

1、作为企业想要有良性发展的空间，除了产品质量要严格把关，产品品种

时间：2023-06-21 21:50:54
当前讯息：绿康生化：拟定增募资不超13亿元

【绿康生化：拟定增募资不超13亿元】财联社6月21日电，绿康生化公告，

时间：2023-06-21 20:51:36
600年非遗传承，“龙文化”如何让乡村火起来？

6月20日，农历五月初三，天空一碧如洗。阔别三年，“龙眼点睛”盛况再

时间：2023-06-21 20:14:21
当前快播：罗牛山股东户数减少100户，户均持股7.38万元

罗牛山最新股东户数10 39万户，高于行业平均水平。公司户均持有流通股

时间：2023-06-21 19:55:55
跳跃训练:落地技巧

1、跳跃训练：落地技巧！2、在爆发力训练中，跳跃训练是非常重要的组成

时间：2023-06-21 19:05:31
【旗舰】魅族21系列曝光窄边框直屏旗舰全系长焦安排上了？世界热点

今年下半年各家新品的更新节奏似乎都比往年快些，高通已预热将于10月24

时间：2023-06-21 18:48:11
当前快讯:什么黄填空词语_什么黄什么黄填空

你们好，最近小活发现有诸多的小伙伴们对于什么黄填空词语，什么黄什么

时间：2023-06-21 17:54:08
紧急提醒！特大暴雨，雷暴大风！端午节出行注意

不过，这轮清凉停留的时间非常短，今天开始，随着大陆高压东移，华北黄

时间：2023-06-21 17:57:18
全球看热讯：先玉1171玉米种多少钱？

先玉1171是由登海先锋公司在西南地区推出的优良玉米品种，具有抗性好、

时间：2023-06-21 17:24:07
环球微动态丨中伟股份：拟投建11万吨正极材料高镍前驱体项目

金融界6月21日消息中伟股份公告，公司全资二级子公司中伟香港鸿创与POS

时间：2023-06-21 17:00:01
世界快报:男子出门买早餐，在绿化带内迷路四天三夜！吃野花、喝露水……

出门买早餐竟在绿化带里迷路……四天三夜都没出来近日，杭州市萧山警方

时间：2023-06-21 16:29:23
今日要闻!通威太阳能（组件）两大基地建设高效推进

本报讯通威太阳能（组件）金堂基地16GW光伏组件项目首批设备进场仪式日

时间：2023-06-21 16:07:18
情暖端午新安银行防诈宣传走进社区

端午临近，粽叶飘香。为进一步弘扬中华民族传统节日文化，同时增强居民

时间：2023-06-21 15:45:20
环球信息:全国最美！山西三地上榜！

日前，第十九届中国（深圳）国际文化产业博览交易会发布“2023中国最美

时间：2023-06-21 15:34:04

X 关闭

滚动

专家

江苏：采取更加坚决果断措施迅速打赢苏州疫情防控战

深圳调整跨境货车内地接驳司机核酸检测为每日一检

X 关闭

滚动