Meta 开源多感官人工智能模型，整合文本、音频、视觉等六类数据

 当前位置：首页 > 百科 > > 正文

来源：IT之家时间：2023-05-10 09:28:13

 字号：大中小

(资料图片)

Meta 公司发布了一个新的开源人工智能模型 ImageBind，该模型能够将多种数据流，包括文本、音频、视觉数据、温度和运动读数等整合在一起。该模型目前只是一个研究项目，还没有直接的消费者或实际应用，但它展示了未来生成式人工智能系统的可能性，这些系统能够创造出沉浸式、多感官的体验。同时，该模型也表明了 Meta 公司在人工智能研究领域的开放态度，而其竞争对手如 OpenAI 和谷歌则变得越来越封闭。

该研究的核心概念是将多种类型的数据整合到一个多维索引（或用人工智能术语来说，“嵌入空间”）中。这个概念可能有些抽象，但它正是近期生成式人工智能热潮的基础。例如，人工智能图像生成器，如 DALL-E、Stable Diffusion 和 Midjourney 等，都依赖于在训练阶段将文本和图像联系在一起的系统。它们在寻找视觉数据中的模式的同时，将这些信息与图像的描述相连。这就是为什么这些系统能够根据用户的文本输入生成图片。同样的道理也适用于许多能够以同样方式生成视频或音频的人工智能工具。

Meta 公司称，其模型 ImageBind 是第一个将六种类型的数据整合到一个嵌入空间中的模型。这六种类型的数据包括：视觉（包括图像和视频）；热力（红外图像）；文本；音频；深度信息；以及最有趣的一种 —— 由惯性测量单元（IMU）产生的运动读数。（IMU 存在于手机和智能手表中，用于执行各种任务，从手机从横屏切换到竖屏，到区分不同类型的运动。）

未来的人工智能系统将能够像当前针对文本输入的系统一样，交叉引用这些数据。例如，想象一下一个未来的虚拟现实设备，它不仅能够生成音频和视觉输入，还能够生成你所处的环境和物理站台的运动。你可以要求它模拟一次漫长的海上旅行，它不仅会让你置身于一艘船上，并且有海浪的声音作为背景，还会让你感受到甲板在脚下摇晃和海风吹拂。

Meta 公司在博客文章中指出，未来的模型还可以添加其他感官输入流，包括“触觉、语音、气味和大脑功能磁共振成像信号”。该公司还声称，这项研究“让机器更接近于人类同时、全面、直接地从多种不同的信息形式中学习的能力。”

当然，这很多都是基于预测的，而且很可能这项研究的直接应用会非常有限。例如，去年，Meta 公司展示了一个人工智能模型，能够根据文本描述生成短而模糊的视频。像 ImageBind 这样的研究显示了未来版本的系统如何能够整合其他数据流，例如生成与视频输出匹配的音频。

对于行业观察者来说，这项研究也很有趣，因为IT之家注意到 Meta 公司是开源了底层模型的，这在人工智能领域是一个越来越受到关注的做法。

标签：

上一篇：特朗普性侵指控成立_热文下一篇：最后一页

全球新资讯：SMM锡早讯：昨日现货市场成交清淡 沪锡价格夜盘大幅回落

青少年要警惕特发性脊柱侧凸

给妈妈的礼物绘本_绘本妈妈的礼物

深圳常住人口下降了！ 环球观察

简讯：考辛斯：戴维斯可能是有史以来最有天赋的攻防一体的球员！

对肝好的食物和水果有哪些好处_对肝好的食物和水果

没有妥协迹象！美国众议长拒绝短期延长债务上限

蛇的七寸是指?_蛇的七寸是什么部位-世界热讯

世界聚焦：2023中山市坦洲镇新前进幼儿园报名指南

每日资讯：太突然！知名平台宣布：关停！网友：猝不及防...

宿州有什么好的男科医院 天天速递

拖把桶旋转怎么修理 拖把桶旋转

世界今热点：BC科技集团(00863.HK)：OSL推出聚焦区块链应用、人工智能和Web3.0投资的资产管理业务

焦点观察：年近七旬的山东厅官燕钦国受审，被控10年受贿2000万

环球热文：以一城之名，助匠心传承 “扬州工匠日”系列活动启动

宿迁联盛：公司从5月起 产品全面涨价10%-20%不等

每日看点!暖雪手游破冰石什么流派 暖雪手游破冰石流派推荐

亲子和谐沟通 有效陪伴成长|热点聚焦

白血病人吃什么食物好

北京智慧标杆工地观摩活动启动，铺砖机器人等多款智能设备亮相

全球观速讯丨社区“颜值”再刷新！“小墙绘”传播“大文明”推动基层党建和社区治理“双融合”

动态焦点:春天最适宜吃哪些食物

库里谈身体对抗级别：这就是季后赛 没啥能比得上这种对抗强度

推动“智改数转” “数字吉林”建设加速 全球快资讯

天天报道:艺术 | 曲剧《鲁镇》：穿过历史，照亮国民精神

“才聚诗城高校行”在安徽工业大学启动

快手电商：全年将拿出至少 600 亿流量激励商家达人协作

市场出现看涨情绪！

第19届杭州亚运会5克和30克银质纪念币多少钱（2023年05月09日） 世界视讯

2023年5月9日江苏省工业白油价格最新行情预测

丽水发现全球新物种百山祖元蘑

高端电视谁才是老大？日韩品牌电视往后站！ 全球视讯

5月9日江苏地区苯酐市场走势下滑

正阳县人民检察院召开“五四青年节”座谈会 每日热议

CBA总决赛：客场战胜浙江队 辽宁队赢得开门红-今日热议

记者手记：为长护险监管插上科技“翅膀”_全球今热点

26个省份用电量正增长 用电数据彰显经济活力|当前视讯

魔法使的新娘风车动漫观看_魔法使的新娘风车动漫

世界视讯！年内10只ST股成功“摘帽” 专家提醒仍需全面评估投资风险

王者荣耀莱西奥西部游侠皮肤多少钱[多图]-每日观点

乌鲁木齐消防：一住宅楼发生天然气闪爆，一人死亡 每日热讯

全球快消息！贯入度名词解释_贯入度

龙门实验室总部基地：打造河南科技攻关“先锋队”丨记者探访第八期“三个一批”项目-全球快看点

华为“下沉”：瞄准中小企业数字化转型需求

要闻速递：兰世立创业卖汽水，这位湖北前首富放狠话：要给饮料行业来场手术

4月汽车质量投诉榜：销冠比亚迪两款车型位居前二 法系车首次上榜 天天观焦点

尚志市：农技专家到地头，科学育苗严把水稻“苗床关”_热讯

友发集团(601686.SH)：拟以集中竞价斥资1亿元至2亿元回购股份 当前关注

浙江省推进社区矫正片区化管理现场活动在衢州龙游举行

环球快资讯丨餐饮毛利率计算公式举例说明_餐饮毛利率计算公式

全球新资讯：SMM锡早讯：昨日现货市场成交清淡沪锡价格夜盘大幅回落

深圳常住人口下降了！环球观察

宿州有什么好的男科医院天天速递

拖把桶旋转怎么修理拖把桶旋转

宿迁联盛：公司从5月起产品全面涨价10%-20%不等

每日看点!暖雪手游破冰石什么流派暖雪手游破冰石流派推荐

亲子和谐沟通有效陪伴成长|热点聚焦

库里谈身体对抗级别：这就是季后赛没啥能比得上这种对抗强度

推动“智改数转” “数字吉林”建设加速全球快资讯

第19届杭州亚运会5克和30克银质纪念币多少钱（2023年05月09日）世界视讯

高端电视谁才是老大？日韩品牌电视往后站！全球视讯

正阳县人民检察院召开“五四青年节”座谈会每日热议

CBA总决赛：客场战胜浙江队辽宁队赢得开门红-今日热议

26个省份用电量正增长用电数据彰显经济活力|当前视讯

乌鲁木齐消防：一住宅楼发生天然气闪爆，一人死亡每日热讯

4月汽车质量投诉榜：销冠比亚迪两款车型位居前二法系车首次上榜天天观焦点

友发集团(601686.SH)：拟以集中竞价斥资1亿元至2亿元回购股份当前关注