木星链 木星链
Ctrl+D收藏木星链
首页 > 比特币 > 正文

BIN:横跨6种模态 Meta开源AI模型ImageBind 为虚拟世界打开大门

作者:

时间:1900/1/1 0:00:00

来源:《科创板日报》

编辑宋子乔

当地时间5月9日,Meta宣布开源了一种可以将可以横跨6种不同模态的全新AI模型ImageBind,包括视觉、温度、文本、音频、深度信息、运动读数。目前,相关源代码已托管至GitHub。

何为横跨6种模态?

数据:Arbitrum链上已创建账户总量突破1000万个:8月9日消息,据Dune数据,以太坊Layer2解决方案Arbitrum链上已创建账户总量突破1000万个,本文撰写时达到约1012.9万个。此外,当前Arbitrum链上已创建合约总量为2,827,914个。[2023/8/9 21:34:06]

即以视觉为核心,ImageBind可做到6个模态之间任意的理解和转换。Meta展示了一些案例,如听到狗叫画出一只狗,同时给出对应的深度图和文字描述;如输入鸟的图像+海浪的声音,得到鸟在海边的图像。

加密交易公司Orthogonal Trading通过Maple Finance推出1690万美元USDC贷款:12月12日消息,据派盾PeckShield监测显示,加密交易公司Orthogonal Trading通过机构借贷协议Maple Finance推出1690万美元的USDC贷款,期限为30天,年利率为0%,据团队确认这是向Maple v2迁移过程的一部分。

据悉,Orthogonal Trading拖欠Maple Finance总计3600万美元的贷款。[2022/12/12 21:38:30]

未知地址将129573枚BNB转入币安:金色财经报道,Whale Alert监测数据显示,北京时间09:40:56,bnb1fnd0k开头的未知地址将129573枚BNB(约4270万美元)转入币安。[2022/11/1 12:03:26]

而此前的多模态AI模型一般只支持一个或两个模态,且不同模态之间难以进行互动和检索。ImageBind无疑具有突破性意义,Meta称,ImageBind是第一个能够同时处理6种感官数据的AI模型,也是第一个在没有明确监督的情况下学习一个单一嵌入空间的AI模型。

ImageBind能做到这些,核心方法是把所有模态的数据放入统一的联合嵌入空间,无需使用每种不同模态组合对数据进行训练

先利用最近的大型视觉语言模型它将最近的大规模视觉语言模型的零样本能力扩展到新的模态,它们与图像的自然配对,如视频-音频和图像-深度数据,来学习一个联合嵌入空间。

而以图像/视频为中心训练好AI后,对于原始数据中没有直接联系的模态,比如语音和热量,ImageBind表现出涌现能力,把他们自发联系起来。

有行业观察者已经迫不及待地将ImageBind于元宇宙联系在一起。

正如Meta的研究团队所说,ImageBind为设计和体验身临其境的虚拟世界打开了大门。该团队还表示,未来还将加入触觉、语音、嗅觉和大脑功能磁共振信号,进一步探索多模态大模型的可能性,“人类可使用多种感官学习、了解世界,借助ImageBin,机器离人类又近了一步”。

值得注意的是,Meta还表示,ImageBind可以利用DINOv2强大的视觉功能进一步提高其能力。DINOv2是Meta开源的计算机视觉领域的预训练大模型,同样与Meta的元宇宙愿景密不可分,MetaCEO扎克伯格此前强调,DINOv2可以极大地加持元宇宙的建设,让用户在元宇宙中的沉浸体验更出色。

尽管ImageBind目前只是研究项目,没有直接的消费者用户或实际应用。但可以想象的是,随着ImageBind模型逐步完善,AI应用场景将进一步拓展,元宇宙建设也将更进一步。

比如当ImageBind融入虚拟现实设备,使用者能获得更沉浸式的体验,玩家进入游戏后不仅能感受游戏场景的温度,还能感知物理层面上运动。

国盛证券分析师刘高畅此前大胆预测,1-5年内,随着多模态的发展带来AI泛化能力提升,通用视觉、通用机械臂、通用物流搬运机器人、行业服务机器人、真正的智能家居会进入生活。未来5-10年内,结合复杂多模态方案的大模型有望具备完备的与世界交互的能力,在通用机器人、虚拟现实等领域得到应用。

标签:BINMAGEMAGINDBINGO价格MAGE币MAGE价格Wrapped BIND

比特币热门资讯
MEV:以太坊用户的MEV收益时代来临?深度解读Flashbots推出的MEV-Share协议

原文作者:DanielLi,CoinVoice在区块链领域,最大化价值提取问题一直备受关注。MEV?是一种在区块构建过程中通过优化交易顺序从中获利的手段.

1900/1/1 0:00:00
AIG:中国鞋服行业首个AIGC准专业级设计大赛来了!

一方水土,孕育一种精气神。2023年,奇点已至,AI正开启新一轮的科技革命。而温州,正以“敢闯敢拼、勇猛精进”的精气神,快速拥抱AIGC.

1900/1/1 0:00:00
比特币:比特币减半叙事上线,生态迎来新时代

作者|Terry不知不觉间,伴随着「非典型熊市」的不断变换,加密世界中始终不曾褪色的「减半」叙事逐步临近——当前区块高度距离比特币剩余减半时间已不足一年,减半时间预计为2024年4月28日.

1900/1/1 0:00:00
SEQ:浅析跨链桥的6大发展趋势与演变方向

概述互操性的发展趋势,包括新的互操作性技术、基于乐观假设的桥及流动性共享层的一些协议等。今天来说互操作性目前的一些趋势.

1900/1/1 0:00:00
数字人:数字人民币产业联盟新增26家联盟单位

数字人民币产业联盟是由中国人民银行等多家单位共同举办的组织。它旨在整合各方力量,促进数字人民币的实践应用。在数字货币领域中,数字人民币正逐渐受到国内外市场的关注,成为了人民币国际化的重要一环.

1900/1/1 0:00:00
PRO:Beosin | 深度剖析零知识证明zk-SNARK漏洞:为什么零知识证明系统并非万无一失?

随着数字资产和区块链技术的快速发展,数字隐私保护和安全性成为了越来越受关注的话题。在这个背景下,一种名为"零知识证明"的技术正在逐渐崭露头角.

1900/1/1 0:00:00