木星链 木星链
Ctrl+D收藏木星链
首页 > ETH > 正文

PAL:谷歌全面反击!PaLM 2模型挑战GPT-4,产品通通AI化

作者:

时间:1900/1/1 0:00:00

来源:澎湃新闻

记者邵文

·PaLM2模型提供了不同规模的四个版本,其中轻量级的Gecko模型可以在移动设备上运行,速度非常快,不联网也能在设备上运行。谷歌还推出了两个专业领域大模型,其中,Med-PaLM2能回答各种医学问题,是首个在美国医疗执照考试中达到专家水平的大语言模型。

谷歌首席执行官桑达尔·皮查伊(SundarPichai)在2023年I/O开发者大会上。

在ChatGPT推出之后,谷歌一度发布内部“红色警报”,被媒体称为遭遇“柯达时刻”。久被唱衰之后,谷歌在北京时间5月11日的最新一届I/O开发者大会上官宣大语言模型PaLM2,称其在部分任务上超越GPT-4。

谷歌首席执行官桑达尔·皮查伊在加州山景城海岸圆形剧场的演讲中表示,PaLM2是该公司最新的AI模型,同时谷歌的研究重心正在转向开发更大的模型Gemini,这是一种多模态和高效的机器学习工具。

除此之外,谷歌也官宣会将DuetAI整合进谷歌办公全家桶Workspace;聊天机器人Bard全面升级并向所有人开放;谷歌云将上线多个基础大模型,为行业提供更进一步的生成式AI服务,等等。

在长达两个小时的演讲中,谷歌抛开以往的谨慎形象,从各个角度介绍了最新的大模型技术如何应用在了谷歌产品体系的几乎所有方面。

皮查伊宣布PaLM2。(02:18)

PaLM2部分结果超越GPT-4

实际上,这一波由ChatGPT带来的AI热潮,其背后关键技术即是2017年谷歌提出的transformer架构。2022年4月,PaLM第一个版本的模型发布。而在微软和OpenAI在大模型技术上先声夺人之后,这一次PaLM2的发布显然被谷歌寄予厚望。

OpenAI、微软、谷歌、苹果、英伟达等将开会讨论AI开发使用标准:4月11日消息,本周三,OpenAI、微软、谷歌、苹果、英伟达、Stability AI、Hugging Face、Anthropic等公司,将开会讨论制定AI技术开发使用标准,讨论如何以最负责任的态度继续开发AI。(福克斯商业新闻)[2023/4/11 13:56:17]

在I/O开发者大会上,皮查伊宣布推出PaLM2预览版本,利用谷歌最新的TPU算力基础设施提升了训练速度。由于它的构建方式是将计算、优化扩展、改进的数据集混合以及模型架构改进结合在一起,因此服务效率更高,同时整体表现更好。

PaLM2模型提供了不同规模的四个版本,从小到大依次为“壁虎”,“水獭”、“野牛”、“独角兽”,更易于针对各种用例进行部署。其中轻量级的Gecko模型可以在移动设备上运行,速度非常快,不联网也能在设备上运行出色的交互式应用程序。

PaLM2在超过100种语言的多语言文本上进行了训练。

据介绍,PaLM2在超过100种语言的多语言文本上进行了训练,这使得它在语言理解、生成和翻译上的能力更强,并且会更加擅长常识推理、数学逻辑分析。

PaLM2的数据集中有海量论文和网页,其中包含非常多的数学表达式。在这些数据的训练后,PaLM2能轻松解决数学问题,甚至是制作图表。

根据基准测试,对于具有思维链prompt或自洽性的MATH、GSM8K和MGSM基准评估,PaLM2的部分结果超越了GPT-4。

根据基准测试,PaLM2的部分结果超越了GPT-4。

谷歌云添加恶意加密挖矿软件威胁检测服务“VMTD”:金色财经报道,谷歌云宣布正在添加虚拟机威胁检测(VMTD)服务。VMTD是来自主流云提供商的首个市场检测功能,提供无代理内存扫描,以帮助检测在谷歌云运行的虚拟机中的恶意加密挖矿软件等威胁。VMTD还将能够保护谷歌云平台客户免受数据泄露和勒索软件等攻击。

谷歌表示,该功能正在作为“公共预览版”推出,将在未来几个月内将VMTD与其服务的其他部分集成。该公司此前曾表示,86%的“恶意行为者”使用受攻击的谷歌云账户来挖掘加密货币。(coindesk)[2022/2/8 9:37:24]

PaLM2是在具有100+语言的语料库上进行训练的,因此它更擅长多语言任务,能够理解、生成和翻译比以往模型更细致多样化的文本。

PaLM2通过了“精通”级别的高级语言能力考试。比起PaLM,在最新专业语言熟练度考试中的表现,PaLM2的日语水平达到了A级,而PaLM达到了F级。PaLM2的法语水平达到了C1级。在相关论文中,谷歌工程师声称PaLM2的语言能力已经“足以教授这门语言”,原因是其训练数据中的非英语文本更为普遍。

编程方面,PaLM2现在支持20种编程语言,如Python、JavaScript等常用语言,以及Prolog、Fortran和Verilog等。

此外,基于PaLM2,谷歌还推出了两个专业领域大模型。一个是谷歌健康团队打造的Med-PaLM2,它能回答各种医学问题,据介绍是首个在美国医疗执照考试中达到专家水平的大语言模型。

谷歌健康团队打造的Med-PaLM2。

目前谷歌正在尝试让它具备多模态能力,比如检查X光片然后给出诊断。在今年夏天晚些时候,这个模型将对一小部分谷歌云用户开放。

另一个专业大模型是面向网络安全维护的Sec-PaLM2,它使用人工智能来帮助分析和解释潜在恶意脚本的行为,并在非常短的时间内检测哪些脚本实际上对个人和组织构成威胁。

另外,在GoogleBrain和DeepMind合并之后,新的大模型也在研制过程当中。皮查伊表示现在谷歌的研究重心正在转向Gemini——一种多模态和高效的机器学习工具。该模型是在今年才开始研发的,将具有像GPT-4一样的万亿参数。目前,Gemini仍在训练中,但已经展示出了以往模型中从未见过的多模态能力。

动态 | 谷歌披露澳民众过去十年热搜榜 “比特币价格走势”上榜:近日,谷歌披露了澳大利亚民众在过去十年间最热门的搜索事件榜单,“比特币价格走势”上榜。[2019/12/16]

DeepMind副总裁祖宾·加赫拉马尼在介绍PaLM2的博客中表示,他们发现模型并不总是越大越好。“壁虎”非常轻巧甚至能在移动设备上离线运行,也就是说在手机也能运行交互式应用程序,同时保证速度。这意味着微调PaLM2会更加方便,由此它也能支持更多产品和应用。

英伟达AI研究员JimFan对这样的尝试表示赞同,“下一波LLM将是移动原生的。一个离线的、永远在线的LLM不仅可以降低服务成本,而且还为用户体验开辟了全新的途径。例如,一个元应用程序可以从你的移动工作流程中学习,并为你实现自动化。在小屏幕上节省的生产力,将比在大屏幕上多得多。”

PaLM2技术报告。

当天,谷歌一同发布了PaLM2技术报告,整整91页。但是,PaLM2论文远没初代PaLM有诚意,和GPT-4一样,更像是技术报告。

谷歌研究副总裁ZoubinGhahramani承认,在打击AI产生的虚假信息方面,还有很长的路要走。谷歌特地介绍了开发AI技术的社会责任感,包括两个判别AI生成内容的工具:嵌入水印和嵌入元数据。

谷歌全线产品接入PaLM2大模型

目前谷歌的聊天机器人Bard以及超过25个AI产品和功能,都由PaLM2作为底层技术支持。具体的表现之一是DuetAI,一个类似于微软365Copilot的产品、能够内嵌在各种办公软件中的AI助手。

在发布会现场,谷歌展示了DuetAI在Gmail、GoogleDocs、GoogleSheets中的能力。它可以根据提示补充邮件内容、生成PPT、根据提示生成图片素材、一键生成表格等。同时,这个AI助手也能提供编程帮助,包括实时推荐、纠错代码块,并且以对话方式解答编程问题,目前支持Go、JavaScript、Python和SQL。

动态 | Square Crypto聘请来自Lightning Labs、Calibra及谷歌的三名新员工:Square Crypto刚刚宣布了三名将致力于开源项目的新员工。其中包括此前曾在Facebook和BitGo工作的Arik Sosman,他最近是Calibra子公司的成员。另外的两个新员工分别为来自Lightning Labs的Valentine Wallace和来自谷歌的Jeffrey Czyz,他们将帮助“发展FOSS(自由和开放软件)开发人员基础”。(coindesk)[2019/9/20]

DuetAI直接从幻灯片中的文本生成图像。

自动生成遛狗业务的收费表。

用Bard起草邮件,并一键导入Gmail。

如果想试用这些新工具,需要注册WorkspaceLabs,加入候补名单。现在,任何人都可以申请加入候补名单,不过尚不清楚用户何时可以访问。谷歌的说法是,将在未来几周内将服务扩展到“更多的用户和国家”。

为了与微软必应竞争,谷歌推出了由PaLM2驱动的全新搜索引擎。它能够提供问题回答的摘要,比如问“为什么酵母面包仍然如此受欢迎?”谷歌搜索就给出几段详细描述酵母的味道、其益生元能力的优势等。另外,在生成内容旁给出3个链接,以证明摘要中的内容,以减少AI在生成内容上出现“幻觉”问题。

动态 | EOS Cafe Block发推称EOS Authenticator谷歌扩展版已更新:据MEET.ONE消息,EOS Cafe Block今日发推称EOS Authenticator谷歌扩展版已由EOS Ricardian规范0.2.0支持更新。目前kylin.bloks.io和jungle.bloks.io可以支持新版认证器登录。Bloks.io为EOSIO区块浏览器。[2019/7/8]

在谷歌搜索蓝牙音箱,首先顶部有一个简短的摘要,详细说明了购买时应注意的事项:电池寿命、防水性、音质。右边是3个购买指南的链接,下面是6个不错选择的购物链接,每个旁边都有一个AI生成的摘要。

但是要是想要访问这一功能,必须选择SearchGenerativeExperience这一新功能。并非所有搜索都会有AI生成的答案。只有当谷歌的算法认为它比标准答案更有用时,AI内容才会出现,而像健康、财务等敏感主题就不会由AI生成。

发布会上,谷歌还宣布了一个重磅消息:聊天机器人Bard未来也能像ChatGPT一样,接入网络,实时搜索网页。

这次,Bard有诸多升级并很快就会支持各种第三方扩展,例如AI可以自动根据你输入的文本生成图像。

谷歌在发布会上展示了一个案例。假如用户问Bard,美国的新奥尔良有哪些必看的景点,那么Bard就能图文并茂地解答这个问题,就像用户在谷歌搜图中问同样的问题一样。

另一个功能是图像提示系统,由GoogleLens提供,它能够识别图片中的物体。比如说,上传一张狗的照片,然后给一个prompt“为这两只狗写一个有趣的标题”。GoogleLens就可以识别狗的品种,然后Bard就能写下与狗特征相关的内容。

用Bard为照片写一个有趣的标题。

通过语言描述让Bard生成代码。

谷歌决定取消Bard的等候名单,其将在180个国家或地区提供服务。

发布文本生成音乐模型MusicLM

谷歌当天还发布了一种新的实验性AI工具MusicLM,可以将文本描述转化为音乐。MusicLM可在网络、Android或iOS上的AITestKitchen应用程序中使用,允许用户输入诸如“晚宴上的深情爵士乐”或“创造催眠的工业技术声音”的提示,让该工具创建多个版本的歌曲。

用户可以在完善MusicLM生成的作品时指定“电子”或“古典”等风格,以及他们想要的“氛围、情绪或情感”。

谷歌1月在一篇学术论文中预览MusicLM时,表示“没有立即计划”发布它。论文的合著者指出,像MusicLM这样的系统会带来许多伦理挑战,包括将训练数据中受版权保护的材料整合到生成的歌曲中。

但在接下来的几个月里,谷歌表示它一直在与音乐人士合作并举办研讨会,以“了解这项技术如何为创作过程赋能”。结果之一是,AITestKitchen中的MusicLM版本不会生成具有特定艺术家或人声的音乐。

无论如何,围绕生成音乐的更广泛挑战不太可能轻易解决。而“深度造假”音乐仍然站在模糊的法律基础上。

在移动终端发力

相比微软,谷歌的一点优势是拥有包括智能手机、平板电脑及其操作系统在内的终端出口,这是它可以发力并必须抓住的部分。

I/O大会上,谷歌展示了下一代移动操作系统Android14的新能力。其中,MagicCompose将于今年夏天在谷歌的默认短信应用Message中推出测试版,它是一种基于AI生成模型的工具,让你在回短信的时候根据聊天内容获得大量提示。它会学习你的说话方式,你也可以让自己的回复内容看起来有不同的语气,或者用莎士比亚的风格来写。

谷歌还使用生成式AI来帮你制作独一无二的手机壁纸,和AI画图一样使用语言提示完成。

在大会上,谷歌还发布了AI笔记本——一个名叫Tailwind的项目,目标受众定位为学生。该功能在大学校园内进行了广泛的测试。

谷歌发布了AI笔记本项目Tailwind。

Tailwind就像一个真正的笔记本一样,可以在里面记笔记,而这些内容就是AI学习的对象。

用户可以从谷歌云端硬盘中挑选文件,创建一个兼具个性化和私人属性的AI模型。在示例演示中,Tailwind收集了一大堆学习笔记,然后生成了包括主题词在内的很多内容,比如用户可以为特定主题创建术语表。

Tailwind操作演示。

Tailwind不仅能为学生服务,对任何从不同来源获取信息的人都有帮助。用户目前可以注册ProjectTailwind进行测试。

隐藏在Tailwind背后的理念是,为什么不能为每个用户定制不同的AI语言模型呢?

三大基础模型上线谷歌云、安卓开发小助手等

在宣布了AI方面的一系列更新后,谷歌也为自己的云端机器学习平台VertexAI推出了三款大模型:Codey、Imagen、Chirp。

LLM模型需要大量的计算能力来训练和运行。认识到这一点,谷歌云在谷歌I/O大会上宣布了一款新的A3超级计算机虚拟机。

谷歌在一份声明中写道:“A3GPUVM专为当今的机器学习工作负载提供最高性能的训练而设计,配备了现代CPU、改进的主机内存、下一代英伟达GPU和主要网络升级。”

具体来说,该公司正在为这些机器配备英伟达的H100GPU,并将其与专门的数据中心相结合,以获得具有高吞吐量和低延迟的巨大计算能力。

谷歌将以多种方式提供A3:客户可以自己运行它,或者如果他们愿意,可以将其作为托管服务运行,谷歌会为他们处理大部分繁重的工作。目前,客户只能通过注册预览等候名单来使用。

除此之外,谷歌I/O大会上也推出了专为Android开发的AI编码机器人StudioBot。它不仅可以生成代码、修复BUG,甚至能够回答关于安卓应用开发的相关问题。同时支持Kotlin和Java编程语言,并将直接嵌入到AndroidStudio开发工具的工具栏中。

谷歌还宣布推出搜索实验室,这是一种让消费者在搜索中测试“大胆的新想法和我们正在探索的想法”的新方式。

搜索实验室限时提供三个主要功能。第一个称为搜索生成体验,将生成式AI直接引入谷歌搜索。“新的搜索体验可以帮助您快速找到并理解信息。”谷歌表示,“在搜索时,您可以通过AI驱动的概述、探索更多内容的指示以及以自然跟进的方式来了解主题的要点。”第二个功能是,搜索提示还提供代码提示,使用大型语言模型提供片段和“更快更智能地编写代码的指针”。最后,“添加到表格”可以将搜索结果直接插入到电子表格中。例如,如果计划使用表格文档安排度假,可以直接从谷歌搜索轻松添加链接。

标签:PALALMPALMTAIPal NetworkPalmswapPalmswapINVECTAI

ETH热门资讯
ANT:教程 | 波卡生态开发者该如何申请Grant?什么样的团队才能获得Grant?

“波卡知识图谱”是我们针对波卡从零到一的入门级文章,我们尝试从波卡最基础的部分讲起,为大家提供全方位了解波卡的内容,当然这是一项巨大的工程,也充满了挑战.

1900/1/1 0:00:00
比特币:数据显示比特币仍未到顶,因为散户尚未入场

据比推数据,市值最高的加密货币比特币本周一举突破2万美元,最近几天一直在2.3万美元附近震荡,不过多个指标显示,散户仍未大规模进入市场,比特币的价格仍未到顶.

1900/1/1 0:00:00
数字货币:红枣科技何亦凡:数字货币和身份认证是分布式技术的基础应用

为方便阅读,文字略有删减整理如下:BSN的核心理念,是在互联网上推动建立一个新的公共层,与目前只能有效服务于中心化应用的互联网平行,为各行各业、各种类型的分布式应用提供服务.

1900/1/1 0:00:00
区块链:金链盟报告:区块链数据安全赛道成为今年新风口

12月17日,金链盟与金融科技·微洞察联合发布《数据要素视角下的产业区块链新机遇——2020年全球区块链发展趋势报告》.

1900/1/1 0:00:00
数字人:观点:数字货币将形成跨国家、跨地域的“电子货币区”

本文来源:证券日报,作者:袁元国内数字人民币试点正在加速推进。继深圳之后,国内第二个数字人民币试点城市苏州,近日宣布今年“双12苏州购物节”期间,将发放2000万元数字人民币消费红包.

1900/1/1 0:00:00
ETF:美股指数收益增强策略视角的Crypto资产管理

引言传统金融市场近几年来以ETF为代表的指数型产品发展迅速,呈现出SmartBetaETF-主动管理ETF市场资金流入增速高于普通指数ETF产品的特征.

1900/1/1 0:00:00