来源:新智元编辑:Aeneas好困
快速定制模型的LLM引擎Lamini来了,开发者狂喜!
ChatGPT虽好,但始终有门槛。通常,只有拥有AI博士学位的大型机器学习团队,才能这样训练一个模型。
为了把这个门槛打下来,团队构建了Lamini引擎,从此,每个开发者都能够拥有从GPT-3训练ChatGPT的超能力!
划重点:可以商用!可以商用!可以商用!
项目地址:https://github.com/lamini-ai/lamini/
Lamini的开发团队表示,你需要的只是几行代码,就可以用托管数据生成器俩训练自己的LLM,包括权重和其他所有的内容。
此外,你也可以使用开源的LLM,用Lamini库对生成的数据进行微调。以及访问完整的LLM训练模块,使用从LoRa等速度优化,到虚拟私有云(VPC)部署等企业功能。
对此,英伟达科学家JimFan表示,LLaMa+自定义数据正在成为新的范式,而Lamini的推出也带了一种全新的模式——FaaS,微调即服务。
Cardano生态DEX Minswap交易量飙升至1800万美元:5月30日消息,Minswap的数据显示,过去几天,基于Cardano的DEX Minswap的交易量从5月初的略高于100万美元飙升至周二的1800万美元。Minswap是Cardano上TVL最大的应用程序,持有网络上价值超过1.75亿美元代币中的37%。
增加的交易量中有很大一部分来自基于Cardano的Meme币snek(SNEK)和bank(BANK)。数据显示,这两种代币的价格在过去24小时内飙升了34%,仅Minswap上就累计交易了4000万美元。[2023/5/30 11:48:01]
MLOps的未来是「LMOps」。哪里有标准化,哪里就有机会。
OpenAI科学家,前特斯拉人工智能总监AndrejKarpathy也表示,LLM定制化的生态正在愈发火爆。
训LLM就像prompt-tuning一样简单
写一个prompt如此容易,但想要从基础模型训练出一个大语言模型,却是如此困难。
因为需要花费大量时间,来找出微调模型失败的原因,所以对数据集微调的迭代周期都是以月为单位的。
与之相反,微调prompt的迭代,只需要几秒钟,并且在几个小时内,性能都能保持稳定。
这个过程只需要把有限数量的数据整合到prompt中就可以了,并不需要动辄几TB的数据。
Mike Novogratz:随着美联储放松加息,比特币和以太坊以及黄金和欧元的表现将优于其他投资:金色财经报道,美国加密货币金融服务公司Galaxy Digital的创始人Mike Novogratz认为,随着美联储(?Fed) 开始放松加息,比特币和以太坊以及黄金和欧元的表现将优于其他投资。
根据 Novogratz 的说法,最近一连串的区域性银行倒闭可能会导致潜在的信贷紧缩,从而导致贷方减少借款人和经济放缓。最明确的交易已经并将继续是做多黄金、做多欧元、做多比特币、做多以太坊——这些资产在美联储停止加息然后降息的情况下应该表现良好。[2023/4/13 14:01:45]
ChatGPT的诞生十分艰难,OpenAI的团队花了几个月的时间,在基础的GPT-3模型上微调,并进行RLHF。这个门槛极高,只有大型的ML团队才能完成这种训练。
有500强企业的技术负责人这样抱怨过:「我们团队的10名机器学习工程师用了OpenAI的微调API,结果我们的模型反而变得更差了,怎么办啊。」
「我真的不知道该怎么充分利用数据,我已经用尽了所有从在线教程中能学到的prompt魔法了。」
这,就是研究者构建Lamini的原因:让每个开发者可以直接从GPT-3训练ChatGPT。
任意LLM,秒变ChatGPT!
Lamini是一个LLM引擎,可以让不仅仅是机器学习专家的任何开发人员,都能在大型数据集中,把高性能的LLM训练得像ChatGPT一样好。
这个过程,只需要Laimini库的几行代码即可。
值得注意的是,这个库中的优化远远超出了现在开发者可以使用的范围,从更具挑战性的优化到更简单的优化。
比如,你想从不同的角度生成一个广告文案。
首先,从llama模块导入LLM引擎:
AVAX市值超过SOL市值:金色财经报道,Avalanche的原生代币AVAX市值超过Solana的原生代币SOL,达到34.7亿美元,而SOL为34.3亿美元。两种代币均下跌,SOL在过去24小时内大幅下跌5.7%,在过去一周内下跌22.7%。行情波动较大,请做好风险控制。[2022/12/30 22:15:28]
fromllamaimportLLMllm=LLM(name="marketing")
接下来,需要定义输入和输出类型。注意,这里一定要包括上下文,因为可以有助于LLM在自然语言中进行理解。
fromllamaimportType,ContextclassAdAspects(Type):tone:str=Context("toneofthemarketingcopy")product_features:list=Context("productfeaturestopromote")audience:str=Context("targetaudienceforthemessage")subject:str=Context("subjectortopicofthemessage")goal:str=Context("goalofthismarketingcampaignandmessage")classAdCopy(Type):title:str=Context("googleadtitletag")description:str=Context("googleaddescription")keywords:list=Context("keywordsforthesearchengine")
然后就可以开始提问了:
语气:大胆,但不傲慢
特色:亚洲酱料和香料、家常调料和套餐包,可以轻松在家烹饪。
aspects=AdAspects(tone="boldandbright,butnotarrogant",product_features=,audience="suburbanfamilies",subject="deliciousasianmealswithoutgoingtoarestaurant",goal="getsuburbanmomsanddadstotrybuytheirfirstomsompackorfreetastingkit")ad_copy=llm(input=aspects,output_type=AdCopy)print(f"Adcopy:{ad_copy}")模型输出:
Galxe集成Boba Network:12月21日消息,Web3基础设施服务商Galxe宣布集成二层扩容解决方案Boba Network。[2022/12/21 21:58:10]
尝试Omsom的美味亚洲酱料、香料、家常调料和套餐包。轻松为家人在家做出美味佳肴。
>title='DeliciousAsianMealsWithoutGoingtoaRestaurant|Omsom'description="TryOmsom'sdeliciousAsiansauces,aromatics,andhome-cookedseasoningsandmealpacks.Easilycookdeliciousmealsathomeforyourfamily."keywords=
如何创建自己的「ChatGPT」
基础模型能理解一般的英语,但如果需要它们学习一些垂直语言和规则,prompt微调并不足够,很多时候我们都需要构建自己的LLM。
利用用下面这个步骤,就能获得像ChatGPT一样遵循指令的LLM。
尝试prompt-tuningChatGPT或其他模型
可以使用Lamini库的API,在不同模型之间快速进行prompt-tuning,只需一行代码,即可在OpenAI和开源模型之间切换。
Lamini库已经优化了正确的prompt,这样开发者就可以使用不同的模型,不必担心如何为每个模型设置prompt的格式。
构建一个包含输入-输出对的大型数据集
Frax Finance已上线以太坊流动性质押代币frxETH:10月21日消息,算法稳定币协议Frax Finance已上线frxETH,支持铸造和质押/解押功能。截至目前已铸造超过1655枚frxETH。
据此前报道,Frax Finance将在两周内公开其在以太坊上的流动性质押协议。此次发布将允许用户质押ETH并获得流动衍生代币Frax Ether(frxETH),旨在释放所质押代币的价值。该衍生品将反映ETH的价格,并可在其他DeFi协议上自由交易。[2022/10/21 16:34:36]
这些数据集会向模型展示,它应该如何响应输入,无论是遵循英文说明,还是以JSON响应。
研究者刚刚发布了一个只有几行代码的repo,使用Lamini库,仅从100个数据点中,就能生成50k数据点。
而且因为使用Lamini库来启动Lamini引擎,所以这个过程根本不需要用到GPU。
在repo中,已经包含一个开源的70+k数据集。
项目地址:https://github.com/lamini-ai/lamini/
在大型数据集上微调基础模型
除了数据生成器,研究者还发布了一个LLM,它使用Lamini对生成的数据进行了微调。以编程方式执行此操作的功能也会很快发布。
也可以把OpenAI的微调API作为起步。
在微调模型上进行RLHF
使用Lamini,就不再需要大型ML和人工标记团队来运行RLHF。
部署到云端
只需点击产品或功能中的API端点即可。
专为LLM打造的数据生成器
简单来说,依照以下几个步骤,就可以训练自己的大语言模型了。
用于优化prompt微调和类型化输出的Lamini库。
用于微调和RLHF的高级Lamini库,只需几行代码。
史上首个托管数据生成器,用于创建数据,来训练遵循指令的LLM。注意,已获得商业使用许可!
开源的指令跟随LLM,使用上述工具,只需几行代码即可完成。
数据生成器工作原理
Lamini数据生成器是一个LLM管线,它采用原始的100多条指令的小集合,与预期的响应配对,生成50k+新的配对,灵感来自Stanford的Alpaca。这个生成管线使用Lamini库来定义和调用LLM,以生成不同但相似的指令和响应对。
根据这些数据训练后,你的LLM会遵循这些指示,因而得到改进。对于使用开源LLM的生成管线,研究者提供了一个很好的默认值,LaminiOpen和LaminiInstruct。
随着每天新的LLM发布,研究者都会将默认值更新为性能最佳的模型。在目前的版本中,LaminiOpen用的是EleutherAI的Pythia,LaminiInstruct用的是Databricks的Dolly。
LaminiOpen会生成更多指令,而LaminiInstruct会生成这些指令的成对响应。
最终生成的数据集可供免费商业使用,已经通过CC-BY许可。
仅用一行代码,就可以将Lamini库的默认值换成其他开源或OpenAI模型。
研究者发现,OpenAI模型的平均表现更好,但它们的许可限制了将生成数据用于训练类ChatGPT模型的商用。
对生成数据进行微调
在这个过程中,生成的数据会质量不一。
在微调之前,下一步就是将生成的数据过滤为高质量数据。
然后,Lamini会通过在这个过滤后生成的数据集上训练基础模型,来创建自定义LLM。
研究者已经发布了一个开源指令跟随LLM,可以用Lamini来训练Pythia基础模型,生成的37k指令是从70k中筛选出来的。
显然,Lamini库的出现,让迭代周期变得更快、更有效,有更多的人能够构建模型,而不仅仅是试验各种prompt。
团队介绍
SharonZhou是Lamini的联合创始人兼首席执行官。
个人主页:https://sharonzhou.me/
她在哈佛大学获得了计算机科学与古典文学联合学士学位,并以最高荣誉获得了硕士学位。
随后,她在斯坦福大学获得了计算机科学博士学位,师从吴恩达。
2022年,29岁的Zhou入选《麻省理工科技评论》「35岁以下科技创新35人」。
GregoryDiamos是MLPerf的联合创始人。
他曾是百度硅谷AI实验室的创始成员,对DeepSpeech和DeepVoice系统有贡献。
参考资料:
https://lamini.ai/blog/introducing-lamini
虽然S&P企业获利表现强劲、耐用品数据走强以及PacWest的存款增长数据更加良好,但FirstRepublicBank(FRC)事件仍吸引所有人的注意力,股价再次下跌30%?.
1900/1/1 0:00:00原文作者:Messari-KunalGoel原创编译:BlockTurbo以太坊也因其可持续的货币政策和大量去中心化应用程序的生态系统受益,提供了有别于其他加密货币的价值主张.
1900/1/1 0:00:00作者:北辰从比特币白皮书开始,crypto世界的诞生就携带着强烈的价值取向,它的颠覆性一度被当作犯罪工具。不过底层技术的发展从来不以价值取向为转移,传统世界开始尝试驯服crypto这个洪水猛兽.
1900/1/1 0:00:00从2022年3月开始,美联储将连续加息,一口气将联邦利率提升到4.75%?~?5%?,可以说是有史以来速度最快幅度最大的加息周期.
1900/1/1 0:00:00头条▌美众议院将举行关于数字资产现货市场监管的听证会金色财经报道,美国众议院商品市场、数字资产和农村发展小组委员会将举行题为“数字资产的未来:识别现货市场监管中的漏洞”听证会.
1900/1/1 0:00:00比特币每四年减半,基本决定了加密货币市场荣枯周期。下一次发生在区块840,000的比特币减半,距离今天还有366天.
1900/1/1 0:00:00