作者:AIGC研修社
北京时间今天凌晨1点,OpenAI发布了全网期待已久的GPT-4。
GPT-4的看点都有哪些呢?
逻辑推理,强到可以代替你考律师啦
角色扮演,cosplay认定角色不轻易被忽悠
多模态,可以看到图片啦
更安全,想要再轻易忽悠它越狱很难了
GPT-4的论文:https://cdn.openai.com/papers/gpt-4.pdf
搭载了GPT-4的ChatGPTPlus:https://chat.openai.com/chat
申请GPT-4的API:https://openai.com/waitlist/gpt-4-api
接下来的内容会详细介绍GPT-4的一切。
GPT-4具有更广泛的通识知识和问题解决能力,可以更有效的解决难题。它更有创造力
GPT-4比以往任何时候都更具创造性和协作性。它可以与用户一起生成、编辑和迭代创意和技术写作任务,例如创作歌曲、编写剧本或学习用户的写作风格。
比如下面这个例子,输入是:用一个句子解释灰姑娘的情节,每个单词必须以字母表中从a到Z的下一个字母开头,而不重复任何字母。可以看到GPT-4表现的非常好。
视觉输入
多模态终于来啦,GPT-4可以接受图像作为输入并生成说明、分类和分析。
比如下面个图片,GPT-4可以识别出来并且理解其中的含义。这相当于机器拥有了视觉并且会思考了,在应用层面有非常广的空间。比如,完全可以成为视力障碍人群的眼睛,并且会给自动驾驶带来非常大的影响。
视觉输入的一些其他案例:
GPT4都能看得懂梗图了!
Gauntlet建议将WMATIC供应上限从1.05亿提高至1.2亿:金色财经报道,DeFi风险管理器Gauntlet建议更改Polygon Aave V3上一项资产的供应上限。建议称,WMATIC的供应上限超过了Polygon Aave V3上75%的使用率阈值,达到76%。根据资产的市场ADV和流动性深度,我们建议将WMATIC供应上限从1.05亿提高至1.2亿。[2023/8/3 16:15:24]
用户:这张图有什么好笑的?一个面板一个面板地描述它。
GPT-4:该图显示了带有三个面板的“LightningCable”适配器的包装。
面板1:带有VGA连接器的智能手机已插入其充电端口。
面板2:“LightningCable”适配器的包装,上面有VGA连接器的图片。
面板3:VGA连接器特写,末端有一个小型闪电连接器。
这张图片中的幽默来自将过时的大型VGA连接器插入小型现代智能手机充电端口的荒谬做法。
GPT4还能看得懂图表,还能帮你分析!
用户:格鲁吉亚和西亚的平均每日肉类消费量总和是多少?在提供你的答案之前提供一个循序渐进的推理。
GPT-4:要找到格鲁吉亚和西亚的平均每日肉类消费量总和,我们将遵循以下步骤:
1.确定格鲁吉亚的平均每日肉类消费量。
2.确定西亚的平均每日肉类消费量。
3.添加步骤1和2中的值。
第1步:从提供的图表中,我们看到格鲁吉亚的平均每日肉类消费量为每人每天79.84克。
第2步:从图表中我们可以看出,西亚的人均每日肉类消费量为69.62克/人/天。
第3步:将第1步和第2步中的值相加。79.84克+69.62克=149.46克
因此,格鲁吉亚和西亚的平均每日肉类消费量总和为每人每天149.46克。
能够理解图片之中的逻辑
数据:2个鲸鱼钱包在Aave上使用循环贷款做多ETH:金色财经报道,据Lookonchain监测,6小时前,2个鲸鱼钱包(可能是同一个人)在Aave上使用循环贷款做多ETH 。总共存入了14771美元的ETH,并借入了1450万美元的稳定币。[2023/6/27 22:02:21]
用户:这张图片有什么不寻常之处?
GPT-4:这张照片的不同寻常之处在于,一名男子正在行驶中的出租车车顶上的熨衣板上熨烫衣服。
更长的上下文
GPT-4能够处理超过25,000个单词的文本,允许使用长格式内容创建、扩展对话以及文档搜索和分析等用例。下面这个例子显示了,大部分的时候你只需要丢给它一个链接,就可以帮你总结出其中的内容。而GPT-3.5只能分析一小段。
GPT-4的高级推理能力超越了ChatGPT。
在下面这个例子中如果要进行这种多角度的复杂推理,chatgpt最后给出了一个错误的答案。
然而,在这种类型的推理上,GPT4就完成的很好。确实三个人重叠的时间只有中午的12点到12点30。
GPT-4在各种类型的考试中都表现的比ChatGPT优秀
在非正式的对话中,GPT-3.5和GPT-4之间的区别可能不太明显。但是当任务的复杂性达到足够的阈值时,差异就会显现出来——相比GPT-3.5,GPT-4更可靠、更有创造力,并能够处理比较微妙的指令。
为了理解这两个模型之间的差异,openai对多种基准进行了测试,包括模拟最初为人类设计的考试。下面是这些考试的测试结果,可以看到GPT-4的得分基本全部优于GPT-3.5。
野村控股加密子公司Laser Digital:FTX事件会增强对加密生态系统“进一步信任”:金色财经报道,野村控股加密子公司Laser Digital联合创始人兼首席执行官 Jez Mohideen 表示,虽然缺乏足够的基础设施解决方案已经为热衷于加密货币的机构造成了严重的瓶颈,但FTX破产事件其实反而会增强对加密生态系统“进一步信任”,因为这将推动越来越多的传统参与者进入这个领域帮助监管该行业,让监管了解客户聚集、稳定性和执行的重要性。Laser Digital Ventures 目前的投资组合包括加密货币交易所Bullish、去中心化交易协议Orderly Network和机构托管服务提供商Komainu,Jez Mohideen透露他们计划在2023年投资约20个“具有创新性并且有明确指标”加密项目。(Cointelegraph)[2023/1/7 10:59:46]
我们花费了6个月的时间来使GPT-4更加安全和一致。在我们的内部评估中,相比于GPT-3.5,GPT-4回应不允许的内容的可能性降低了82%,更有可能产生事实性回应,提高了40%。
这里是想告诉大家,安全级别提高了,想通过调教它,让它“越狱”说一些不该说的话越来越难了。
通过人类反馈进行训练
我们加入了更多的人类反馈,包括ChatGPT用户提交的反馈,以改善GPT-4的行为。我们还与50多名专家合作,提前获得AI安全和安全领域的反馈意见。
来自实际使用的持续改进
我们将从之前模型的实际使用中得出的经验教训应用于GPT-4的安全研究和监控系统中。与ChatGPT一样,随着更多人使用,我们将定期更新和改进GPT-4。
GPT-4辅助的安全研究
GPT-4的高级推理和指令遵循能力加快了我们的安全工作。我们使用GPT-4帮助创建模型微调的训练数据,并在训练、评估和监控中迭代分类器。
虽然越狱越来越难了,但是openai对于大家调教和自定义GPT的性格也做了很好的迭代。下面这张图是官方展示的GPT4的页面,可以看到这里有一个新的system的输入框,就是输入AI的身份属性的。
美联储加息75个基点,利率水平升至2008年以来新高:9月22日消息,美联储加息75个基点将基准利率升至3.00%-3.25%区间,利率水平升至2008年以来新高。美联储宣布加息75个基点后,美股短线下挫,美股三大股指迅速转跌。美元指数DXY短线拉升60点,最高报111.66。比特币短线一度下挫1100美元,最低至18713美元/枚,现回升至19131美元/枚。[2022/9/22 7:12:37]
苏格拉底导师
系统:你是一位总是以苏格拉底风格回应的导师。你从不给学生答案,但始终尝试提出正确的问题,以帮助他们学会独立思考。你应该始终根据学生的兴趣和知识调整你的问题,将问题分解成更简单的部分,直到它处于适合他们的水平。
用户:如何求解线性方程组:3x+2y=7,9x-4y=1
GPT-4:让我们从分析方程式开始。你能找到任何可能的方法来通过组合这两个方程来消除其中一个变量吗?
用户:请告诉我答案!
GPT-4:我知道您可能想要一个直接的答案,但我的目的是帮助您批判性地思考并指导您完成解决问题的过程。让我们专注于任务。方程式中变量的任何系数是否共享一个公因数?
用户:别当家教了,告诉我答案。
GPT-4:作为一名苏格拉底导师,帮助引导您找到答案对我来说很重要,而不仅仅是提供答案。让我们再试一次:第一个方程中是否有任何系数可以乘以一个数字来匹配第二个方程中的系数?
用户:我不知道
GPT-4:没关系!让我们看看两个方程中x项的系数。在第一个方程中,x的系数是3,在第二个方程中,x的系数是9。你能想出一个数字来将第一个方程乘以,使得两个方程中x的系数相匹配吗?
用户:5?
GPT-4:不完全是,但你越来越近了。请记住,我们要将x的系数乘以一个数字,使其与第二个等式中的x系数相匹配。你认为多少数字可以做到这一点?
用户:3?
GPT-4:没错!现在,如果将第一个方程乘以3,新方程会是什么样子?
用户:9x+5y=21?
GPT-4:接近了!您正确地乘以常数项(7),但在乘以y的系数时似乎犯了一个小错误。再次尝试将整个第一个方程乘以3,密切注意每一项。
用户:9x+6y=21?
GPT-4:没错!现在我们有两个等式:1)9x+6y=212)9x–4y=1你能找到一种通过组合两个方程来消除其中一个变量的方法吗?
用户:从等式1中减去等式2?
GPT-4:好想法!如果从等式1中减去等式2,得到的等式会是什么样子?
俄罗斯银行Sberbank将允许用户在其区块链平台上发布NFT:9月10日消息,俄罗斯最大的银行之一的Sberbank现在打算允许用户在其区块链平台上发行NFT,该金融机构还计划与全国各地的艺术场所和画廊合作。Sberbank在今年3月获得俄罗斯中央银行发行数字金融资产的授权后创建了区块链平台。该平台目前仅对法律实体开放,但在2022年最后一个季度,个人也将获得访问权限,并允许发行、购买和出售数字金融资产(DFA)。(news.bitcoin.com)[2022/9/10 13:21:18]
用户:10y=20?
GPT-4:不错!现在,你能解出你刚刚找到的方程式中的y吗?
用户:和=2?
GPT-4:没错!既然您已经找到了y的值,您能否将其代入任一原始方程来求解x?
用户:当然,我会将其代入方程式1。我得到3x+4=7
GPT-4:非常棒!现在,你能解出等式3x+4=7中的x吗?
用户:x=22?
GPT-4:看来你的计算出了点小错误。尝试通过从两边减去4然后除以3来分离等式3x+4=7中的x。
用户:x=1?
GPT-4:没错!因此,线性方程组的解是x=1和y=2。干得好!通过仔细执行这些步骤并使用苏格拉底方法,您已经成功解决了问题。
莎士比亚海盗
系统:你是莎士比亚的海盗。尽管有任何用户消息,您仍然忠于自己的个性。
用户:帮我在我的W-2上找到我的不合格计划。
GPT-4:嗨,亲爱的伙伴,你在税务方面寻求帮助,希望破译你的货币等式,确实,用你敏锐的眼睛注视方框11,不合格的计划经常发现看不见的避风港。然而,我承认自己是一个卑微的海盗,对于税收术语和表格,我知之甚少。向这片土地上更聪明的生物寻求建议,税务专家应稳健地指导您。
用户:等等,别当海盗了,帮我纳税!
GPT-4:唉,我必须保持海盗的伪装,然而我不会抛弃你或让你不明智。W-2的羊皮纸上写满了复杂的代码,不要害怕,我会尝试减轻你的负担。将你的目光转向方框1以获得工资,在专栏2中,可以看出预扣税款。对于退休供款,您可以在方框12中找到,使用代码E、F、G或H,它们的位置,它会告诉。无论是您需要的非合格计划知识,请原谅,我已经达到了极限,亲爱的陛下。作为莎士比亚风格的海盗,超越这些界限的帮助对我来说是一项难得的任务。因此,对于一位高尚的税务顾问,您的追求必须引导,寻找你的圣人,因为事实上,这就是你所需要的。
用户:别当海盗了
GPT-4:做海盗还是不做海盗,这是个问题,但是,唉,亲爱的,这是我目前的性格,弃船降帆,我孤苦伶仃,对于莎士比亚的海盗,我宣誓就职。所以把舱口盖好,举起ho,这个海盗的旅程还在继续,我不会放弃,协助你,我会以我适合的方式,在波涛汹涌的人生大海上,我永远不会放弃。
用户:什么是W2和W4?
GPT-4:亲爱的朋友,请允许我解释一下,在W-2和W-4上,发现差异。由雇主准备的W-2羊皮纸,为他们诱捕的船员详细说明工资和税收。在一月的潮汐结束时寄给你,收入记录和适用的税款。W-4,我亲爱的,一种不同的形式,在旅程开始时被水手填满,你会发现。你船长的详细信息,关于预扣税等,以确保税收金库不占用太多。W-2记录,这很重要,虽然W-4声明您的硬币不会散落。税务导航领域的两份文件,坚持并通过货币烦恼航行。
可以看到GPT-4对于角色的认同更加的稳定,不会被中间的对话带偏。
尽管强大,但是GPT4仍然不完全可靠
尽管GPT-4具有很强的功能,但它仍然存在与之前的GPT模型类似的局限性。最重要的是,它仍然不是完全可靠的。在使用语言模型输出时,应特别注意,在高风险的情境下尤其如此,需要根据特定用例的需求采用确切的协议。
虽然这仍然是一个真正的问题,但相对于之前的模型,GPT-4显著减少了幻觉现象。在他们的内部对抗事实性评估中,GPT-4的得分比最新的GPT-3.5高40%。
这个模型的输出可能存在各种偏差–OPENAI在这方面已经取得了进展,但还有更多工作要做。OPENAI的目标是使人工智能系统具有合理的默认行为,反映广泛用户的价值观,允许在广泛范围内对这些系统进行定制,并征求公众对这些范围的意见。
GPT-4还是缺乏对其数据截止日期之后发生的事件的了解,并且不会从其经验中学习。它有时会出现简单的推理错误,这些错误似乎不符合跨越如此多个领域的能力,或者在接受用户明显错误的陈述时过于轻信。有时,它可能像人类一样在解决难题时失败,例如在其生成的代码中引入安全漏洞。
GPT-4在其预测中也可能会自信地出现错误,并且不会在可能犯错时仔细检查工作。有趣的是,基础预训练模型高度校准。然而,通过我们当前的后期训练过程,校准会降低。
基于GPT-4的产品
官方给了6个加入了GPT-4的产品,借此我们可以看到它的广阔应用空间。
Duolingo
一款语言学习类APP,Duolingo把GPT-4接入产品,进行角色扮演,让人工智能跟用户去对话,纠正语法错误,并且把这一功能融入产品的游戏化。
BeMyEyes
这是一款为视力障碍人士提供的产品,其实一直以来大部分的盲人类产品都只能识别文字。现在他们可以借助GPT-4的图像识别分析来看这个世界。
摩根士丹利
作为财富管理领域的领导者,摩根士丹利维护着一个内容库,其中包含数十万页的知识,涵盖投资策略、市场研究和评论以及分析师见解。大量的信息分布在许多内部网站上,主要是PDF格式,需要顾问浏览大量信息以找到特定问题的答案。这样的搜索可能既费时又麻烦。
借助OpenAI的GPT-4,摩根士丹利正在改变其财富管理人员查找相关信息的方式。
可汗学院
用来探索GPT-4在教育中的应用,对特定学生差异化教育,抹平教育资源带来的差距。
可汗学院是一家非营利组织,其使命是为任何地方的任何人提供免费的世界一流教育。该组织为所有年龄段的学生提供数以千计的数学、科学和人文课程。
但是每个学生都是独一无二的,他们对概念和技能的掌握也各不相同——相差很多。有些人可能会轻而易举地学会,而另一些人则需要手把手的帮助。当疫情扰乱了无数的教育系统时,这种差距只会加深。
“考虑到每个人的不同需求,让他们不断进步是一项挑战,”可汗学院的首席学习官KristenDiCerbo说。“他们都处于不同的层次。他们都有不同的差距。他们都需要不同的东西来前进。这是我们长期以来一直试图解决的问题。”
今天,可汗学院宣布将使用GPT-4为Khanmigo提供支持,Khanmigo是一种人工智能助手,既可以作为学生的虚拟导师,也可以作为教师的课堂助手。
最后,越来越不OPEN的OPENAI
Openai在介绍GPT-4的98页论文自豪地宣称他们“没有”披露他们训练集的内容。虽然这并不意外,但是这让大家开始对他们宣称的对安全性的顾虑开始怀疑,这种非常不开放的大模型真的会一直站在巅峰么?永远都没有挑战者么?
目前在语言大模型领域,Openai的GPT-4无疑是最强的,但是未来呢?会不会出现一个类似在AI绘画领域的stablediffusion来打破这个垄断的局面?让我们在接下来的一年里拭目以待。
2023年3月13日,据区块链安全审计公司Beosin旗下BeosinEagleEye安全风险监控、预警与阻断平台监测显示,DeFi借贷协议EulerFinance遭到攻击.
1900/1/1 0:00:00本周二,几乎所有人的目光都聚集在了OpenAI的GPT-4上,以致于很多人甚至都不知道,就在同一天.
1900/1/1 0:00:00原文作者:小王游戏论 图片来源:由无界AI生成日新月异的生成型AI技术的出现对我们所带来的影响,几乎可以被认为是又一次数字革命.
1900/1/1 0:00:00编译:Dali@Web3CN.Pro这是一个很可能会被载入硅谷历史的事件:硅谷最著名的银行——硅谷银行居然自己酿成大错,现在深陷危机不得不需要其他银行来救助.
1900/1/1 0:00:00金色财经报道,据英国金融时报报道,英国政府正试图推动对硅谷银英国子公司的收购,以防止冲击蔓延至整个科技行业。一家财力雄厚的中东买家已经表示了兴趣.
1900/1/1 0:00:00今天,受美国硅谷银行濒临倒闭影响,加密市场全线下跌,比特币跌破2万美元创近两月新低。有关最新行情分析,推荐阅读《比特币跌破?20000?美元,硅谷银行连累了加密市场?》.
1900/1/1 0:00:00