比「GPT侦探」更重要的是,AI生成内容在不同行业的「容忍度」。
图片来源:由无界版图AI工具生成
作者|美漪编辑?|靖宇
最近两个月,科技圈最热的话题,无疑是OpenAI推出的对话式AI应用ChatGPT,不仅可以让它给你写一首诗、回答你的任何问题,甚至可以让它帮忙写没那么复杂的代码。业内甚至认为,ChatGPT甚至有取代谷歌的潜力。
为ChatGPT欢呼的还有另一群人,就是「社畜」和学生——他们发现月度总结、学校论文和作业这样的任务,也可以让ChatGPT代劳了,后者甚至写得有模有样,不比真人写得差多少。
ChatGPT似乎让学生们的日子更轻松了,但却让教师更「头疼」了,因为后者很难确认,眼前这些文字,到底是学生写的,还是出自OpenAI的产品之手。为此,纽约教育部甚至禁止公立学校使用ChatGPT。
在这样的混乱中,一位普林斯顿大学的学生,EdwardTian推出了一个专杀ChatGPT的应用——「GPTZero」,有了这面「照妖镜」,内容是人写的,还是机器写的,真相马上就揭晓。
「GPTZero」在网络迅速爆红,吸引了a16z在内的硅谷创投的目光。但是应用创造者本人Tian却认为,最重要的事,是「让AI更加透明」。
多伦多交易所母公司计划推出新交易平台,或将支持加密货币和NFT交易:6月16日消息,多伦多证券交易所(Toronto Stock Exchange)的母公司TMX集团正计划推出一个针对初创企业和另类资产类别的新交易平台。该公司在本周发布的白皮书中表示,新交易所将针对成长型公司。该公司尚未确定哪些资产类别将在新交易所交易,但正在考虑加密货币、NFT、证券化房地产和私营公司的股份。此外,创业版交易所TSX Venture还在考虑为估值不低于5000万加元、同时寻求1000万加元独立融资的公司提供“通行证”,以加快上市流程。[2023/6/16 21:40:54]
01
「ChatGPT杀手」
在ChatGPT成为学生们「偷懒」的神器后,教育和科研机构不得不开始抵制这个新的噩梦。
纽约教育部宣布禁止学生在公立学校使用ChatGPT;全球知名机器学习会议之一的ICML也宣布禁止发表包含由ChatGPT和其他类似系统生成内容的论文,以免出现「意外后果」。
出于对学术界,使用ChatGPT相关道德问题的担忧,华人小哥EdwardTian在一家当地的咖啡店里,花了一个寒假的时间,研发了GPTZero,希望能让学术界恢复严谨性。
Gemini定期维护时间延长至12月16日15:30:12月16日消息,加密货币交易所Gemini状态页面显示,原定的定期维护时间已延长多次。最新信息显示,维护将于北京时间12月16日15:30结束,目前用户界面和交易继续保持不可用状态。
据此前报道,Gemini发文表示,一些Gemini客户最近成为网络钓鱼活动的目标,官方认为这些活动是第三方供应商事件所致,此事件导致其收集了Gemini客户的电子邮件地址和部分电话号码,没有Gemini账户信息或系统因此第三方事件而受到影响,所有资金和客户账户仍然安全。[2022/12/16 21:48:27]
Tian年仅22岁,目前仍是美国普林斯顿大学的大四学生,主修计算机科学专业,专门研究自然语言处理,同时辅修认知科学和新闻学。
GPTZero的开发者EdwardTian|网络
他还曾是英国广播公司和开源情报网站Bellingcat的研究员,也曾是被微软收购的反恐初创公司MiburoSolutions的分析师。在那里,他监测虚假信息和机器人检测。Tian说,「所有的这些经历,都是他研发GPTZero的动力」。
2023年1月2日,Tian将GPTZero发布到网络,预计只会有几十个人尝试它,完全没有想过,这会掀起一场世界级别的轩然大波。
流动性质押协议Stader Labs计划新增支持以太坊:12月7日消息,流动性质押协议Stader Labs计划新增支持以太坊,其当前已支持Polygon,NEAR,Fantom,BNB Chain、Hedera与Terra 2.0。Stader Labs于2021年10月获得了由Pantera Capital领投的400万美元融资,后又于2022年1月宣布以4.5亿美元估值完成Three Arrows Capital领投的1250万美元融资。[2022/12/8 21:29:43]
在他把这款软件上传到互联网上的几个小时内,竟有超过?2000人在Steamlit上测试了GPTZero的公开版本。
1月5日,也就是发布的第三天,Tian对GPTZero做出了更新和改善,还显著降低了误报率;此时,新程序已有超过?1万的用户量了!Tian也不禁对它的「爆炸性增长」和「病式传播」感到震惊。
据NPR报道,一周内有?3万多人试用了GPTZero,甚至「导致该应用由于出乎意料的高网络流量」而崩溃,托管GPTZero的免费平台Streamlit此后介入,以更多的内存和资源支持Tian,以处理网络流量。
EdwardTian通过在视频中展示其对一篇《纽约客》文章和LinkedIn上的ChatGPT生成器的帖子的分析,展示了该应用如何区分人类和人工智能撰写的文本。
Web3初创公司Spindl完成700万美元融资:金色财经报道,总部位于迈阿密的Web3初创公司Spindl完成700万美元融资,DragonFly Capital、Chapter1、Polygon Ventures、Tribe Capital、Multicoin以及少数天使投资人支持,新资金将用于扩大招聘。
Spindl创始人García Martínez表示,该公司试图为Web3重建Web2电子商务后端的基本部分,即互联网企业如何跟踪他们的客户来自哪里,并制定获客策略来吸引更多用户。例如,Spindl可以通过分析Discord帖子、Reddit论坛、广告和其他互联网链接,将这些数据与购买、销售和交易等链上行为配对,以创建帮助协议了解流量来源的配置文件。[2022/10/20 16:30:59]
GPTZero的工作原理就是检测文本的「困惑性」和「突发性」这两项指标,并分别对其打分,根据统计学特征来确定,文本是由人工智能写的还是人类写的。总体来说,如果这两项参数得分都很低,那么该文本很有可能出自AI之手。
这里所说的「困惑性」,是指来自人类所写作品的语言的复杂性和随机性。
这个指标主要是衡量文本在一个句子中的随机程度,以及一个句子的构造方式是否会让GPTZero感到困惑。
Terra:新Terra Core最终版本已发布,以在5月27日启动新链:5月25日消息,Terra官方表示,新Terra Core的最终版本已经发布,以准备在5月27日启动新链,代码已通过SCV Security审计。币安、BYBIT等交易所将支持新LUNA空投。[2022/5/25 3:41:45]
每当用户在GPTZero输入一段测试内容,它就会分别计算出:「文字总困惑度」、「所有句子的平均困惑度」、「每个句子的困惑度」。
这些数值越低,越能说明这个文本对GPTZero来说是非常「熟悉」的,那么它很可能是AI生成的;相反,如果这些数值越高,就越能说明文本中句子的构造或用词方式让GPTZero感到「惊讶」,那么它就更可能是出自人类之手。
这是因为,人工智能接受过数据库的训练,生成的文本在一段时间内,表现出的困惑度会更均匀和恒定,选词的可预测性也更高;而人类书写的文本则不会这样,真人的遣词造句一般会比较随机,比机器更容易写比较出乎意料的词句。
使用GPTZero检测文字是否由ChatGPT生成|Twitter
而「突发性」,则是指来自人类使用的句子结构的变化。
这个参数主要是比较句子复杂性的变化程度,衡量它们的一致性。
这是因为,人类倾向于写高度复杂的文本;而人工智能产出的文本则是低复杂度的;此外,由于人类的思维结构不是线性的,他们的句子结构也遵循类似的模式。
这意味着,人类使用句子结构,会在长而复杂的句子,和短而简单的句子之间摇摆不定,有着更多的句式变化,比如复杂和简单交替并存,一个长难句之后接着出现更简短的句子;而机器生成的句子则倾向于更加统一,很少会有一系列长度相差很大的句子。
简而言之,在选词上「简单」而「熟悉」,并使用「统一整齐」的句子,是人工智能生成作品的标志特征,而更复杂和多样的东西,则表明是人类写的。这也是「困惑性」和「突发性」这两项指标可以作为衡量标准的原因。
除了EdwardTian本人对GPTZero进行测试之外,也有不少网友用它对ChatGPT、一些GPT-3衍生工具生成的内容进行了多次测试。最终结果显示,GPTZero每次都能抓住AI生成的文本,并在十多个案例中正确识别了人类写的文本。
GPTZero的一炮而红,让Tian获得了来自a16z、MenloVentures和RedSwan等知名风投的青睐。不过,面对推特私信和电话轰炸,Tian却显得异常冷静,他谦逊地表示自己不会拒接投资者打来的电话,但他不会忘记自己仍然是一位即将毕业的大四学生。
同时,他还表示自己的GPTZero尚未完成,仍需改进和进一步地开发,甚至计划让大家继续免费使用他的程序,用来支持各地新晋英文老师的工作。
02
急需的「AI透明」
对于GPTZero这一甄别文字是否是AI写作的新程序,推特上的舆论褒贬不一,以教师为代表的成年人大多喜闻乐见,而学生却讽刺GPTZero的创造者Tian是「学术缉警察」。
的确,当GPTZero推出时,Tian收到了众多教师对该应用程序在检测AI写的文章方面的积极反馈,来自世界各地的无数教师也都对Tian表达了他们的感激之情——这让他们的教学难度大大减轻了。
当然,也不难理解,不少学生并不看好Tian这款打击学术偷工减料、不劳而获的软件。
事实上,不只是Tian,就连ChatGPT的开发商OpenAI自己,也已经表明了对防止人工智能剽窃的承诺。
2022年12月,OpenAI专注于人工智能安全的研究员ScottAaronson透露,该公司正在努力开发「缓解措施」,用一种「不易察觉的秘密信号」对GPT生成的文本打上「水印」,以识别其来源,从而打击作弊的系统。
这项技术将通过微妙地调整ChatGPT选择的特定单词选择来发挥作用,读者不会注意到这种方式,但对于任何寻找机器生成文本迹象的人来说,这在统计上都是可预测的。
公司发言人表示,「我们将ChatGPT作为新研究的预览技术,希望能从现实世界的应用中进行学习。我们认为这是开发和部署功能强大、安全的AI系统的关键部分。我们会不断吸取反馈和经验教训,」。
GPTZero首页|GPTZero
此外,OpenAI还联合哈佛等高校机构联合打造了一款检测器:GPT-2OutputDetector。
作者们先是发布了一个「GPT-2生成内容」和WebText数据集,帮助AI理解机器语言和人类语言之间的差异。
随后,用这个数据集对RoBERTa模型进行微调,就得到了这个AI检测器。其中人类语言一律被识别为True,AI生成的内容则一律被识别为Fake。
值得一提的是,RoBERTa是BERT的改进版。原始的BERT使用了13GB大小的数据集,但RoBERTa使用了包含6300万条英文新闻的160GB数据集。
尽管如此,还是有不少人认为,「AI文本检测器」注定是一场失败的「军备竞赛」,其实际效果并不理想,更无法阻挡ChatGPT等AI语言模型的发展。
然而,尽管Tian建立了GPTZero,他并不反对使用ChatGPT等人工智能工具,他认为GPTZero应用程序的目的不是阻止这些新技术的使用,而是提供一种负责任地使用这些技术的方法,并提供必要的保护。
同时,相对于对抗或者禁止一项技术,也许更重要的是如何为其使用定下规范和标准。例如,在广告、影视及娱乐等行业,对于AI生成类内容的容忍度可能适当提高一些;而在学术、教育和科研领域,非常强调准确性和原创性,毫无疑问,对于AI生成内容的容忍度就要低一些。
而如何确定AI工具使用的「透明度」,可能要比研究如何「反AI」,要更有效,也更有意义一些。
本文为极客公园原创文章,转载请联系极客君微信geekparkGO
中文推特:https://twitter.com/8BTC_OFFICIAL英文推特:https://twitter.com/btcinchinaDiscord社区:https://discord.gg/defidao电报频道:https://t.me/Mute_8btc电报社区:https://t.me/news_8btc
标签:GPTZEROEROZERgpt币哪里可以买Protocol ZeroProtocol ZeroZeronauts
注:本文来自@DeFi_Taha推特,MarsBit整理如下:如果你很早就开始了正确的项目/叙事,你就能创造世代财富。我花了10多个小时浏览了一月份所有融资的项目.
1900/1/1 0:00:00MarsBitCryptoDaily2023年2月7日一、?今日要闻MakerDAO联创拟设立1400万美元科学可持续发展基金「ScientificSustainabilityFund」据bit.
1900/1/1 0:00:00MarsBitCryptoDaily2023年1月18日一、?今日要闻数据:NIKE旗下NFT系列总收入超1.7亿美元据区块链数据平台Flipside信息,截至1月10日.
1900/1/1 0:00:00今日早间Twitter前首席执行官JackDorsey发推称,基于去中心化社交协议Nostr的社交产品Damus和Amethyst已分别在苹果AppStore和谷歌GooglePlayStore.
1900/1/1 0:00:00主打欧美市场的合规加密交易平台Crypto.com,在过去几个月麻烦不断。一是?Crypto.com?被爆曾向已倒闭的?FTX?转入约10亿美元,虽然创始人?Kris进行辟谣仍未能打消市场疑虑;.
1900/1/1 0:00:00首先是2019年4月-7月四个月小牛市行情简单小结:1、行情中有一条主线:减产贯穿始终,四个月内不断有相关标的暴涨,本次的主线是?2、一年内上市的新币、新概念更容易得到市场的青睐.
1900/1/1 0:00:00