木星链 木星链
Ctrl+D收藏木星链

COIN:重新思考并理解「数据即石油」:隐私计算如何保障数据主权?

作者:

时间:1900/1/1 0:00:00

《经纪学人》早在2017年就发表封面文章,称「数据将取代石油」成为当今时代最有价值的资源。但直到今天,拥有「数据石油」主权的普通人依然无法从这宝贵的资源中获得收益。相反,这些数据还给它们的拥有者带来了严重的隐私泄露的问题。为何美好愿景与现实情况间有着巨大差距?怎样才能实现数据所有权和数据价值?本文试着从已有的实践去探讨,希望能理清一些线索,对建立起关于该问题的思考框架贡献一点力量。

我们不能出售数据

相信我们每个人都有过接到推销电话的经历。绝大多数人的个人数据都被买卖过,最简单的比如电话号码和一些消费信息,这些数据此刻也许正在某个地方等着被再次出售。数据确实能卖出钱来,钱落入了那些获取了我们数据的机构的口袋。这个现象容易带来一个认识的误区,即认为我们可以通过出售数据来实现数据的价值,也就是说,在我们借助法律条文和技术手段拥有数据主权后,可以通过把这些数据卖给需要的人来获得数据价值,把「石油」卖成钱。但这是错误的,我们不能买卖数据。在阐述这个问题之前,我们有必要区分数据的所有权和数据的使用权。对于这个世界上绝大多数的资产,买卖行为意味着资产所有权的转让:一方得到所有权,另一方失去所有权。但买卖数据不会转让数据的所有权,你卖出了数据,但这些数据的所有权依然属于你。因此围绕数据的交易实际上是围绕数据使用权,而不是数据所有权的交易。但因为数据可以被无限复制,如果我们卖出了数据,就无法保证买方会如何使用以及是否会再次出售这些数据,更准确的说,在某种程度上我们已经「失去」了这些数据,哪怕我们拥有数据所有权。非法的数据交易会直接买卖数据,是因为他们不在乎数据所有人的权益,但当我们真实拥有了数据所有权后,为了实现数据价值,我们是不能买卖数据的。那么该如何交易数据的使用权但不失去数据?答案是不交易数据本身,只交易数据的计算结果。也就是说,买方可以利用这些数据进行计算,得到其需要的结果,但买方不能获取到原始数据本身。这是当我们讨论数据所有权和数据价值时,第一件、或许也是最重要需要理解的事情:我们不能通过出售数据实现数据价值,只能通过出售数据结果实现数据价值。也就是说,我们要把数据的所有权和使用权分离,只交易数据使用权。隐私计算不只是为用户隐私问题服务

Blur创始人:接受挂单价功能已重新启用,将向受影响的交易者予以退款补偿:4月22日消息,Blur创始人Pacman发推称,北京时间4月22日11:00左右,Blur在消息处理中检测到一个漏洞,该漏洞影响了过去80小时内取消的一些出价。在检测到漏洞后,团队立即禁用“接受挂单价”功能。在30分钟的时间里,有36个受影响的挂单价被接受。此后,Blur修复了这个问题,并在北京时间4月22日14:05启用挂单价功能。在启用接受挂单价之前,任何高于地板价的当前挂单价都将被自动取消。

Pacman表示,除了修复导致这一问题的漏洞外,团队还实施了两个额外的冗余安全检查,以便这一问题不会再次发生。所有受影响的挂单价被接受的交易者将被获得其出价与当时适当的最高出价之间差价的2倍退款。譬如,如果最高出价是14.5ETH,而受影响的挂单价以15.5ETH被接受,Blur将退还2ETH。受影响的交易者无需出售其NFT来获得这笔退款。Blur将在接下来的24小时内自动发送。[2023/4/22 14:20:35]

如何实现只出售数据结果?答案是:通过隐私计算。隐私计算是在不暴露原始数据的情况下计算数据,且计算结果可被验证。它包括全同态加密、安全多方计算等多个研究方向,有许多专业的技术文章介绍它们的工作原理,若你希望更进一步了解,可以去查看。在这里我们有第二个模糊地带需要澄清,即:隐私计算不只是为保护用户隐私服务,它更是实现数据使用权交易的基础,也就是实现数据价值的基础。之所以需要做这个澄清,是因为「隐私计算」容易被理解成又一种保护隐私的技术,重点被落在「隐私」上,但实际上「隐私计算」的重点是在「计算」上。在区块链行业中,由于隐私计算常常被作为一种增强用户隐私的方法用于密码货币交易中和区块链上,所以人们更容易把隐私计算理解为它是为实现用户隐私服务的,这一理解并没有错,但它把隐私计算局限到了一个小的领域。也许从另一个角度看待这个问题会更清晰。我们把数据问题拆分成用户隐私问题和数据价值问题。用户隐私问题解决的是与用户相关的原始数据不被泄露、用户的隐私不被暴露,我们可以把该问题看作一种特定范围内的数据隐私保护。在这个阶段中,隐私计算的角色是一种可供选择的保护隐私的方法。在用户得到了数据隐私后,如果他/企业选择把数据放在那儿什么都不做,故事就结束了;但如果用户/企业想更进一步,得到数据的价值,就要把数据拿出来使用,事情就进入到下一个阶段,此时需要通过各种方法来保证数据在被使用的整个生命周期内都不被泄露,我们可以把这看作一种全范围的数据隐私保护。在这个阶段中,隐私计算的角色不再是一种可供选择的方法,而是一条必经之路,因为实现数据价值的方法是在不暴露原始数据的情况下出售数据结果,进行数据使用权的交易,只有隐私计算能够达成这一目标。如果把数据比作石油,那么隐私计算就是炼油的第一道工序,它是我们在保证用户隐私前提下把「原油」转换成各种产品的基础。并非所有数据都具有相似的价值

Wombat现已重新开放HAY/BUSD流动性池:12月7日,据官方推特表示,稳定币交易平台Wombat Exchange宣布重新开放HAY/BUSD流动性池,用户可以添加、取出流动性以及进行交易。BNB流动性池仍然处于暂停状态,未来会在推特上进行情况更新。

此前报道,因Ankr遭到攻击后,有套利者掏空平台WBNB流动性,Wombat暂停BNB、aBNBc和HAY池。[2022/12/7 21:28:51]

并非所有数据都具有相似的价值,也并非所有数据都能实现数据价值,这可能是我们在讨论数据价值时又一个需要明确的地方。只有当我们理解数据的复杂性和多样性后,才有可能针对不同的情况,在法律上和技术上使用不同的条款和方法来真正解决问题。本文将试着从应用角度出发对数据的类别进行一个简单的划分,再介绍该类数据的数据价值问题。此处提出的数据分类方法不一定全面和准确,它只是为建立起一个基本的可供讨论的框架服务。我们可以把数据分为三大类:第一类是身份数据;第二类是行为数据;第三类是生产力价值数据。第一类身份数据在网络和现实世界中被用于注册和身份确定,比如身份证号码、电话号码、账户信息等等,这类信息对于非法产业有着最大的价值,一旦泄露也会给用户带来大的安全隐患。但对于正规数据产业,这类信息反而没有计算价值,它们计算不出有意义的结果。因此,这一类数据本身是不需要考虑如何通过隐私计算实现数据价值的。第二类是行为数据,它包括用户在网络上的浏览痕迹、消费数据,也包括用户的产品使用习惯数据等。可以通过计算这些数据对用户进行个人画像,再基于画像向用户推送广告、推送内容、提供服务,甚至推销观点。行为数据有两大类价值,一是广告价值,我们都知道几乎是广告养活着整个互联网产业;二是能够帮助产品了解用户,从而为用户提供更好的个性化服务。目前在世界范围内被广泛关注和讨论的数据所有权问题主要集中在这一类型的数据身上。很长时间以来该类数据的各种权限并不明确,人们也并未在意,直到这些数据的计算结果被越来越多的用于影响或者控制我们时,我们才认识到该问题的严峻性。这其中标志性的事件是2018年Facebook的数据门事件。在该事件中,一家名为剑桥分析的数据运营公司获取了超过5000万名Facebook用户的数据,通过数据计算,他们筛选出其中立场摇摆的对象并向其投放精准匹配的宣传广告,从而影响了美国的大选和英国的脱欧公投。

金色财经合伙人佟扬:Filecoin主网一旦上线或将重新洗牌存储市场:7月3日20:00,由金色算力云、链上科技、金色财经主办;IPFS100.com、节点咨询承办的“金色算力云线下发布会”正式拉开帷幕。金色财经合伙人兼IPFS100.com CEO佟扬指出:因为想象空间够大,Filecoin项目一经推出便从9家知名投资机构募集了5700万美元。随着Filecoin临近主网启动,整个项目也正在蒸蒸日上。作为雄心勃勃的互联网颠覆者,Filecoin主网一旦上线或将重新洗牌存储市场。Filecoin挖矿之热使人另眼相待,如何进军挖矿领域、如何靠谱且较为低门槛的参与Filecoin挖矿等难题始终困扰着投资者。金色财经拥有海量资讯,可以第一时间为投资者们送上资讯盛宴;丰厚的矿商及多元商务资源将助力整个产业形成生态闭环,打通产业上下游,最大程度为投资者提供便利,可以说,金色财经助力IPFS生态发展正当时。[2020/7/3]

好消息是,我们似乎正在拿回这一类数据的所有权。欧盟出台的《通用数据保护条例》规定,产生数据的个人是数据主体,他有权要求清除其个人数据,也有权反对并要求停止对其个人数据的处理。坏消息是,我们没有拿回数据的使用权,如前文所说,数据价值是建立在数据使用权交易的基础之上的,所以我们离用这类数据实现归属于用户的数据价值还很遥远。它的困难在于:一方面,即使被称为史上最严苛的数据保护条例,GDPR也只是要求企业在使用数据前告知用户哪些数据被使用了,以及用这些数据做什么,也就是说,它只约束企业不滥用数据,但并不限制企业使用数据。另一方面,因为这类数据可被用于帮助产品了解用户,如果企业以提高用户体验为理由使用数据——它们现在就是这么做的——我们似乎难以拒绝。让用户牺牲用户体验去要求企业无权使用任何行为数据似乎很难,而希望企业主动把这类数据的两种用途区分开、让渡部分广告价值似乎更难。

动态 | 区块链银行联合企业We.trade计划重新调整平台定价模式:据Fora报道,总部位于都柏林的区块链银行联合企业We.trade计划重新调整其平台的定价模式,并将其开放给小型企业。据悉,该联合企业由包括汇丰和德意志银行在内的12家欧洲股东银行牵头,开发了一个由银行提供的区块链交易平台,以完成企业和供应商之间的跨境交易。在过去的12个月里,这个使用Hyperledger Fabric软件构建的平台已经为更多的银行客户推出服务,最近一次是为斯堪的纳维亚的北欧联合银行(Nordea)。 We.trade新任总经理Ciaran McGowan表示:“We.trade一直在收集中小企业对如何完善该平台的反馈意见。我们实际上正在撰写一份新的商业计划,以展示该公司未来5年的规模。”新计划的一部分将涉及收入模式的多元化。目前,银行使用该平台需支付固定的许可费。McGowan透露其将根据银行规模和中小企业的数量,改为分级定价。 此外,这家爱尔兰区块链公司正努力解决员工短缺问题。目前,We.Trade的基础拥有一支10人规模小团队,该公司计划将这个团队发展到30人,并在内部引入更多的开发技能。[2019/6/13]

这是否意味着企业依然可以按照以前的数据处理方式行事?并不是。我们会发现上述数据所有权和使用权的分离仅仅是字面意义上的,企业虽说只拥有数据的使用权,但它们是「拿到」并使用原始数据本身的,这让数据依然存在被滥用以及安全方面的问题。而因为大众隐私意识的觉醒以及各国数据保护法的出台,一旦出现问题,企业将可能面临用户的抵制以及巨额的罚款,因此我们可以看到Google、苹果等公司如今都在隐私计算领域进行着大量的研究。以Google为例,它的「联邦学习FederatedLearning」是将机器学习模型集成到每一台设备上,在汇总用户参数发送给云端时,通过隐私保护地聚合算法和系统工程实现隐私计算。但需要再次指出的是,企业通过隐私计算实现数据所有权和使用权的分离,不是为了用户能够进行数据使用权的交易,它们更多的是希望降低数据使用风险、免受隐私泄漏指责,能够满足合规要求的继续免费使用用户的数据。因此,用户得到这类数据的数据价值是一件道路漫长的事情,其中最大的难点在于意识,只有当我们有强烈的数据所有权和使用权意识时,才可能推动政府出台更严格的数据保护条例,或者推动新的互联网架构颠覆如今中心化服务器的模式。「生产力价值数据」最具价值

Bittrex重新开放新用户注册 数小时后再度关闭:据cointelegraph报道,4月10日,世界第七大交易所Bittrex宣布重新开放新用户注册入口,该交易所由于容量饱和,自去年起12月份开始暂停注册,新用户只能通过一个等待名单程序进行注册。不过在入口开放仅仅数小时后,Bittrex宣布因“反响远超预期”,不得不再次暂时关闭注册入口,并称会“尽早开放”。[2018/4/13]

了解了「身份数据」和「行为数据」之后,接下来介绍第三类数据,在本文中我们称其为「生产力价值数据」。该类数据的一大用途是做机器学习,训练AI;另一大用途是做数据分析,帮助进行科学研究、产品设计、决策制定等。这一类数据如果被恰当使用,能够驱动社会往更有效率、更为友好的方向发展,它们是一种生产力。第三类数据的采集范围最广,数据量最大。它可以来自于人类,比如个人的医疗数据和财务数据、个人的产品使用习惯数据等等;也可以来自于物联网设备,比如传感器收集到的大气情况数据、自动驾驶数据等等。它的一部分数据来源与第二类数据相同,都是使用互联网产品的用户,只不过采集到的数据的处理方式和用途不同:第二类数据是取之于用户、用之于用户,而第三类数据是被集合后跨数据主体使用。从数据本身的角度出发,我们可以认为某个数据既是第二类数据,也是第三类数据。第三类数据具有最大的数据价值,同时它们也有可能最先进入到数据使用权的交易市场,实现数据价值。不同于第二类数据是互联网企业自己拥有数据使用权同时自己使用数据,不需要进行数据交易,在生产力价值数据的应用场景中,出现了不拥有数据使用权但希望使用数据的角色。从这个角度,我们可以认为第三类数据是指所有可资产化的数据的集合。我们可以拿医疗数据为例来更好的理解如何使用第三类数据。科研机构或制药厂如果能有大量的医疗数据的支持,就能更好、更快的研究疾病和开发新药,但拥有数据资源的医疗机构因为用户隐私问题和自身利益,并不会把这些数据提供给其他机构使用。如果我们通过隐私计算分离数据的所有权和使用权,就能建立起一个数据使用权的交易市场,不同医疗机构、科研机构和制药厂的数据就可以在这个平台上实现连通——流行的说法是打破数据孤岛——这些机构间可以进行数据的买卖,也可以数据共享进行联合的疾病研究。如果我们要训练能够诊断疾病的AI,也需要通过上述方式打破数据孤岛,这样才能提供给AI更多、更全面的数据。需要赘述的是,在现阶段,即使实现了数据的交易和价值,但因为数据使用权在法律上和使用上的边界都不明确,我们作为个体依然很难拿回全部的数据的价值。数据所有权和使用权是这个时代最重要的议题之一,《人类简史》的作者、历史学家尤瓦尔·赫拉利的观点是:「如果我们希望避免财富和权力都集中到一小群精英手中,关键在于规范数据的权限」。因为数据自身的复杂性和多样化,从边界清晰、可以被准确描述的细小处出发定义问题、解决问题,而不是寄希望于舆论、立法和技术能够整体解决问题,也许才是快速与有效的方法。我们可以对不同的数据类别进行更具体的分类和分析,或者用不同的分类标准探讨数据的分类,再基于此讨论数据的隐私、数据的所有权和数据的价值实现问题。重新理解「数据即石油」

数据常被比作石油。虽然楔形文字中便有人类在死海沿岸采集天然石油的记录,但直到1846年亚布拉罕·季斯纳发明从煤中提取煤油的方法,1853年伊格纳齐·武卡谢维奇和扬·策从原油中分馏出精炼的煤油,现代石油工业的历史才算真正开始。不过这仅仅是开始,作为煤油灯燃料的石油并不特别,只有在后来当它被用于内燃机后,才爆发出巨大的潜力,并成为世界上最重要的一种资源。数据与石油的相似之处在于,仅仅有数据还不够,只有实现了数据的「炼油术」,才有可能开启数据的产业时代。而数据与石油的不同之处在于,石油是先有炼油厂,然后才有内燃机的需求,而数据是已有巨大的使用需求,却没有成熟的技术和基础设施支持这种需求。这或许是一件好事。道路漫长,但我们知道方向。参考资料:1.《FederatedLearning:CollaborativeMachineLearningwithoutCentralizedTrainingData》2.《Helpingorganizationsdomorewithoutcollectingmoredata》

标签:COINOINLECTRAStartcoinMini Cat Coinfilecoin币价格今日行情走势Welltrado

抹茶交易所热门资讯
区块链:一文解析蚂蚁链的底层商业逻辑

今天,越来越多的企业开始探讨数字化转型,希望借助新技术保障企业可持续发展并能够对外部的商业机会有更深刻的洞察。而这股企业数字化浪潮早在全球疫情大爆发以前就开始兴起并一直延续至今.

1900/1/1 0:00:00
INJ:从Injective协议展望DeFi交易基础设施

币安的去中心化尝试提到币安,大家往往只知道那个世界交易量最大的中心化交易所,以及Fork了以太坊的币安智能链,但对第一代币安链和币安DEX却极少了解.

1900/1/1 0:00:00
NFT:ERC-998协议是什么? | 不一样的「NFT」 -- N词贴

N词贴|ERC-998ERC-998意为可组合非同质化代币,该底层协议标准设计允许任意一个NFT捆绑其他NFT或FT,用户在转移CNFT时,可以实现CNFT所拥有的整个层级结构和所属关系转移.

1900/1/1 0:00:00
AXI:从Axie Infinity的爆发背后,看加密游戏的进阶之路

随着AxieInfinity的成功,人们看到了加密游戏的可能性。在上个周期,加密猫游戏成功地将以太坊变得拥堵不堪,但加速了以太坊可扩展方案的探索,也推动了其他不同链的诞生.

1900/1/1 0:00:00
NFT:站在NFT的「垃圾堆」上展望未来

本文来自LDCapital,原文作者T.Y这个世界上无数的区块链玩家,拿着自己的钞票冲向DeFi与NFT的市场,并且在市场下跌中损失惨重。这正是我们所处于的大泡沫时期的真实写照.

1900/1/1 0:00:00
DAO:ArkStream 2021年Q2加密投资季报(三)

加密货币基金ArkStreamCapital在2021年第二季度共投资了近二十个项目,我们将以项目简介、赛道分析出发,来阐述为什么投资这些项目的缘由.

1900/1/1 0:00:00