在最近的会议演讲中我经常会被问到:区块链数据分析的最大挑战是什么?我的回答就一个词:去匿名化。
我坚定地认为,识别不同类型的参与者并理解其行为是解锁区块链分析潜力的核心挑战。我们花费了相当多的时间来考虑这个问题以识别出与数字货币运动的伦理不发生冲突的正确边界。在这篇文章里,我想进一步探讨这个思路。
市场上大多数区块链的架构依赖于匿名或伪匿名机制来保护其节点的隐私并实现去中心化。数据混淆机制可以将加密资产交易数据记录在公开的账本上让每个人都能访问,但是也让分析这些数据变得异常困难。
如果不能识别参与者的身份,就很难理解区块链数据集并分析出有意义的结果,而且区块链分析只能徘徊在初级阶段。然而,重要的一点是要理解,去匿名化区块链数据集并不是要知道账本中每个地址的真实身份,这个方向基本上是不具备可扩展性的可能。
何一:监管合规是大势所趋,Binance并未出于自身目的动用用户资金:6月28日消息,Binance 联合创始人何一近期在迪拜接受了彭博社的专访,对于 SEC,甚至世界各国市场监管机构近期对 Binance 的一系列监管动作,何一表示,Binance 尊重监管机构的态度,无论是支持还是反对加密货币的发展,我理解监管的总体意图是好的,是为了保护投资者。全球监管趋势是不可避免的,这不是喊几声斗争口号就能解决的事情。
在何一看来,Binance 提供的透明度比批评者声称的要高,并且一直在与美国监管机构合作。与针对 FTX 的指控不同,Binance 并未出于自身目的动用用户资金,也没有使用其原生 BNB 代币作为贷款抵押品。
在被问及和 CZ 是否考虑过没有他们的 Binance 时,何一表示,我和 CZ 都有正在接受培训的后备高管,目前暂时拒绝透露他们的姓名,我想我们会没事的。[2023/6/28 22:06:28]
相反的,我们可以识别并理解区块链中已知参与者的行为,例如交易所、OTC柜台、矿工以及其他构成区块链生态系统的核心成员。
Bitwise CIO:一场持续多年的加密牛市正在拉开序幕:6月25日消息,加密指数基金管理公司Bitwise首席投资官(CIO)Matt Hougan表示,在期待已久的机构兴趣浪潮的推动下,一场持续多年的牛市正在拉开序幕。
Matt Hougan在接受彭博社采访时表示,面对越来越多的监管审查,加密货币价格表现出了令人难以置信的弹性。贝莱德旗下iShares最近提交iShares Bitcoin Trust申请文件,可能是新一轮牛市的锦上添花之举。
Hougan表示,“自去年11月FTX崩溃以来,(加密货币)价格实际上一直在上涨。现在全球最大的资产管理公司贝莱德在此问题上表态,表示比特币很重要,这是机构投资者在未来五到十年内希望拥有的资产。我认为我们已经进入了加密货币的新时代。我称之为‘加密货币的主流时代’。我认为我们已经进入了一个刚刚开始而且为期多年的牛市。”[2023/6/26 21:59:46]
地址数量会不知不觉误导你
BAYC #1626在以太坊永久销毁并在比特币区块链上铸造为“铭文5413”:2月13日消息,据BAYC #1626持有者Jason A. Williams在社交媒体称,NFT社区正在转向比特币区块链,Ordinals协议为数字藏品带来了真正的稀缺性,因此决定将BAYC #1626铸造在世界上最稀缺和最安全的区块链上,并将使用TeleBurn在以太坊区块链上永远销毁,之后也不会再回到以太坊,目前BAYC #1626在比特币区块链上铸造为“铭文 5413”。[2023/2/14 12:04:44]
网络的量度是区块链分析中无所不在的一个指标,也是一个可以清晰地展示去匿名化威力的指标。
地址数量是最常见的一个具有误导性的指标,因为并非所有的地址都同等重要。交易创建的一个用于临时性转账的地址,显然不能和另一个长期持有资产的钱包地址相提并论。
Vesto和United Cities North America签署数字汇款和支付平台意向书:金色财经报道,数字资产基础设施Vesto和与联合国及联合城市全球计划合作的组织北美联合城市(UCNA)宣布,他们于2022年9月16日签署了一份意向书(LOI),向智慧城市居民提供数字钱包和汇款服务。根据联合国网站的数据,预计到2030年将汇出4.5万亿美元的汇款。存在大量机会帮助发展中国家接收更多来自国外的汇款。通过利用Polygon区块链,Vesto能够在全球范围内提供超快速和低费用的交易,将资金留在收款人手中。(prnewswire)[2022/9/30 6:03:06]
类似的,像币安这样的交易所的热钱包,肯定也不同和我的个人钱包采用同样的方法和指标去分析。同等对待所有地址的匿名性,注定会导致解读的有限性并且经常会得出误导性的结论。
匿名性vs.可解读性
匿名或伪匿名身份是可伸缩的去中心化架构的关键因素之一,但是这也让从区块链数据集中获取有价值的信息变得极端困难。理解这一观点的一个办法,就是把匿名性视为区块链分析的可解读性的一个反因子。
在区块链数据集中匿名性与可解读性之间的摩擦相对来说还比较小。一个区块链数据集的匿名性越高,从中获取有意义的信息的难度就越大。参与者的身份提供了其行为的上下文环境,而上下文环境则是可解读性的关键构建模块。
去匿名化vs.打标签
「你是什么」远比「你是谁」要重要。
去匿名化区块链数据集并不涉及了解每个参与者的真实身份。试图了解每个用户的真实身份不仅是一个意义重大的任务,而且也会让分析工作难以突破一定的规模。
相反,我们可以试着理解一个参与者的关键特征来让我们的分析达到一定程度的可解读性。因此,不需要清楚地识别每个地址的真实身份,我们可以给地址打标签或者附加一些描述性的元数据,来让其行为具备一定的上下文环境。
在大规模数据中,打标签常常要比个体识别更有效果。理解区块链生态系统中特定个体的行为当然会让分析达到更个性化的程度,但是对于在宏观层面理解行为的趋势就显得相对受限了。
因此,相对与对区块链地址的个体真实身份的识别,去匿名性的挑战与地址的关键性属性的标注的关系更大。我们如何实现这一点?
机器学习会是一个优秀的解决方案
标注或者去匿名化区块链的思路可以让区块链分析更好地生态中已知参与者的行为模式和特征。直觉上我们可以考虑创建一些规则来分析区块链生态系统中的不同成员,例如:
“如果一个地址持有大量比特币地址并且一次执行100个交易,那么这是一个交易所地址……”
虽然很有吸引力,但是基于规则的方法将很快失效,无法再提供有用的信息。下面列出了部分原因:
预置知识的完整性:基于规则的分类会假定我们对于如何识别区块链生态中的不同参与者有足够的知识。这显然是不正确的假设。
持续的变化:区块链解决方案的架构一直都在演变,这对任何嵌入的规则而言都是挑战。
特征属性的数量:创建一条有两三个参数的规则很简单,但是试图创建一条有几十个甚至上百个参数的规则就没那么简单了。要识别出像交易所或OTC柜台这样的地址需要大量的特征。
因此我们不能使用预置的规则,我们需要一种可以从区块链数据集中学习模式的机制来自动推断出有意义的规则让我们可以标注相关的参与方。从概念上来说,这是一个经典的机器学习问题。
从机器学习的观点,我们应该从两个主要途径来考虑应对去匿名化的挑战:
无监督学习:无监督学习聚焦于学习指定数据集中存在的模式并识别相关分组。在区块链数据集的上下文中,可以使用无监督学习模型基于地址的特征将其匹配到不同的分组中并对这些分组进行标注。
监督学习:监督学习方法可以利用已有的知识来学习指定数据集中的新的特性。在区块链上下文中,可以使用监督学习方法基于已有的交易所地址数据集训练一个模型来识别出新的交易所地址。
去匿名化或者给区块链数据集打标签很少是只用监督学习或者只用非监督学习,更多的情况下需要两种方法的结合。机器学习模型可以有效地学习区块链生态系统中特定参与者的特征,并利用这些特征来理解其行为。
在使用区块链ETL工具将区块链原始数据加载到数据库或大数据分析平台后,将标注层引入区块链数据集是进行更有价值的区块链数据分析的一个关键挑战。
这些标签提供了更好的上下文环境,也让区块链分析模型具有更好的可解读性。不过尽管我们有机器学习这样强大的工具,去匿名性依然是分析理解区块链生态系统的道路上一个不可忽视的重大路障。
本文来源于“区块链大本营”。
11月30日、12月1日,“变革与梦想·2019凤凰网财经高峰论坛”在上海举办,中国互联网金融协会副秘书长杨农出席论坛并发言.
1900/1/1 0:00:00亲爱的用户:Cosmos将于2019年12月05日起加入Binance的月度持仓返利计划,用户在Binance平台持仓ATOM可以获得返利.
1900/1/1 0:00:00据DeepFlow消息,不完全统计,2019年以来,至少有超过500人因为涉嫌虚拟货币被机关逮捕,涉案金额超过226亿人民币。虚拟货币案大致可分为两类.
1900/1/1 0:00:00尊敬的LOEx用户:由EN项目方与LOEx国际站经过协商项目调整,决定于2019年11月2817:00暂停EN/USDT交易对,具体上线时间,另行通知,如有不便.
1900/1/1 0:00:00亲爱的SilkTrader星客用户:活动时间:2019年11月26日17:00—2019年12月1日12:00?参与方式:打开链接答题http://k456xypj0shwm0vl.
1900/1/1 0:00:00尊敬的用户:Tokencan交易平台即将上线FPRS,并开通FPRS/ETH交易对,具体时间如下:上线时间:2019年11月15日14:00项目介绍:FPRS是以SERO为基础的数字货币.
1900/1/1 0:00:00