我们不必知道现象背后的因果,我们只想让数据自己发声。那么,在区块链时代,如何让端对端加密的数据发声?
原创|阿常
在大数据时代,我们不必知道现象背后的原因,我们只要让数据自己发声。
维克托·迈尔-舍恩伯格《大数据时代》移动互联网、大数据技术的发展让我们享受着数据带来的红利,购物、打车、理财等等应用或者服务采集用户的信息,提供精准化、个性化的服务,给人们的生活带来了极大便利。
而这些便利背后,却是数据分析方放弃追求数据“结果”,选择追求一种“联系”,寻找数据之间的关联性,洞察我们的需求进而提供出更具针对性的服务。
而在区块链的网络中,数据呈现出端对端加密的特质,远比互联网数据更加严密,寻找这些数据背后的“结果”更是难上加难;但是对于从业者而言,找到这些数据之间的关联,提供“定制化服务”并研判发展趋势同样重要。
AFD调查:77%的俄罗斯投资者更喜欢比特币而不是黄金和外汇:俄罗斯外汇交易商协会 (AFD) 对502名俄罗斯投资者进行了调查,以了解当地投资者对加密货币的看法。近77%的受访者表示BTC、ETH和LTC等加密货币是“最具前瞻性”的投资。只有8.8%的受访者表示他们认为黄金是最好的投资,只有23%的受访者从未使用过数字货币。(Cointelegraph)[2021/9/1 22:52:34]
市场刚需,加密数据如何利用
大数据分析精髓在于挖掘数据与真实信息的关系。通过海量数据分析甚至某一特殊事件的数据解读,不再热衷于追求数据分析的精确度。单纯令数据发声,提供行动指南。
而区块链数据由于其本身的匿名性特征,很多时候并不能轻易找到关联关系,但是通过过去某种现象背后数据的全面分析,就能为之后类似事件提供前瞻性建议或者预警。
彭博社策略师:比特币将上涨至5万美元:彭博社策略师Mike McGlone表示,随着投资者将资金从黄金中转移到数字资产中,比特币将上涨至50000美元。 BTC在30000美元处显示出强劲的支撑,机构采用率的提高以及成为全球储备资产的潜力可能会将其价格推高至50000美元或更高。(Cointelegraph)[2021/2/4 18:51:51]
区块链大数据技术已经广泛应用在交易所、钱包、安全机构的业务场景中,通过对交易信息特征的分析,可以得到交易与潜在风险的关联关系,规避掉黑客盗币、等等违法犯罪行为,并能够帮助用户挽回受损资产。
Chaindigg创始人叶茂举例称,一些黑客在盗取数字货币后,有时会设定远高于市价标准的手续费,令矿工率先确认其交易,以便快速实现资金转移的目的。那么在面对一些不合常理的手续费时,交易所可以对这类地址进行区分处理,降低风险。
动态 | 第一位美国国会议员透露拥有比特币:据bitcoinist报道,加密货币已经在美国的高层中崛起。国会议员 Bob Goodlatte(鲍勃·古德拉特)于5月10日提交了年度财务披露声明,披露他拥有17,000美元至80,000美元的数字货币。[2018/8/8]
区块链大数据,可以说是目前市场的刚需,可诞生于互联网的大数据技术仍需要做出一些改变,适应区块链数据的特征。
相比较互联网中的数据构成,区块链数据更具备规律性。所有信息都是按照区块组织排列,每个区块中包含着的交易数据都按照该公链所设定的逻辑排列,且大部分区块在时间中存在先后次序,那么在挖掘数据、查找数据的过程中能够精确规定到某一个时间节点;而互联网大数据则往往由于没有一致的标准和时序,产生诸多异构性数据,通过统一加工后方才能够分析。
彭博:隔离见证技术推广使用 比特币行情回暖:彭据彭博3月1日报道,比特币交易量已经悄然达到了接近大众市场的一个重要里程碑。专为加速比特币交易而设计的软件升级软件“隔离见证”(SegWit)正在获得越来越多的关注。据SegWit.Party网站数据显示,在过去的三天里,使用该技术的交易数量翻了一番,达30%以上。[2018/3/2]
区块链数据维度比互联网数据相对简单。区块链大数据能够划分的维度相对较少,一般分为交易发起方、交易接收方、交易时间、交易金额、交易频次等维度,简单的特征将有助于更好地对数据进行归类分析。
处理区块链大数据,了解数据特征只是基础,更重要的是需要保证两个关键因素:准确率、召回率。
如何保证数据分析精度?
区块链大数据不光要考虑数据的特征,同时也要考虑数据的准确性,以及在相关维度中信息的关联——其核心难度在于准确性、召回率的提升。
准确性又可以理解为真实性,即数据真伪。以比特币网络为例,在可抓取到的几亿条地址当中,存在一些地址、地址等,那么如果能够在分析数据时发现这些数据,无疑能够提高安全性,降低风险,只有准确率足够高时才能够发挥数据的真正作用。
但仅仅保证高准确性并不足够,召回率同样重要。在巨量的准确数据中仍只有一部分数据能够被分析出来,而某些特征不清晰的数据则无法被解读。以比特币网络为例,某些地址交易记录频繁,有时间、数量、交易费等特征可以分析,这部分数据无疑更方便解读;但同时也有一些地址,可以分析的特征维度较少,甚至只有一笔或者没有交易记录,这部分“难啃的骨头”啃不掉,数据召回率同样无法提高,也就难以利用区块链大数据。
Chaindigg创始人叶茂在接受链得得采访时就指出,准确性、召回率虽然划分维度不同,但是同样重要,只有两者齐备才能够真正进行区块链大数据分析,单一一项很难起到决定作用。
理论上而言,提高了准确性、召回率,就能够提高区块链大数据的使用能力,但是区块链大数据仍面临诸多困难。
相比较互联网数据,同一公链中内容更加规范,但是目前主流数字货币基数较多,存在一些公链产生的数字货币具有较强的特殊性;此外,联盟链中数据则具备更强的商业价值,甚至涉及商业机密,起着指导企业后续规划等作用,这也给数据分析的普适性提出更高要求。
换而言之,想要进行区块链数据分析,就必须研制出能处理这些差异的普适性技术。以比特币与以太坊网络为例,后者较前者增加了智能合约的功能,那么在进行数据采集分析过程中就要考虑到智能合约地址的特征,提高数据分析的准确率和召回率。
互联网语境中大数据分析常用的多项技术和策略,例如机器学习、数据标注、模型分析、交叉验证等等,将其嫁接到区块链语境中同样事半功倍。
区块链大数据,或许可以理解为大数据技术在区块链领域的延伸,尽管区块链数据经过了层层加密,但是仍需要从中寻找到向前发展的指引。
亲爱的用户:根据Elrond的摇号中签规则,Binance将于2019年07月01日14:00开启摇号申购,用户可于申购页面查看申购资格.
1900/1/1 0:00:00世界上“第一个拥有全分片和POS的产品级区块链”即将诞生,是实力站上C位。2019年6月底,Harmony将发布DayOne主网.
1900/1/1 0:00:006月1日,XRPForensics发现了201,000瑞波币被盗并立即开展了调查。事实证明,被抢劫的账户是由Gatehub.com管理的,违规账户从其他几个瑞波币账户偷走了大量资金,而这几个账户.
1900/1/1 0:00:00路线图及事件项目目标UltraEcosystem是基于区块链的游戏平台,任何人都可以在UltraEcosystem上建立和运营自己的游戏分销平台或虚拟商品交换服务.
1900/1/1 0:00:00交易所作为加密货币领域的基础设施,自诞生以来便是兵家必争之地。得交易所者,上可控项目方,下可御媒体,左右可攻钱包、矿池……有人云:得交易所者,得币圈天下!自2017年九四事件后,币安、火币、OK.
1900/1/1 0:00:00根据芝加哥商品交易所集团(CMEGroup)的数据,该公司的比特币期货产品在交易量和未平仓头寸方面都打破了另一项历史纪录.
1900/1/1 0:00:00