木星链 木星链
Ctrl+D收藏木星链
首页 > DOT > 正文

WEB:方法论、工具与团队:如何成为一名Web3数据分析师?

作者:

时间:1900/1/1 0:00:00

本文假设你是一个刚接触web3的数据分析师,开始组建你的web3分析团队,或者刚刚对web3数据产生兴趣。无论采用哪种方式,你都应该已经大致熟悉了APIs、数据库、转换和模型在web2中的工作方式。

在这本新指南中,我将尽量简明扼要地阐述我的三个观点:

思考:为什么开放的数据渠道会改变数据发挥效用的方式

工具:web3数据栈中的工具概述,以及如何利用它们

团队:web3数据团队的基本考虑和技能

数据思考

让我们先总结一下如何在web2中构建、查询和访问数据。我们有四个步骤来简化数据渠道:

触发API事件

更新到数据库

特定产品/分析用例的数据转换

模型训练和部署

当数据是开源的时候,唯一需要的步骤是在转换完成之后。Kaggle和hugsFace等社区使用一些公开的数据子集来帮助企业构建更好的模型。有一些特定领域的情况,比如在前面的三个步骤中开放数据的开放街道地图,但是它们仍然有写权限的限制。

我想声明的是,我只是在这里谈论数据,我并不是说web2完全没有开源。像大多数其他的工程角色一样,web2数据有大量的开源工具来构建他们的管道。我们仍然在web3中使用所有这些工具。总之,他们的工具是开放的,但他们的数据是封闭的。

美国地方法院驳回Yuga Labs创作者的反对动议:金色财经报道,根据周五的一份文件,NFT开发商Yuga Labs和一位艺术家及其NFT商业伙伴之间正在进行的法律纠纷仍在继续,因为美国联邦法院驳回了Bored Ape Yacht Club创作者的反对动议。

Yuga Labs于6月首次对加州艺术家Ryder Ripps和NFT市场Not Larva Labs的创始人Jeremy Cahen提起诉讼,指控他们抄袭和销售NFT系列,贬低原始Bored Ape产品。

被告Ripps和Cahen在10月提出了驳回Yuga Labs的反对意见的动议,同时提出了反公众参与战略诉讼(SLAPP)动议。目前,中加州地区法院已经驳回了这些动议。[2022/12/18 21:51:13]

Web3也将数据开源,这意味着不再只有数据科学家在开放环境下工作,分析工程师和数据工程师也在开放环境下工作!每个人都参与到一个更连续的工作流程中,而不是一个几乎是黑盒的数据循环。

工作的形式已经从web2数据大坝到web3数据河流、三角洲和海洋。同样重要的是需要注意,生态系统中的所有产品都会同时受到这个循环的影响。

中国互联网协会发布《金融场景隐私保护计算平台 技术要求与测试方法》等三项团体标准:8月8日消息,按照《中国互联网协会团体标准管理办法》的规定,《金融场景隐私保护计算平台 技术要求与测试方法》《基于区块链的机构电子签约系统要求》《移动互联网应用程序SDK安全技术要求及测试方法》三项团体标准已起草完成并审查通过,并于近日发布。标准编号如下:T/ISC 0015-2022 《金融场景隐私保护计算平台 技术要求与测试方法》、T/ISC 0016-2022 《基于区块链的机构电子签约系统要求》、

T/ISC 0017-2022 《移动互联网应用程序SDK安全技术要求及测试方法》。(中国互联网协会)[2022/8/8 12:09:45]

让我们看一个web3分析师如何一起工作的例子。有几十家交易所使用不同的交易机制和费用,允许你将代币A交换为代币B。如果这些是典型的交易所,如纳斯达克,每个交易所将报告自己的数据在10k或一些API,然后其他一些服务,比如capIQ,会把所有交换数据放在一起,然后收取费用,让你访问他们的API。也许有时候,他们会举办一次创新竞赛,这样他们就可以在未来收取额外的数据/图表功能。

在web3交易所中,我们有这样的数据流:

dex.trades是Dune上的一个表格,所有的DEX交换数据都被聚合在一起,所以你可以很容易地在所有交易所中搜索单个代币的交易量。

支付宝“保护隐私的多方数据处理的方法、装置和系统”等多项隐私保护专利被授权:10月12日消息,据天眼查数据显示,近日支付宝有多项隐私保护相关专利获得授权。其中3项隐私保护相关专利于10月1日获得授权,分别为“保护隐私的多方数据处理的方法、装置和系统”,授权公告号为CN112613076B,“基于隐私保护的多重线性检测方法、装置及系统”,授权公告号为CN112597540B,“保护用户隐私的用户分类系统的构建方法及装置”,授权公告号为CN111400754B。

经查询,在今年9月,支付宝还有包括“基于区块链的隐私保护方法、装置及电子设备”、“隐私保护算法的验证方法、装置及电子设备”、“保护多方数据隐私的联合建模方法及装置”三项专利获得授权。此前据全球最权威知识产权第三方机构IPRdaily发布的《2020年全球新兴隐私技术发明专利排行榜》显示,蚂蚁集团全球隐私技术专利数累计740件位列第一。[2021/10/12 20:22:59]

一名数据分析师通过社区开源查询创建了一个仪表盘,所以现在我们对整个DEX行业有了一个公开的概述。即使所有的查询看起来都是由一个人写的,你可以猜测这是在discord上经过大量的争论,才准确地将其拼凑在一起得。

DAO科学家查看仪表板,并开始在他们自己的查询中分割数据,查看特定的对,比如稳定币。他们会观察用户行为和商业模式,然后开始建立假设。由于科学家可以看到哪个DEX在交易量中占据了更大的份额,他们将提出一个新的模型,并提议改变治理参数,以便在链上进行投票和执行。

纽约地方法院驳回一项针对Bancor未注册发行证券的诉讼:2月24日消息,纽约地方法院法官已驳回一项针对去中心化交易协议Bancor?(BNT)的诉讼。该诉讼由William Zhang提起,其指控Bancor在未注册发行了价值1.53亿美元的证券,并称Bancor做出了许多虚假陈述导致投资者认为BNT不是证券。对此,法官判决称,无论Bancor目前的营业地点是在什么地方,纽约都不是进行此诉讼的合理地点。(AMB Crypto)[2021/2/24 17:48:47]

之后,我们可以随时查看公众查询/仪表板,看看提案如何创造出更具竞争力的产品。

在未来,如果另一个DEX出现,这个过程将重复。有人将创建插入查询来更新这个表。这将反过来反映在所有的仪表板和模型。任何其他分析师/科学家都可以以别人已经完成的工作为基础。

由于共享的生态系统,讨论、协作和学习在一个更紧密的反馈循环中发生。我承认这有时会让人难以承受,我认识的分析师基本上都在轮换数据耗尽。然而,只要我们中的一个人继续推动数据向前,那么其他人都会受益。

它并不总是必须是复杂的抽象视图,有时它只是实用功能,如使它容易搜索ENS反向解析器或工具的改进,如自动生成大多数graphQL映射与一个CLI命令!所有这些都可以被每个人重用,并且可以在某些产品前端或您自己的个人交易模型中进行API的使用。

声音 | 光明日报:充分运用区块链等新技术 创新党建工作载体和方式方法:《光明日报》今天发表题为“将党的优势转化为城市精细化治理优势”的评论文章。文中提到,要运用网络信息技术手段,提升智慧党建引领社会治理水平。充分运用大数据、区块链、人工智能等新技术,创新党建工作载体和方式方法,构建全天候、全覆盖、立体化的智慧党建工作体系。统筹推进智慧党建和智慧城市建设,设立大数据中心归集分散于各部门的基础信息和数字资源,共建共享技术支撑平台、大数据应用平台。[2019/10/23]

虽然这里开启的可能性是惊人的,我确实承认,轮子还没有平稳地运行。与数据工程相比,数据分析师/科学领域的生态系统仍然很不成熟。我认为有以下几个原因:

数据工程是web3多年来的核心焦点,从客户端RPCAPI的改进到基本的SQL/graphQL聚合。像theGraph和Dune这样的产品就是他们在这方面所付出努力的例证。

对于分析师来说,要理解web3独特的跨协议关系表是非常困难的。例如,分析人员可以理解如何只分析Uniswap,但却很难在混合中添加聚合器、其他DEXs和不同的代币类型。最重要的是,实现这一切的工具直到去年才真正出现。数据科学家通常习惯于收集原始数据并独自完成所有的工作。我认为他们不习惯在开发初期与分析师和工程师进行如此密切和公开的合作。对我个人来说,这花了一段时间。

除了学习如何协同工作之外,web3数据社区还在学习如何跨这个新的数据堆栈工作。你不再需要控制基础设施,或者慢慢地从excel构建到数据池或数据仓库,只要你的产品上线,你的数据就会到处上线。你的团队基本上是被扔到了数据基础设施的最深处。

数据工具

以下是一些数据工具汇总:

下面我们看看每种类型以及用法:

交互+数据源:这主要用于前端、钱包和较低层次的数据摄取。1

客户端:虽然以太坊的底层实现是相同的,但每个客户端都有不同的额外特性。例如,Erigon对数据存储/同步进行了大量优化,Quorum支持隐私链。

节点即服务:你不必选择运行哪个客户端,但使用这些服务将为你节省维护节点和API正常运行的麻烦。节点的复杂性取决于你想要捕获多少数据。

查询+数据映射:这一层中的数据要么作为URI在合约中引用,要么来自使用合约ABI将交易数据从字节映射到表模式。合约ABI告诉我们合约中包含哪些函数和事件,否则,我们只能看到部署的字节码。

交易数据:这些是最常用的,主要用于仪表板和报告。theGraph和FlipsideAPI也在前端中使用。有些表是合约的1:1映射,有些表允许模式中额外的转换。

元数据“协议”:这些并不是真正的数据产品,而是用于存储DIDs或文件存储的。大多数NFT将使用其中的一个或多个数据源,我认为今年我们将开始越来越多地使用这些数据源来增强我们的查询。

专业提供商:其中一些是非常健壮的数据流产品,Blocknative用于mempool数据,Parsec用于链上交易数据。其他的聚合链上和链外数据,比如DAO治理或国库数据。

高维度数据提供商:你不能查询/转换他们的数据,但是他们已经帮你完成了所有繁重的工作。

如果没有强大的、杰出的社区来配合这些工具,web3就不会出现!我们可以看到每种类型对应的杰出社区:

Flashbots:专注于MEV上,提供从保护交易的自定义RPC到专业白帽服务的所有事宜。MEV主要指的是跑问题,当有人支付比你更多的Gas,这样他们就可以抢先执行他们的交易。

Dune数据精英:专注于为Dune的数据生态做贡献的数据分析精英。

Flipside数据精英:专注于为Web3数据升天做贡献的数据分析精英。

MetricsDAO:跨生态工作,处理多个链上的各种数据奖励。

DiamondDAO:专注于Stellar的数据科学工作,主要在治理、财政库以及代币管理方面。

IndexCoop:专注于代币等特定领域的分析,以制定加密货币行业最好的指数。

OurNetwork:每周对各类协议以及?Web3的数据覆盖。

注:以上DAO的参与联系方式详看原文。

每个社区都做了大量的工作来改善web3的生态系统。毫无疑问,拥有社区的产品将以100倍的速度增长。这仍然是一个被严重低估的竞争优势,我认为除非人们在这些社区中建立了一些东西,否则他们不会获得这个优势。

数据团队

不用说,你也应该在这些社区中寻找可以加入你的团队的人。让我们进一步分析重要的web3数据技能和经验,这样你就能真正知道你在搜索什么。如果你想被雇佣,把这看作是你追求的技能和经验!

至少,分析师应该是Etherscan侦探,知道如何阅读Dune仪表盘。这可能需要1个月的时间来适应悠闲的学习,如果你真的要疯狂学习,则需要2周的时间。

除此之外,你还需要考虑更多的内容,特别是时间分配和技能转移。

时间方面:在web3中,数据分析师大约有30-40%的时间将花在与生态系统中的其他分析师和协议保持同步上。请确保你不会气晕他们,否则,这将成为对每个人的长期损害。与更大的数据社区一起学习、贡献和构建是必要的。

可转移性方面:在这个领域,技能和领域都是高度可转移的。如果使用不同的协议,可能会减少上手时间,因为链上数据的表模式都是一样的。

记住,知道如何使用这些工具并不重要,每个分析师或多或少都应该会写SQL或创建数据仪表盘。这一切都是关于如何做出贡献并与社区合作。如果你正在面试的人不是任何web3数据社区的一员,你可能要问问自己这是否是一个危险信号。

原文链接:

https://ath.mirror.xyz/w2cxg5OP1OEcqvSgsEjSSyKRJhPmam0w-fXGogiG-8g

作者?|?AndrewHong

译者:GaryMa吴说区块链

标签:WEBWEB3APIDEXMETAWEB3PA价格web3.0币现价多少钱apix币怎么样dHEDGE Top Index

DOT热门资讯
元宇宙:2022年的元宇宙 你该知晓些什么?

在前文聊到“数字砖”的投资潜力时,有朋友曾留言评价元宇宙是虚幻的海市蜃楼或者郁金香泡沫,在投机的冲动和狂热过后回到现实可能如水中花镜中月般变得荡然无存.

1900/1/1 0:00:00
比特币:金色前哨 | 美国司法部查获2016年Bitfinex黑客事件中被盗的36亿美元比特币

美国司法部周二早上发布公告称,查获了价值超过36亿美元的据称与2016年Bitfinex黑客攻击有关的被盗比特币.

1900/1/1 0:00:00
SOLA:我们能从 Solana 虫洞黑客事件中学到什么?

2022年2月2日,将Solana区块链连接到以太坊的Solana虫洞桥被黑客入侵,窃取了超过3亿美元的ETH。一周后,这起事件似乎画上了句号.

1900/1/1 0:00:00
数字人:应用场景不断扩围 数字人民币“虎视”冬奥

虎年将至,北京冬奥会也将接踵而来。近期,数字人民币试点应用场景不断扩围,上线还不到一个月的数字人民币APP在多家主流手机品牌应用市场的下载量持续攀升.

1900/1/1 0:00:00
元宇宙:“元宇宙”来了 在虚拟世界里过春节是什么体验?

穿着节日的盛装,与家人一起贴年画,同看绚丽烟花,一起吃团圆饭,走亲访友相互拜年,邀约几个好友看家乡美景、游玩......这是所有中国人回家过年的日常.

1900/1/1 0:00:00
元宇宙:元宇宙“数字砖”市场迅速增长:2022投资或翻番

据参考消息报道,西班牙《经济学家报》网站称元宇宙中的房地产销售额已超过5亿美元,并且这个“房地产”新领域在2022年的营业额可能飙升至10亿美元.

1900/1/1 0:00:00