比特币市场的行为如何?加密货币价值突然出现高峰和低谷的原因是什么?不同altcoins的市场是不可分割的或基本独立的?我们如何预测接下来会发生什么?
有关加密货币的文章,比如比特币和以太坊,近来充斥着猜测,有数百名自称专家的人提倡他们期望出现的趋势。许多这些分析所缺乏的是用于备份索赔的数据和统计数据的坚实基础。
本文的目标是提供一个简单介绍使用Python的加密货币分析。我们将通过一个简单的Python脚本来检索,分析和可视化不同加密货币上的数据。在这个过程中,我们将揭示这些波动的市场表现如何以及它们如何演变的有趣趋势。
这不是一个解释加密货币是什么的文章,也不是一个关于哪些特定货币会上涨,哪些会下跌的评论文章。相反,我们在本教程中关注的所有内容都是获取原始数据并揭示隐藏在数字中的故事。
第1步-设置您的数据实验室
本教程旨在为所有技能水平的爱好者,工程师和数据科学家提供便利。您将需要的唯一技能是对Python的基本了解以及足够的命令行知识来设置项目。
具有所有结果的笔记本完整版本可在此处找到。
步骤1.1-安装Anaconda
从头开始安装此项目的依赖关系的最简单方法是使用Anaconda,一个预先打包的Python数据科学生态系统和依赖项管理器。
要设置Anaconda,我会建议遵循官方安装说明-https://www.continuum.io/downloads。
如果您是高级用户,并且您不想使用Anaconda,那完全没问题。我假设你不需要帮助安装所需的依赖关系。随意跳到第2节。
步骤1.2-安装Anaconda项目环境
一旦安装了Anaconda,我们就需要创建一个新的环境来保持我们的依赖性。
运行
condacreate--namecryptocurrency-analysispython=3
为我们的项目创建一个新的Anaconda环境。
接下来,运行
sourceactivatecryptocurrency-analysis
或
activatecryptocurrency-analysis
来激活这个环境。
最后,运行
condainstallnumpypandasnb_condajupyterplotlyquandl
以在环境中安装所需的依赖关系。这可能需要几分钟才能完成。
为什么使用环境?如果您计划在您的计算机上开发多个Python项目,将相关性分开以避免冲突会很有帮助。Anaconda将为每个项目的依赖项创建一个特殊的环境目录,以保持组织和分离的一切。
步骤1.3-启动一个互动Jupyter笔记本
一旦环境和依赖关系完成设置,运行
jupyternotebook
以启动iPython内核,并打开浏览器
http://localhost:8888/
。创建一个新的Python笔记本,确保使用
Python
内核。
步骤1.4-导入笔记本顶部的依赖项
一旦你打开了一个空白的Jupyter笔记本,我们要做的第一件事就是导入所需的依赖关系。
鲍威尔:从现在开始将采取依赖数据的方法:金色财经报道,美联储主席鲍威尔表示,银行业情况总体上有所改善,我们强烈致力于将通胀率降回2%。从现在开始,我们将采取依赖数据的方法。[2023/5/4 14:41:05]
importosimportnumpyasnpimportpandasaspdimportpickleimportquandlfromdatetimeimportdatetime
importplotly.offlineaspyimportplotly.graph_objsasgoimportplotly.figure_factoryasffpy.init_notebook_mode(connected=True)
第2步-检索比特币定价数据
现在一切都已经完成,我们已经准备好开始检索数据进行分析。首先,我们需要使用Quandl的免费比特币API获取比特币定价数据。
步骤2.1-定义Quandl辅助函数
为了协助这个数据检索,我们将定义一个函数来从Quandl下载和缓存数据集。
defget_quandl_data(quandl_id):'''DownloadandcacheQuandldataseries'''cache_path='{}.pkl'.format(quandl_id).replace('/','-')try:f=open(cache_path,'rb')df=pickle.load(f)print('Loaded{}fromcache'.format(quandl_id))except(OSError,IOError)ase:print('Downloading{}fromQuandl'.format(quandl_id))df=quandl.get(quandl_id,returns="pandas")df.to_pickle(cache_path)print('Cached{}at{}'.format(quandl_id,cache_path))returndf
我们正在使用
pickle
序列化并将下载的数据保存为文件,这将阻止我们的脚本每次运行脚本时都重新下载相同的数据。该函数将以Pandas数据框的形式返回数据。如果您不熟悉数据框,则可以将它们视为超级供电的电子表格。
步骤2.2-拉Kraken交易所定价数据
首先我们来拉动Kraken比特币交易所的历史比特币汇率。
Billions项目组CharttheBTCpricingdatabtc_trace=go.Scatter(x=btc_usd_price_kraken.index,y=btc_usd_price_kraken)py.iplot()
在这里,我们使用Plotly来生成我们的可视化。这比一些比较成熟的Python数据可视化库更传统,但我认为Plotly是一个不错的选择,因为它使用D3.js生成完全交互的图表。这些图表具有吸引人的视觉默认值,易于探索,并且非常易于嵌入网页。
作为快速的完整性检查,您应该将生成的图表与公开可用的比特币价格图表进行比较,以验证下载的数据是否合法。
第2.3步-从更多BTC交易所获取定价数据
您可能已经注意到此数据集中存在一些问题-特别是在2014年末和2016年初,有一些明显的下降峰值。这些峰值特定于Kraken数据集,我们显然不希望它们反映在我们的整体定价分析。
数据:近期以太坊NFT交易量每周下降约35%:2月15日消息,风险投资机构Delphi Capital援引Crypto Slam数据分析,NFT热潮近期已呈现放缓趋势。具体而言,以太坊NFT总销售额近期每周降幅达35%,此外自上周以来,以太坊上的独立买家数量也下降了超过20%。[2022/2/15 9:53:16]
比特币交易所的性质在于定价取决于供求关系,因此没有单一交易所包含真正的比特币“主价”。为了解决这个问题,以及可能由于技术中断和数据集故障导致的下降峰值,我们将从另外三个主要比特币交易所获取数据,以计算总比特币价格指数。
首先,我们将从每个交易所下载数据到数据框字典中。
Billions项目组MergetheBTCpricedataseries'intoasingledataframebtc_usd_datasets=merge_dfs_on_column(list(exchange_data.values()),list(exchange_data.keys()),'WeightedPrice')
最后,我们可以使用该
tail()
方法预览最后五行结果,以确保它看起来不错。
btc_usd_datasets.tail()
BITSTAMP
COINBASE
ITBIT
日期
2017年8月14日
4210.1549434213.3321064207.3666964213.257519
2017年8月15日
4101.4471554131.6068974127.0368714149.146996
2017年8月16日
4193.4267134193.4695534190.1045204187.399662
2017年8月17日
4338.6946754334.1152104334.4494404346.508031
2017年8月18日
4182.1661744169.5559484175.4407684198.277722
价格看起来像预期的那样:它们的范围相似,但是根据每个个人比特币交易所的供求情况而略有变化。
步骤2.5-可视化定价数据集
下一个合乎逻辑的步骤是可视化这些定价数据集的比较方式。为此,我们将定义一个辅助函数来提供单行命令以从数据框生成图形。
defdf_scatter(df,title,seperate_y_axis=False,y_axis_label='',scale='linear',initial_hide=False):'''Generateascatterplotoftheentiredataframe'''label_arr=list(df)series_arr=list(map(lambdacol:df,label_arr))layout=go.Layout(title=title,legend=dict(orientation="h"),xaxis=dict(type='date'),yaxis=dict(title=y_axis_label,showticklabels=notseperate_y_axis,type=scale))y_axis_config=dict(overlaying='y',showticklabels=False,type=scale)visibility='visible'ifinitial_hide:visibility='legendonly'Billions项目组Addseperateaxisfortheseriesifseperate_y_axis:trace='y{}'.format(index+1)layout=y_axis_configtrace_arr.append(trace)fig=go.Figure(data=trace_arr,layout=layout)py.iplot(fig)
数据:7月份加密交易所平均网站流量环比减少15%:据ICO Analytics综合SimilarWeb数据对比,7月份加密货币交易所的平均网站流量环比减少15%。其中,中心化交易所Binance、Coinbase的网站流量稳居前二,访问量分别达1.3亿和5300万,环比分别减少11%和25%。去中心化交易所PancakeSwap升至第三,访问量达1600万,环比减少11%。网站流量位列前20的交易平台中,仅有三家环比6月份有所增长,其中,衍生品交易所Bybit、FTX访问量环比大幅增加,分别为22%和66%。[2021/8/12 1:50:57]
为了简洁起见,我不会过多介绍这种帮助功能的工作原理。如果您想了解更多信息,请查阅Pandas和Plotly的文档。
现在我们可以轻松生成比特币定价数据的图表。
Billions项目组Remove"0"valuesbtc_usd_datasets.replace(0,np.nan,inplace=True)
当我们重新绘制数据框时,我们会看到一个更清晰的图表,没有降低峰值。
Billions项目组CalculatetheaverageBTCpriceasanewcolumnbtc_usd_datasets=btc_usd_datasets.mean(axis=1)
这个新的专栏是我们的比特币定价指数!让我们绘制该列以确保它看起来不错。
Billions项目组getdatafromthestartof2015end_date=datetime.now()Billions项目组pulldailydata(86,400secondsperday)defget_crypto_data(poloniex_pair):'''Retrievecryptocurrencydatafrompoloniex'''json_url=base_polo_url.format(poloniex_pair,start_date.timestamp(),end_date.timestamp(),pediod)data_df=get_json_data(json_url,poloniex_pair)data_df=data_df.set_index('date')returndata_df
该函数将采用加密货币对字符串并返回包含两种货币历史汇率的数据帧。
步骤3.2-从Poloniex下载交易数据
大多数altcoins不能用USD直接购买;为了获得这些硬币,个人经常购买比特币,然后在加密货币交易所交易比特币用于替代币。出于这个原因,我们会将每个硬币的汇率下载到BTC,然后我们将使用我们现有的BTC定价数据将此值转换为美元。
我们将下载9个顶级加密货币的交换数据-以太坊,莱特币,Ripple,EthereumClassic,Stellar,Dash,Siacoin,Monero和NEM。
altcoins=altcoin_data={}foraltcoininaltcoins:coinpair='BTC_{}'.format(altcoin)crypto_price_df=get_crypto_data(coinpair)altcoin_data=crypto_price_df
现在我们有一个包含9个数据框的字典,每个字典都包含阿尔特币和比特币之间的历史日均交易价格。
我们可以预览以太坊价格表的最后几行,以确保它看起来不错。
altcoin_data.tail()
数据:加密巨鲸自5月以来在投资组合中增加了32.1亿美元的BTC:金色财经报道,加密分析公司Santiment表示,自5月加密市场崩盘以来,某些BTC投资者的人口一直在增长。比特币周四可能已跌至$31,000,但持有100至10,000个地址的BTC'百万富翁'不断攀升。自5月21日以来,这些鲸鱼的累计持有量增加了100,000BTC。在撰写本文时,百万富翁群体持有的100,000BTC价值超过32.1亿美元。此外,这家加密洞察公司还透露,Twitter上的加密交易员和投资者继续看跌领先的加密资产。根据Santiment的说法,负面情绪可能是BTC准备反弹的信号。[2021/7/19 1:01:34]
关
高
低
打开
quoteVolume
卷
加权平均
日期
2017-08-1812:00:00
0.0705100.0710000.0701700.07088717364.2715291224.7626840.070533
2017-08-1816:00:00
0.0715950.0720960.0700040.07051026644.0181231893.1361540.071053
2017-08-1820:00:00
0.0713210.0729060.0704820.07160039655.1278252841.5490650.071657
2017-08-1900:00:00
0.0714470.0718550.0708680.07132116116.9228691150.3614190.071376
2017-08-1904:00:00
0.0723230.0725500.0712920.07144714425.5718941039.5960300.072066
步骤3.3-将价格转换为美元
现在我们可以将BTC-altcoin汇率数据与我们的比特币定价指数结合起来,直接计算每种阿尔特币的历史美元价值。
Billions项目组MergeUSDpriceofeachaltcoinintosingledataframecombined_df=merge_dfs_on_column(list(altcoin_data.values()),list(altcoin_data.keys()),'price_usd')
简单。现在让我们将比特币价格作为组合数据框的最后一列。
Billions项目组Chartallofthealtocoinpricesdf_scatter(combined_df,'CryptocurrencyPrices(USD)',seperate_y_axis=False,y_axis
太好了!该图提供了关于过去几年中每种货币的汇率如何变化的非常稳固的“全景图”视图。
请注意,我们使用对数y轴比例来比较同一图表上的所有货币。欢迎您在此尝试不同的参数值以获得对数据的不同观点。
步骤3.4-执行相关性分析
您可能会注意到,加密货币汇率,尽管它们的价值和波动性大不相同,但看起来略有相关性。特别是自2017年4月上涨以来,甚至许多较小的波动似乎在整个市场中同步发生。
24小时BTC全网合约成交数据显示:空方大幅占优:据合约帝数据显示,最近24小时BTC全网合约成交量中开多比例为46.58%,开空比例为53.42%。主流合约交易所中,Huobi季度开多比例为47.79%,开空比例为52.21%;OKEx季度开多比例为48.14%,开空比例为51.86%;BitMEX合约开多比例为42.18%,开空比例为57.82%。[2020/3/9]
直到我们有数据支持它,一个直观的预感并不比猜测好得多。
我们可以使用Pandas
corr()
方法来测试我们的相关假设,该方法计算数据帧中每列与每个列的Pearson相关系数。
修订注意事项8/22/2017-本部分已经过修订,以便在计算相关系数时使用日收益率百分比而不是绝对价格值。
直接在非平稳时间序列上计算相关性可以给出有偏差的相关值。我们将通过首先应用该
pct_change()
方法来解决此问题,该方法会将数据框中的每个单元格从绝对价格值转换为每日回报百分比。
首先,我们将计算2016年的相关性。
#Calculatethepearsoncorrelationcoefficientsforcryptocurrenciesin2016combined_df_2016=combined_dfcombined_df_2016.pct_change().corr(method='pearson')
短跑
等等
ETH
LTC
SC
STR
XEM
XMR
XRP
BTC
短跑
1.0000000.0039920.122695-0.0121940.0266020.0580830.0145710.1215370.088657-0.014040
等等
0.0039921.000000-0.181991-0.131079-0.008066-0.102654-0.080938-0.105898-0.054095-0.170538
ETH
0.122695-0.1819911.000000-0.0646520.1696420.0350930.0432050.0872160.085630-0.006502
LTC
-0.012194-0.131079-0.0646521.0000000.0122530.1135230.1606670.1294750.0537120.750174
SC
0.026602-0.0080660.1696420.0122531.0000000.1432520.1061530.0479100.0210980.035116
STR
0.058083-0.1026540.0350930.1135230.1432521.0000000.2251320.0279980.3201160.079075
XEM
0.014571-0.0809380.0432050.1606670.1061530.2251321.0000000.0164380.1013260.227674
XMR
0.121537-0.1058980.0872160.1294750.0479100.0279980.0164381.0000000.0276490.127520
XRP
0.088657-0.0540950.0856300.0537120.0210980.3201160.1013260.0276491.0000000.044161
BTC
-0.014040-0.170538-0.0065020.7501740.0351160.0790750.2276740.1275200.0441611.000000
这些相关系数都在这个地方。接近于1或-1的系数意味着该系列分别强相关或反相关,接近于零的系数意味着这些值不相关,并且彼此独立地波动。
为了帮助可视化这些结果,我们将创建一个辅助可视化函数。
defcorrelation_heatmap(df,title,absolute_bounds=True):'''Plotacorrelationheatmapfortheentiredataframe'''heatmap=go.Heatmap(z=df.corr(method='pearson').as_matrix(),x=df.columns,y=df.columns,colorbar=dict(title='PearsonCoefficient'),)layout=go.Layout(title=title)ifabsolute_bounds:heatmap=1.0heatmap=-1.0fig=go.Figure(data=,layout=layout)py.iplot(fig)
correlation_heatmap(combined_df_2016.pct_change(),"CryptocurrencyCorrelationsin2016")
在这里,暗红色值表示强相关性,深蓝色值表示强烈的逆相关性。所有浅蓝色/橙色/灰色/棕褐色代表不同程度的弱/不存在的相关性。
这张图表告诉我们什么?基本上,它表明,2016年不同加密电子货币的价格波动之间几乎没有统计上显着的联系。
现在,为了验证我们最近几个月加密货币已经变得更加相关的假设,让我们仅使用2017年的数据重复相同的测试。
combined_df_2017=combined_dfcombined_df_2017.pct_change().corr(method='pearson')
短跑
等等
ETH
LTC
SC
STR
XEM
XMR
XRP
BTC
短跑
1.0000000.3841090.4804530.2596160.1918010.1593300.2999480.5038320.0664080.357970
等等
0.3841091.0000000.6021510.4209450.2553430.1460650.3034920.4653220.0539550.469618
ETH
0.4804530.6021511.0000000.2861210.3237160.2286480.3435300.6045720.1202270.421786
LTC
0.2596160.4209450.2861211.0000000.2962440.3331430.2505660.4392610.3213400.352713
SC
0.1918010.2553430.3237160.2962441.0000000.4171060.2879860.3747070.2483890.377045
STR
0.1593300.1460650.2286480.3331430.4171061.0000000.3965200.3418050.6215470.178706
XEM
0.2999480.3034920.3435300.2505660.2879860.3965201.0000000.3971300.2703900.366707
XMR
0.5038320.4653220.6045720.4392610.3747070.3418050.3971301.0000000.2136080.510163
XRP
0.0664080.0539550.1202270.3213400.2483890.6215470.2703900.2136081.0000000.170070
BTC
0.3579700.4696180.4217860.3527130.3770450.1787060.3667070.5101630.1700701.000000
这些是更重要的相关系数。强大到足以作为投资的唯一基础?当然不是。
然而,值得注意的是,几乎所有的加密货币已经变得更加相互关联。
correlation_heatmap(combined_df_2017.pct_change(),"CryptocurrencyCorrelationsin2017")
呵呵。这很有趣。
这是为什么发生?
好问题。我真的不确定。
想到最直接的解释是对冲基金最近开始在加密货币市场上公开交易。与平均交易者相比,这些基金的资本要多得多,所以如果一个基金在多个加密货币上对冲他们的投注,并且基于自变量对每个基金使用类似的交易策略,那么这可能是合理的这种相关性增加的趋势将会出现。
深入-XRP和STR
例如,上面图表的一个值得注意的特征是XRP是最不相关的加密货币。这里值得注意的例外是STR,它与XRP具有更强的相关性。
这里有趣的是,Stellar和Ripple都是非常类似的金融科技平台,旨在减少银行间国际资金转移的摩擦。
可以想象的是,由于使用每个令牌的区块链服务的相似性,一些大资金玩家和对冲基金可能使用类似的交易策略来投资Stellar和Ripple。这可以解释为什么XRP与STR相比与其他加密货币的关联性更强。
快速插件-我是Chipper的一名贡献者,Chipper是一家非常早期的初创公司,其使用Stellar的目的是破坏非洲的微型汇款。
到你了
然而,这种解释很大程度上是推测性的。也许你可以做得更好。有了我们在这里创建的基础,有数百种不同的途径可以继续搜索数据中的故事。
这里有一些想法:
将更多加密货币的数据添加到分析中。调整相关性分析的时间框架和粒度,以获得更精细或粗略的趋势视图。搜索交易量和/或区块链挖掘数据集的趋势。如果您想预测未来的价格波动,则买入/卖出交易量比率可能比原始价格数据更相关。添加有关股票,商品和法定货币的定价数据,以确定哪些与加密货币相关。使用事件注册表,GDELT和GoogleTrends来量化围绕特定加密货币的“嗡嗡声”量。训练数据的预测性机器学习模型以预测未来的价格。如果你更有野心,你甚至可以尝试用循环神经网络来做这件事。使用您的分析,在Poloniex或Coinbase等交易网站上使用各自的交易API创建自动化的“交易机器人”。小心:一个糟糕的交易机器人是一个简单的方法来快速损失你的钱。分享您的发现!比特币和一般加密货币的最佳部分是它们的分散性使它们比其他任何资产更自由和民主。开源你的分析,参与社区,也许写一篇关于它的博客文章。
Python版本的笔记本可以在这里找到。
希望现在你有能力进行自己的分析并批判性地思考你将来可能阅读的任何猜测性的加密货币文章,特别是那些没有任何数据的文章来备份所提供的预测。
感谢您的阅读,如果您对本教程有任何想法,建议或批评,请在下面评论。如果您发现代码存在问题,您也可以在此处的Github存储库中随意打开问题。
我已经在作品中获得了第二个部分,这些作品很可能会沿用上面列出的一些想法,因此请在未来几周内继续关注。
标签:比特币加密货币BTC比特币中国官网联系方式40亿比特币能提现吗比特币最新价格行情走势加密货币是什么意思啊加密货币市场还有未来吗知乎全球十大加密货币BTCs是不是黄了btc钱包官网btc
近日,360公司Vulcan团队发现了区块链平台EOS的一系列高危安全漏洞。经验证,其中部分漏洞可以在EOS节点上远程执行任意代码,即可以通过远程攻击,直接控制和接管EOS上运行的所有节点.
1900/1/1 0:00:00央广网北京5月3日消息据中国之声《新闻纵横》报道,比特币、ICO、区块链,这些名词就算没炒过数字货币人,从新闻中也会听过一二.
1900/1/1 0:00:00许多顶尖商人与经济学家质疑加密货币之于传统纸币是否具备存在必要性。例如比特币作为第一个去中心化的加密货币,最初是为应对2008/2009年金融危机而创造的,之后备受热捧.
1900/1/1 0:00:00区块链诞生自中本聪的比特币,自2009年以来,出现了各种各样的类比特币的数字货币,都是基于公有区块链的。有人说:“区块链是互联网发展的必然.
1900/1/1 0:00:00第一篇词法 一、名词 名词的概念在不同的语法教课书中有不同的解释和分类方法,但就实际应用来讲还是不要过分地追求其理论概念,而更多的要把注意力放在其应用上来.
1900/1/1 0:00:00『2017年度全球范围内已拦截的WannaCry攻击达54亿起,新型勒索软件变种增长46%。这一现象意味着黑客市场可能已围绕勒索软件产生相关交易,也意味着可能有更多的攻击事件.
1900/1/1 0:00:00