木星链 木星链
Ctrl+D收藏木星链

区块链:深度:如何用机器学习来预测主流币的币价?

作者:

时间:1900/1/1 0:00:00

机器学习技术在币种分析中的应用

谈到机器学习,大家可能会对这个AI方面的概念比较陌生,但如果提到谷歌AlphaGo,大家肯定就很熟悉了。当年谷歌人工智能程序通过机器学习的方式掌握围棋比赛技巧后,轻松击败了多个国家的围棋冠军,时隔3年世界冠军韩国李世石宣布退役时,还高呼AI不可战胜......通过机器学习训练后的计算机程序,在某些类似比赛和交易这样的博弈场景中,是比人类具有更高胜率的。

非小号研究本次就做了一个硬核的试验:将机器学习技术应用在币种分析中,看看会有什么好玩的结论,以及是否真的能够帮助我们判断、交易。

我们的具体课题是,通过现有的市场公开数据预测明日收益率为正还是为负。

这是一个二分类问题,我们可以使用的模型有很多,这里我们选用了以下模型用于实验:逻辑回归LR、线性判别分析LDA、二次判别分析QDA、支持向量机SVC、决策树DT、随机森林RF、渐变提升树GBC等。

本次用来试验的数据主要有三个方面:

OKX与SignalPlus达成深度合作:5月11日消息,据OKX官方公告,OKX与 SignalPlus正式达成深度合作,SignalPlus将为OKX全球用户提供高级期权交易工具,并带来更优期权交易体验。SignalPlus 是一家期权交易技术服务商,旨在为用户免费提供高级加密资产期权交易工具。

OKX 首席商务官 Lennix表示,很高兴通过与SignalPlus合作将世界级的交易分析工具带给全球用户。加密期权交易市场在不断发展,OKX希望通过扩展期权交易工具和产品套件为全球用户提供更优交易体验。[2023/5/11 14:57:49]

1、资产的历史数据;

2、相关品种,如黄金原油美国三大股指等;

3、币圈相关币种数据,主要是主流币。

完整的机器学习建立流程

1.首先,特征工程

特征工程是机器学习中最关键的步骤,没有之一。

这有别于大众认知的AI能解决一切问题,人工智能是万能的认知。真实的情况是数据科学家们常挂在嘴边的一句话是“输入的是垃圾,输出的也一定是垃圾”,这意味着特征工程做得好不好会直接影响AI的“智商”。

发改委等九部门:推动可再生能源与区块链等新兴技术深度融合:6月1日消息,国家发改委等九部门印发《“十四五”可再生能源发展规划》。其中提出,培育可再生能源发展新模式新业态。推动可再生能源智慧化发展。推动可再生能源与人工智能、物联网、区块链等新兴技术深度融合,发展智能化、联网化、共享化的可再生能源生产和消费新模式。推广新能源云平台应用,汇聚能源全产业链信息,推动能源领域数字经济发展。

推动可再生能源与电动汽车融合发展。利用大数据和智能控制等新技术,将波动性可再生能源与电动汽车充放电互动匹配,实现车电互联。采用现代信息技术与智能管理技术,整合分散的电动汽车充电设施,通过电力市场交易等促进可再生能源与电动汽车互动发展。(国家发改委)[2022/6/1 3:55:18]

特征工程不止是数据需要清洗重新组合,还需要将数据进行标准化处理。

2.其次,建模

建模是一个简单的过程,模型在那里,无非是灌入数据后不断地调参优化。国内很多大互联网公司的AI团队也都是在常用模型中选择靴子不断优化,大家的过程都是一样的,没有什么捷径。

火币大学校长于佳宁:DC/EP将促进信息流与资金流的深度融合:8月21日12:00,火币大学校长于佳宁受邀做客第一财经广播《财经午间道》栏目,就“厘清我国数字货币的发展前景”的主题参与讨论。

于佳宁表示,法定数字货币是很重要的“新基建”,在5G时代,无人驾驶汽车、物联网设备、工业互联网将得到广泛应用,物与物之间的交易需求将不断增加,未来世界的一切事物在都会有相应的数字身份。DC/EP的推出,将促进信息流与资金流的深度融合,最终实现实物流、信息流、资金流的\"三流合一\",让金融科技真正赋能实体经济发展,全面推进数字中国、数字社会。[2020/8/21]

3.评价模型效果

模型的效果评估有很多,常见的有MSE,MAE,取代矩阵,ROC等。

4.最终,应用

当模型对数据的可解释度良好时,模型可用。一般这个可解释度要达到80%以上,90%以上更好,但如果100%可解释就需要注意是否出错了。

ChainUP与区块链新媒体金星财经达成深度战略合作:近日,ChainUP与区块链新媒体金星财经达成深度战略合作。金星财经是全球社区化媒体平台,聚集了众多优质社区资源与用户,将从运营模式到内容输出进行创新。

本次金星财经使用的是ChainUP云媒体系统(ChainUP旗下媒体SaaS技术服务品牌),为金星财经提供媒体平台资讯、快讯、行情、圈子等核心技术服务,同时融合交易所、钱包、矿池等业务形态,助力金星财经打造完整的区块链媒体生态。

区块链技术服务商ChainUP拥有多家子公司及独立品牌,旗下包含钱包技术服务品牌HiCoin、交易所流动性服务商BitWind、区块链金融衍生品交易平台EXUP以及支持区块链创新技术发展基金ChainUP Capital。 ChainUP在全球化进程中除新加坡总部之外已建立日本、香港分公司,为更多优质企业提供区块链技术服务与支持。[2020/4/10]

对BTC的解释性

数据一

仅有高开低收量,及高开低收量计算的技术指标作为训练数据。得到各个模型解释度如下表所示:

声音 | 经济日报:推进区块链健康稳步发展,必须引导区块链技术与实际应用场景深度融合:\u202811月8日,经济日报刊文“区块链:脚踏实地走向光明未来”。文章表示,当前,区块链的关注热度起来了,但区块链行业的发展还需要静下心来,踏踏实实进行技术探索,才能实现区块链技术和产业创新发展,实现区块链在数字经济时代应有的价值,占据以区块链为代表的新时代互联网科技制高点。推进区块链健康稳步发展,必须继续严厉打击投机行为,必须引导区块链技术与实际应用场景深度融合。[2019/11/8]

由上表可以得到,单纯的用高开低收量和技术指标作为特征,在以上机器学习模型中训练,无法很好地解释价格。其实仅从这里就能看出币圈属于弱势有效市场。技术分析得到的尺度是判断二分类正确概率是50%,即模型无效,也与弱势有效市场中技术分析无效,基本面分析和内幕信息有效相吻合。

市场包含三种信息:历史信息,公开信息和内幕信息。

各种信息分别对应不同分析交易策略:历史信息对应技术分析;公开信息对应的基本分析;内幕信息对应的内幕交易。

当市场有效时,市场已反映三种信息,故对三种信息的分析均值不能在市场获得优势,某种分析和交易策略均值无效;当市场为半强势有效时,市场已反映公开信息和历史信息,故技术分析和基本分析无效,内幕交易有效;当市场为弱有效市场时,市场只反映历史信息,故技术分析无效,基本分析和内幕交易有效。

数据二

不但有高开低收量数据,我们还增加了相关品种的数据,如美国三大股指,黄金,原油,币圈主流币种等作为训练数据。

为什么认为美国三大股指,黄金,原油,币圈其他主流币种等数据可以插入基本面数据?

虽然这些因素不是直接影响BTC的基本面因素,但是它们和BTC由相同的基本面因素影响,所以这些数据中包含很少的一部分基本面信息。

由上表可以得知:在增加基本面替代特征后,解释度提升了10%以上。

那么提高多少可解释度是模型极限?

经过1000次的实验得到,当随机因子为1730时,随机森林RF模型的可解释度67%,这是所有实验中所有模型中可解释度最高的一组。

模型效果的衡量:

混淆矩阵

混淆矩阵就是分别统计分类模型归错类,归对类的观测值个数,然后把结果放在一个表里展示出来。这个表就是混淆矩阵,把预测情况与实际情况的所有结果两两混合,结果就会出现以下几种情况,就组成了混淆矩阵。如下:

ROC曲线

ROC曲线,又称接受者操作特征曲线。该曲线最早应用于雷达信号检测领域,用于区分信号与噪声。后来用于评价模型的预测能力,ROC曲线是基于混淆矩阵得出的。

ROC曲线中的主要两个指标就是真正率和假正率,其中横坐标为假正率,纵坐标为真正率,下面就是一个标准的ROC曲线图。

横轴FPR:1-TNR,1-Specificity,FPR越大,预测正类中实际负类越多。

纵轴TPR:Sensitivity(正类覆盖率),TPR越大,预测正类中实际正类越多。

为什么解释性不强?

1.交易量数据造假

2.未有数据披露制度约束,未形成一体的基本面数据

3.市场有可能存在内幕信息

目前我们模型中的数据还不够全面,仍然需要更多的努力揭示更多的基本面信息,才能更好地解释BTC价格。

在披露更多信息时,才能促进市场效率的提高,促进币圈的发展,这也是“非小号”作为机构应该做且做好的事情。

是否有使用价值?

虽然机器学习在解决传统问题时都要求正确率达到80%甚至90%以上才可以使用,但是我们能否使用一个解释度在60%-70%之间的模型?

-1.模型是有解释度的,60%也远高于50%,长期预测胜率显著高于50%的多空各一半的平均水平,这有点类似庄家在轮盘中有概率优势一样,时间越久赢面越大;

-2.加入限制条件时可以提高概率,单次若想取得概率优势只能限制使用条件

如下所示为决策树输出的树形图,用红色框起来的枝杈正确率很高,但是只有满足层层条件后才会有交易机会。为了达到盈利目的,交易者要在交易机会与单次交易盈利水平中找到平衡点。

单个树杈局部图如下所示,当满足红框圈住的条件时,正确率提高到93%,这完全达到了使用要求:

对ETH和TRX的解释性

从模型训练结果看,已知特征使用以上模型训练时,可解释度也在60%-70%之间。下面我们列举一些有价值的树杈,树杈概率的提高是基于条件概率提升的。

ETH

由以下ETH树形图可以看出,当同时满足条件

美元比eth收盘价<0.01,eth昨日成交量<3956783616,原油成交量>117392.5,涨跌幅>0,黄金开盘价<1489.25时,时,有93%的正确率,这时交易机会是总交易机会的19.05%(28/147)。

TRX

由以下TRX树形图可以看出,当同时满足条件bch<289.51,bsv>63.5,美元比eth调整后收盘价>0.01,纳指收盘价<8371.12,道指最低价>24290.5,美元比eth收盘价>0.01,瑞波币收盘价<0.32时,有82%的正确率,这时交易机会是总交易机会的23.68(36/152)。

如果以上使用机器学习来分析不同币种交易机会的流程没看懂,也没有关系,涉及到的知识比较复杂。所以,非小号后期将应用很多大数据或AI等技术帮助大家建立分析模型,直接在APP中为大家提供易懂和好用的币价预测工具或投资策略参考,一键体验。

标签:区块链AINUChainINU区块链可以看着是什么SIMBAINU币makeupchainAINU币

以太坊价格热门资讯
TAI:TAI (TAI)

基本信息:英文全称:tBridge英文简称:TAI项目简介:tBridge.io是TronFi生态系统中最重要的部分之一,它是一个跨链资产交换解决方案.

1900/1/1 0:00:00
以太坊:以太坊交易费市场改革:EIP 1559 会引发公平性问题吗

本文的前四节介绍了EIP1559迄今为止的进展情况。文中包含了一些重要文章的链接,可以作为参考。如果你已经熟悉了EIP1559的背景,可以直接跳至第五节开始阅读.

1900/1/1 0:00:00
比特币:比特币在失守11000美金下杀 是否有暴跌后的拉升

没有人会给你一切。你要达到目的,就必须得付出,抓得住机会,泪血汗这三样东西说明不了什么。在合适的年纪对自己负责,对家人负责,在青春的年纪里不要自己,只要方向对了一次就够,真正的成功就是从恐怖开.

1900/1/1 0:00:00
USD:9.3号玩家行情:超跌反弹何时到来?

文章系金色财经专栏作者币圈北冥供稿,发表言论仅代表其个人观点,仅供学习交流!金色盘面不会主动提供任何交易指导,亦不会收取任何费用指导交易,请读者仔细甄别,谨防上当.

1900/1/1 0:00:00
虎符将于9月5日22:00正式上线AGS(Aegis)

尊敬的虎符用户:虎符将于2020年9月5日22:00(UTC8)重磅上线AGS/USDT和AGS/ETH交易对.

1900/1/1 0:00:00
比特币:币多君:为何在币圈盈利这么难? 不妨看看这篇文章

币圈就是一个世界而财富自由就是这个世界的神我们就像是一个信徒渴望有一天能够接触到我们的神成为神一样的人然而亿万信徒能够被选中的却只有那区区一人所以每天不停朝拜虔诚的修行而修行本身就是一个极具考验.

1900/1/1 0:00:00