ARK:万神殿 Patheon：零知识证明开发框架评测平台

作者：

时间：1900/1/1 0:00:00

我们要感谢PolygonZero团队、Consensysgnark项目、PadoLabs和DelphinusLab团队对本篇文章的宝贵评论和反馈。

零知识证明开发框架评测平台

「万神殿Patheon」

过去几个月，我们投入了大量时间和精力，开发了利用zk-SNARK简洁证明构建的前沿基础设施。这个次世代创新平台使开发者能够构建前所未有的区块链应用新范例。

在开发工作中，我们测试并使用了多种零知识证明(ZKP)开发框架。虽然这段旅程收获颇丰，但我们也确实意识到，当新的开发者试图找到最适合其特定用例和性能要求的框架时，多种多样的ZKP框架通常会给他们带来挑战。考虑到这一痛点，我们认为需要一个能够提供全面性能测试结果的社区评估平台，这将极大地促进这些新应用的开发。

为了满足这一需求，我们推出了零知识证明开发框架评测平台「万神殿Patheon」这一公益社区倡议。倡议的第一步将鼓励社区分享各种ZKP框架的可复现性能测试结果。我们的最终目标是共同协作创建并维护一个广受认可的测试平台，评估低级电路开发框架、高级zkVM和编译器，甚至硬件加速提供商。我们希望这一举措能够让开发者们在选用框架时能有更多性能比较的参考，从而加快ZKP的推广。同时，我们希望通过提供一组普遍可参考的性能测试结果，促进ZKP框架本身的升级和迭代。我们将大力投入这项计划，并邀请所有志同道合的社区成员加入我们，共同为这项工作做出贡献！

第一步：使用SHA-256对电路框架进行性能测试

在这篇文章中，我们迈出了构建ZKPPatheon的第一步，在一系列低级电路开发框架中使用SHA-256提供一组可复现的性能测试结果。虽然我们承认其他性能测试粒度和原语或许也是可行的，但我们选择SHA-256是因为它适用于广泛的ZKP用例，包括区块链系统、数字签名、zkDID等。另外值得一提的是，我们在自己的系统中也使用了SHA-256，所以这对我们来说也很方便！?

数据：距离莱特币减半已不足30天:7月3日消息，据Litecoin Halving数据显示，距离莱特币（LTC）区块奖励减半时间还有29天20小时45分钟（17682个区块），预计为北京时间8月3日凌晨，届时区块奖励将从12.5 LTC降至6.25 LTC。[2023/7/3 22:14:36]

我们的性能测试评估了SHA-256在各种zk-SNARK和zk-STARK电路开发框架上的性能。通过比较，我们力求为开发者提供关于每个框架的效率和实用性的见解。我们的目标是，希望本次性能测试结果能够为开发者在选择最佳框架时提供参考，使之做出明智的决定。

证明系统

近年来，我们观察到零知识证明系统激增。跟上该领域所有激动人心的进步是具有挑战性的，我们根据成熟度和开发者采用情况精心挑选了以下证明系统作为测试对象。我们的目标是提供不同前端/后端组合的代表性样本。

Circom+snarkjs/rapidsnark:Circom是一种流行的DSL，用于编写电路和生成R1CS约束，而snarkjs能够为Circom生成Groth16或Plonk证明。Rapidsnark也是Circom的证明器，它生成Groth16证明，并且由于使用了ADX扩展，它通常比snarkjs快得多，并尽可能并行化证明生成。

gnark:gnark是来自Consensys的综合Golang框架，支持Groth16、Plonk和许多更高级的功能。

Arkworks:Arkworks是一个用于zk-SNARKs的综合Rust框架。

Halo2(KZG):Halo2是Zcash与Plonk的zk-SNARK实现。它配备了高度灵活的Plonkish算术，支持许多有用的原语，例如自定义网关和查找表。我们使用具有以太坊基金会和Scroll支持的KZG的Halo2分叉。

Twitter Inc. 已更名为 X Corp.，注册地在内华达州:4月19日消息，Twitter Inc.已经告知法院，更名为 X Corp.，该实体在内华达州注册成立，而非 Twitter 以前的注册地特拉华州。据上周提交的法庭文件显示，Twitter Inc.已经并入 X Corp.，自身不复存在。该公司的主要营业地仍是旧金山，即 Twitter 的总部所在地。该文件显示，X Corp.有一个名为 X Holdings Corp.的母公司，该公司也在特拉华州的文件中记录了这次合并。马斯克就此次更名表示，我的目标是打造万能应用程序 X，并重申 Twitter 是实现这一目标的加速器。（《华尔街日报》）[2023/4/19 14:12:52]

Plonky2:Plonky2是基于来自PolygonZero的PLONK和FRI技术的SNARK实现。Plonky2使用小的Goldilocks字段并支持高效的递归。在我们的性能测试中，我们以100位推测的安全性为目标，并使用为性能测试工作产生最佳证明时间的参数。具体来说，我们使用了28Merkle查询、8的放大系数和16位工作量证明挑战。此外，我们设置num_of_wires=60和num_routed_wires=60。

Starky:Starky是PolygonZero的高性能STARK框架。在我们的性能测试中，我们以100位推测的安全性为目标，并使用产生最佳证明时间的参数。具体来说，我们使用了90Merkle查询、2倍放大系数和10位工作量证明挑战。

下表总结了上述框架以及我们性能测试中使用的相关配置。这个列表绝不是详尽的，我们还将在未来研究许多最先进的框架/技术。

请注意，这些性能测试结果仅适用于电路开发框架。我们计划在未来发布一篇单独的文章，对不同的zkVM和IR编译器框架进行性能测试。

Ankr回应：Staking的底层资产全部安全:12月2日，Ankr官方社交媒体发文称，当前Ankr Staking的所有底层资产都是安全的，所有基础设施服务不受影响。[2022/12/2 21:17:19]

性能评测方法论

为了对这些不同的证明系统进行性能测试，我们计算了N字节数据的SHA-256哈希值，其中我们对N=64、128、...、64K进行了实验。可以在此存储库(https://github.com/celer-network/zk-benchmark)中找到性能代码和SHA-256电路配置。

此外，我们使用以下性能指标对每个系统进行了性能测试：

证明生成时间

证明生成期间的内存使用峰值

证明生成期间的平均CPU使用率百分比。

请注意，我们正在对证明大小和证明验证成本做一些“随意”的假设，因为这些方面可以通过在上链之前与Groth16或KZG组合来减轻。

机器

我们在两台不同的机器上进行了性能测试：

Linux服务器：20核@2.3GHz，384GB内存

MacbookM1Pro：10核@3.2Ghz，16GB内存

Linux服务器用于模拟CPU核数多、内存充裕的场景。而通常用于研发的MacbookM1Pro拥有更强大的CPU，但内核较少。

我们启用了可选的多线程，但我们没有在此性能测试中使用GPU加速。我们计划在未来进行GPU性能测试。

知情人士：美国司法部和监管机构已联系币安，欲了解FTX内部运作情况:11月11日消息，据一位知情人士透露，包括司法部在内的美国当局已经联系了币安，了解币安最近与FTX就潜在收购进行谈判的情况。该知情人士说，币安收到了美国金融监管机构以及欧洲监管机构的来信，要求币安高管透露他们本周了解到的FTX内部运作情况。币安的尽职调查团队很快发现，FTX与交易公司Alameda Research的关系存在利益冲突，FTX的客户资金似乎被用于商业目的。

此外，FTX US总法律顾问Ryne Miller周三指示员工保存他们在FTX、FTX US、Alameda及其附属公司工作时产生的电子邮件、信息、笔记和文件。（CoinDesk）[2022/11/11 12:47:03]

性能评测结果

约束数量

在我们继续讨论详细的性能测试结果之前，首先通过查看每个证明系统中的约束数量来了解SHA-256的复杂性是很有用的。重要的是要注意不能直接比较不同算术方案中的约束数量。

下面的结果对应64KB的原像尺寸。虽然结果可能因其他原像尺寸而异，但它们可以粗略地线性缩放。

Circom、gnark、Arkworks都使用相同的R1CS算法，计算64KBSHA-256的R1CS约束数量大致在30M到45M之间。Circom、gnark和Arkworks之间的差异可能是由于配置差异造成的。

Halo2和Plonky2都使用Plonkish算术，其中行数范围从2^22到2^23。由于使用查找表，Halo2的SHA-256实现效率比Plonky2的高得多。

Starky使用AIR算法，其中执行跟踪表需要2^16个转换步骤。

Michael Saylor：自MicroStrategy入场后BTC已增长83%，其股价上涨80%:金色财经报道，MicroStrategy首席执行官官迈克尔·塞勒（Michael Saylor）在社交媒体发文称，自从MicroStrategy于2020年8月启动购买比特币之后，该数字资产价格已增长83%，而MicroStrategy公司股价则上涨了近80%。迈克尔·塞勒还指出，相比于传统股票市场，比特币更具优势，数据显示自MicroStrategy入场后标准普尔指数仅上涨了 16%，纳斯达克 100 指数上涨了 6%，而作为比特币价值储存主要竞争对手的黄金下跌了 14%，白银下跌了 33%。[2022/7/9 2:02:23]

证明生成时间

使用Linux服务器测试了SHA-256的每个框架在各种原图像尺寸上的证明生成时间。我们可以得到以下发现：

对于SHA-256，Groth16框架生成证明的速度比Plonk框架快。这是因为SHA-256主要由位运算组成，其中线值为0或1。对于Groth16，这减少了从椭圆曲线标量乘法到椭圆曲线点加法的大部分计算。但是，连线值并不直接用于Plonk的计算，因此SHA-256中的特殊连线结构不会减少Plonk框架中所需的计算量。

在所有Groth16框架中，gnark和rapidsnark比Arkworks和snarkjs快5到10倍。这要归功于它们利用多个内核并行化生成证明的卓越能力。Gnark比rapidsnark快25%。

对于Plonk框架，当使用>=4KB的较大原像尺寸时，Plonky2的SHA-256比Halo2的慢50%。这是因为Halo2的实现主要使用查找表来加速按位运算，导致行数比Plonky2少2倍。但是，如果我们比较具有相同行数的Plonky2和Halo2，Plonky2比Halo2快50%。如果我们在Plonky2中使用查找表实现SHA-256，我们应该期望Plonky2比Halo2更快，尽管Plonky2的证明尺寸更大。

另一方面，当输入原像尺寸较小时，由于查找表的固定设置成本占大部分约束，Halo2比Plonky2慢。然而，随着原像的增加，Halo2的性能变得更具竞争力，对于高达2KB的原像大小，其证明生成时间保持不变，如图所示，其几乎呈线性扩展。

正如预期的那样，Starky的证明生成时间比任何SNARK框架都短得多(5倍-50倍)，但这是以更大的证明大小为代价的。

另外需要注意的是，即使电路大小与原像大小成线性关系，由于O(nlogn)FFT，对于SNARKs的证明生成也是呈超线性增长的。

我们还在MacbookM1Pro上进行了证明生成时间性能测试，如所示。但是，需要注意的是，由于缺乏对arm64架构的支持，rapidsnark未包含在该性能测试中。为了在arm64上使用snarkjs，我们必须使用webassembly生成见证，这比Linux服务器上使用的C++见证生成要慢。

在MacbookM1Pro上运行性能测试时还有几个额外的观察结果：

除了Starky之外，所有SNARK框架在原像尺寸变大时都会遇到内存不足(OOM)错误或使用交换内存现象。具体来说，Groth16框架在原像尺寸>=8KB时就开始使用交换内存，而gnark在原像尺寸>=64KB时出现内存不足。当原像尺寸>=32KB时，Halo2遇到了内存限制。当原像尺寸>=8KB时，Plonky2开始使用交换内存。

基于FRI的框架在MacbookM1Pro上比在Linux服务器上快大约60%，而其他框架在两台机器上面的证明时间相似。因此即使在Plonky2中没有使用查找表，它在MacbookM1Pro上实现了与Halo2几乎相同的证明时间。主要原因是MacbookM1Pro拥有更强大的CPU，但内核更少。FRI主要进行哈希运算，对CPU时钟周期比较敏感，但并行性不如KZG或Groth16。

内存使用峰值

和分别显示了在LinuxServer和MacbookM1Pro上生成证明期间的内存使用峰值。根据这些性能测试结果可以得出以下观察结果：

在所有SNARK框架中，rapidsnark是内存效率最高的。我们还看到，由于查找表的固定设置成本，当原像尺寸较小时，Halo2使用更多内存，但当原像尺寸较大时，整体消耗的内存较少。

Starky的内存效率比SNARK框架高10倍以上。部分原因是它使用了更少的行。

应该注意的是，由于使用交换内存，原像尺寸变大，因此MacbookM1Pro上的内存使用量峰值保持相对平稳。

CPU利用率

我们通过测量SHA-256在4KB原像输入的证明生成期间的平均CPU利用率来评估每个证明系统的并行化程度。下表显示了LinuxServer和MacbookM1Pro上的平均CPU利用率（括号中为每个内核的平均利用率)。

主要观察结果如下：

Gnark和rapidsnark在Linux服务器上表现出最高的CPU利用率，表明它们能够有效地使用多核且并行化生成证明。Halo2也展现了良好的并行化性能。

大多数框架在Linux服务器上的CPU利用率是在MacbookProM1的2倍，只有snarkjs例外。

尽管最初预计基于FRI的框架可能难以有效地使用多核，但它们在我们的性能测试中的表现并不比某些Groth16或KZG框架差。在具有更多内核的机器上，CPU利用率是否会有差异还有待观察。

结论及未来研究

这篇文章全面比较了SHA-256在各种zk-SNARK和zk-STARK开发框架上的性能测试结果。通过比较，我们深入了解了每种框架的效率和实用性，以期可以帮助需要为SHA-256操作生成简洁证明的开发者。我们发现Groth16框架在生成证明方面比Plonk框架更快。Plonkish算术化中的查找表在使用较大的原像尺寸时显着减少了SHA-256的约束和证明时间。此外，gnark和rapidsnark展示了利用多核以并行化运作的出色能力。另一方面，Starky的证明生成时间要短得多，但代价是证明大小要大得多。在内存效率方面，rapidsnark和Starky优于其他框架。

标签：ARK NAR PLO LON Ark Of The Universe Mercenary PLOW币 poloniex关联