主页 > token.im钱包下载 > 当谷歌大数据遇上以太坊数据集,这会是区块链+大数据的成功案例吗?

当谷歌大数据遇上以太坊数据集,这会是区块链+大数据的成功案例吗?

token.im钱包下载 2023-02-09 07:36:23

作者| 艾伦·戴、叶夫根尼·梅德韦杰夫

编译 | 王克令,寇

就像你熟悉“互联网+”一样,你一定也或多或少知道“区块链+”这个名词,甚至有的人每次说起都会挂在嘴边,百听不厌! 目前,区块链与人工智能、物联网与大数据的结合备受争议。 一方面以太币是比特币吗,区块链可以保证数据的安全可信。 人工智能和大数据可以提高链的效率,拓展区块链的落地场景; 但另一方面,视力毕竟是好的,这是一个很大的痛点。 ,即区块链技术的大规模落地实施难度大,应用场景不多。 好消息是,在区块链+大数据的方向上,继比特币数据集之后,谷歌又进行了一次不错的尝试——在BigQuery上发布了以太坊数据集! 以 CryptoKitties 为例,Google 在 BigQuery 平台上利用大数据的方法对以太坊数据集做了很好的可视化! 那么,基于以太坊的大数据思维,以太坊上执行最多的智能合约是哪一个呢? 哪个是最受欢迎的代币? 如何判断? 接下来就跟随笔者一探究竟吧!

区块链技术和加密货币在吸引越来越多的技术、金融专家和经济学家的同时,也给了他们无限的想象空间。 从根本上讲,加密货币只是区块链技术底层应用的其中一种,随着区块链技术的不断突破和发展,“区块链+”的概念也在不断深入人心。

谷歌在区块链+大数据这个备受争议的方向上做了很好的尝试!

就在今年早些时候,谷歌的大数据分析平台BigQuery提供了比特币数据集分析服务。 近日,谷歌在BigQuery平台上再次发布了以太坊数据集。

大多数人可能认为以太坊区块链是一个不可变的分布式账本。 但实际上,V神是用EVM(Ethereum Virtual Machine)来扩展功能的。 在这个虚拟机上,可以执行任何存储在区块链上的代码,这些代码就是智能合约。

在系统架构方面,与比特币类似,以太坊主要用于记录不可变交易。 本质上,两者都是联机事务处理(OLTP)数据库,都不提供联机分析处理(OLAP)功能。 以太坊数据集和比特币数据集之间存在三个主要区别:

谷歌在BigQuery平台上发布了以太坊数据集,目的是深入探索以太坊数据背后的“隐情”。

以太币、莱特币比特币区别_以太币比特币是骗局吗_以太币是比特币吗

谷歌使用GitHub上以太坊ETL项目中的源代码提取以太坊区块链中的数据并加载到BigQuery平台上,将所有以太坊历史数据存储在一个名为ethereum_blockchain的数据集中,每天都在不断更新。

谷歌云连接到以太坊

虽然以太坊上的应用程序包括可以随机访问功能的 API,例如:检查交易状态、查找钱包交易关系、检查钱包余额等。但是,在这些应用程序中,没有 API 端点可以轻松访问区块链数据,此外,没有 API 端点可以查看这些应用程序中的聚合区块链数据。

下图显示了以太坊在 2018 年上半年每日记录的交易量和平均交易费用:

在公司的业务决策中,像上图这样的可视化服务(或者说基础数据库查询)尤为重要。 例如,为了平衡资产负债表,应该优先改进以太坊架构(比如是否更新),这需要分析:资产需要多长时间才能重新平衡?

BigQuery平台具有强大的在线分析处理功能。 一般来说,它可以很好地支持上述业务决策,而不需要额外的 API 实现。

Google Cloud 构建了一个软件系统:

也可以在Kaggle上获取以太坊区块链数据集,使用BigQuery Python客户端库在Kernel中查询实时数据(注:Kernel是Kaggle上的免费浏览器编码环境)。

区块链的大数据思考

以太币比特币是骗局吗_以太币是比特币吗_以太币、莱特币比特币区别

基于以太坊数据集,我们对以下三个热点进行了查询和可视化:

分析一:最热门的智能合约事件日志?

到目前为止,以太坊区块链的主要应用实例是Token交易。

那么,如何运用大数据思维,通过查询以太坊数据集的交易和智能合约表,来确定哪个智能合约最受欢迎呢?

从交易量来看,最受欢迎的10个以太坊ERC-721合约如下:

我们可以看到最流行的ERC-721智能合约地址是:

0x06012c8cf97bead5deae237070f9587f8e7a266d,

为什么?

因为它是知名去中心化应用“CryptoKitties”游戏的主智能合约。

以太币是比特币吗_以太币、莱特币比特币区别_以太币比特币是骗局吗

此外以太币是比特币吗,借助BigQuery平台,我们还在区块链中记录了痴迷猫的出生事件。

最后,我们收集了至少有 10 个猫科动物恋物癖的账户数据,其中颜色表示主人和猫科动物恋物癖家庭被可视化。 其中,圆点的大小代表了加密猫的等级。

分析二:交易量与交易网络

以太坊上存储的 Token 种类繁多,其分布模式因类别和时间的不同而呈现出多样性。 通过查看各个Token的交易活动,我们可以筛选出某个时间段内最热门的Token吗? 例如:从交易量来看,最受欢迎的10个以太坊代币(ERC20合约)有哪些?

在BigQuery平台的查询结果中,排名第五的代币是OmiseGO($OMG),其地址为:

0xd26114cd6ee289accf82350c8d8487fedb8a0c07。

BigQuery平台按时间窗口统计Token交易量,尤其是每日$OMG Token转账金额。

下图是截至2018年8月2日在Data Studio上的数据可视化结果:

从上表我们可以看到,2017年9月13日,$OMG的接收者数量明显增加,而发送者的数量没有异常变化。 为什么会这样? 事实上,这个时间点对应的是OMG Token的第一次空投。

以太币是比特币吗_以太币比特币是骗局吗_以太币、莱特币比特币区别

由于数据由以太坊钱包地址之间的转账组成,我们可以使用有向图数据结构进行分析。

下图是同一数据子集的可视化:前 50,000 笔交易至少包括两个贸易伙伴。

节点代表以太坊上的钱包地址,彩色线条代表一对地址之间的代币转移。 线的长度与转移的 Token 数量成正比,转移的 Token 数量越大,图中的钱包越紧。

Token地址之间的转账会聚合在一个组中,以区别于其他组。

我们使用 Modularity 算法对不同组的节点进行颜色标记,并使用 Gephi 进行可视化(小编:下图不像是可爱的小金鱼)。

它看起来像小金鱼吗? ?

分析三:智能合约功能分析

正如本文开头所述:以太坊区块链上的许多智能合约都是 ERC-20。 ERC-20合约只是简单定义了智能合约可以实现的软件接口,其合约由一组与Token转账相关的函数组成。

智能合约还可以实现许多其他功能。 目前,大部分智能合约的源代码都是开源的,可以免费使用。

以太币比特币是骗局吗_以太币、莱特币比特币区别_以太币是比特币吗

即使我们没有源代码,我们也可以从函数的名称中看出其他合约可以做什么,因为相同的函数名称将共享相同的签名。

回到分析3中讨论的“Cat Obsession”游戏,这个游戏的主要元素是活泼可爱的猫,而繁殖事件中的基因混合在Obsession Cat GeneScience智能合约中

0xf97e0a5b616dffc913e72455fde9ea8bbe946a2b

假设我们要找一款类似于《猫粉碎》游戏的GeneScience智能合约机制的游戏,可以在BigQuery平台上实现,在Jaccard相似度系数中使用JavaScript UDF。

这些分析表明,GeneScience 智能合约的几个早期版本,当前地址为

0xf97e0a5b616dffc913e72455fde9ea8bbe946a2b

的智能合约版本最为相似。 但如果用数字签名来衡量,其他区块链游戏也有高度相似的合约。 例如“CryptoPuppies”的智能合约地址为:

0xb64e6bef349a0d3e8571ac80b5ec522b417faeb6。

原文链接: